平台管理面板 + 8 维选型矩阵
平台管理面板 + 8 维选型矩阵
日期: 2026-10-01 阶段: Phase 4 - 自建 Agent 平台×求职冲刺 标签: #selection-matrix #platform-comparison #agent-lab
核心问题
Day 106-108 把自建 agent 平台的三块底座补齐了:会话隔离、durable 会话、计量计费。今天做两件收口的事,把它们变成作品集和求职话术:
- 平台管理面板:把 agent 注册、会话列表、成本档位、eval 结果收进一屏——让
agent-lab从「单装置演示」升级成「平台控制台」形状,对标托管平台的管理控制台。 - 8 维选型矩阵:这是 AISA(AI Solutions Architect)面试与作品集的核心交付物——「自建 vs AgentCore vs Foundry vs Agent Engine,按 8 个维度怎么选」。这道题在 agentic 系统设计八域面试里是必考,能不能讲清楚直接决定 offer。
对求职:本笔记产出的选型矩阵 + 「按现有云栈/数据所在地/合规/M365 耦合/定价 eval 成熟度排序」的决策框架,是 LangChain/Anthropic SA JD 的显式职责(eval 框架设计 + 平台选型)。这是把前 108 天的「能建」转译成「能选、能讲」的一天。
关键内容
A. agent-lab 升级为平台控制台:四区一屏
P2 的 src/components/agent-arch/AgentArchLab.tsx 现在是三 tab 装置(durable / 语义缓存 / MCP 注册)。Day 109 把它升级成平台管理面板形状——一屏四区,对标托管平台控制台的信息架构:
┌─────────────────────────────────────────────────────────┐
│ [Agent Registry] │ [Sessions] │
│ · aml-copilot v1.2 ● │ case-0421 张三 DEGRADE 🟡 │
│ · research-sub v0.8 ● │ case-0419 李四 OK 🟢 │
│ · sar-narrator v1.0 ● │ case-0388 王五 REJECT 🔴 │
│ 注册/版本/状态 │ 会话隔离 + durable + 档位 │
├──────────────────────────┼───────────────────────────────┤
│ [Cost Meter] │ [Eval Gate] │
│ 本月 $42.18 / cap $100 │ judge κ=0.73 ✅ recall 0.91 │
│ token 占比 96% ▓▓▓░ │ FPR 0.04 hard-cases 18/20 │
│ Runtime 占比 1% ░ │ CI gate: PASS │
└──────────────────────────┴───────────────────────────────┘
四区分别复用前期成果:Registry(Day 106 的 (tenantId, sessionId) + agentId 命名空间)、Sessions(Day 106 隔离 + Day 107 durable + Day 108 档位)、Cost Meter(Day 108 的 CostMeter.tsx + token 占比可视化,呼应「token 主导」洞察)、Eval Gate(P1 的 judge κ / recall / FPR + P3 的 SAR 质量)。一屏把 P1-P4 的全部能力串成一个「平台」叙事——这是作品集的收束点。
反直觉洞察①(控制台的信息架构本身是选型能力的证明):直觉「管理面板就是把数据列出来」。但列哪四区、怎么排恰恰暴露你对 agent 平台的理解深度——把 Registry/Sessions/Cost/Eval 并列,等于声明「agent 平台 = 身份×状态×成本×质量四个治理面」。这正是 AgentCore(Runtime/Memory/Gateway/Identity/Observability)和 Foundry(Agent/Tools/Eval/Network)的控制台抽象。面板的 IA 就是你的平台心智模型,面试官一眼看穿。
B. 8 维选型矩阵(自建 vs AgentCore vs Foundry vs Agent Engine)
核心交付物。8 个维度的选取依据是 Q2 2026 第三方对比 + AISA 选型实践,每维给真实状态/数字(2026-06 口径):
| # | 维度 | 自建(本项目) | AWS AgentCore | MS Foundry | Google Agent Engine |
|---|---|---|---|---|---|
| 1 | Runtime/隔离 | 教学装置(应用层逻辑隔离) | microVM-per-session,调到 8h 会话 ⭐ | per-session VM sandbox(hosted preview) | per-session 计费 |
| 2 | 记忆 | pinnedFacts+summarizer(P2 骨架) | 短期+长期,episodic GA ⭐ | Memory 仍 preview | Sessions+Memory Bank GA(2025-12) ⭐ |
| 3 | 工具网关 | MCP toolRegistry(P2) | Gateway:API/Lambda→MCP,IAM+OAuth | Toolbox MCP + 私网工具 | Apigee 100+ 连接器→MCP ⭐ |
| 4 | 身份/授权 | 双键命名空间+RBAC 断言 | vault 存/轮换 refresh token ⭐ | Entra Agent ID(M365 原生) | IAM Principal+签名 agent card |
| 5 | 可观测 | OTel GenAI(P1 day22-26) | CloudWatch+OTel(无上限⚠️) | App Insights+OTel,Observability GA | Cloud Logging/Trace |
| 6 | Eval | judge κ gate(P1)+ SAR 质量(P3)⭐ | Evaluations preview(13 评估器) | Evaluations GA(2026-03) ⭐ | 无独立 eval 框架 |
| 7 | 合规认证 | 自托管可控驻留 | HIPAA elig.(2026-02)/FedRAMP High/SOC2/PCI ⭐ | HIPAA BAA/FedRAMP/SOC2/驻留控制 | HIPAA/FedRAMP/SOC2 |
| 8 | 定价 | 仅底层+token(省 markup,付工程) | $0.0895/vCPU-h,12 组件 | $0.0994/vCPU-h,scale-to-zero | $0.0864/vCPU-h ⭐最低 |
读这张表的纪律:没有「全维最优」的平台——AgentCore 赢隔离/身份/记忆完整性/合规,Agent Engine 赢工具网关/定价/记忆 GA,Foundry 赢 eval GA/M365 耦合,自建赢 eval 定制/驻留可控/无 markup。选型是按场景给维度加权,不是找冠军。
C. AISA 选型决策顺序:5 步漏斗
8 维不是平权打分,AISA 实践有优先级顺序——按这个漏斗逐层筛,落到唯一答案:
[AISA 选型决策漏斗]
Step 1: 现有云与身份栈?
├─ 已重度 AWS/IAM ────────────► AgentCore(身份零迁移)
├─ 已重度 Azure/Entra/M365 ──► Foundry(Entra 原生+Teams)
└─ 已重度 GCP/BigQuery ──────► Agent Engine(IAM+数据旁)
│(无强绑定 ↓)
Step 2: 数据所在地? (agent 建在数据旁,少搬数据)
├─ 数据在 Snowflake/Databricks ► Cortex Agents/Agent Bricks(不进表 B/C 列)
└─ 数据在对象存储/DB ──────────► 跟随 Step1 云
│
Step 3: 合规硬约束? (HIPAA/FedRAMP/驻留)
├─ 政府/FedRAMP High ────────► AgentCore GovCloud
├─ 医疗 HIPAA ───────────────► 三家均可,看 BAA 覆盖
└─ 数据驻留严格 ─────────────► 自建/私有化(D 节)
│
Step 4: M365 耦合? ──────────► 强耦合则 Foundry(Copilot Studio 三层)
│
Step 5: 定价 & eval 成熟度? ──► 平局时的 tie-breaker(eval GA→Foundry)
关键:定价排在最后——呼应 Day 108「token 主导、vCPU 差异是噪声」,单价不该是首要决策因子。而现有云与身份栈排第一——因为身份迁移成本远高于任何单价差。这是反直觉但正确的排序。
每一步漏斗都是「硬约束优先于软偏好」的体现:Step 1-3(身份/数据/合规)是硬约束——违反就根本不能用(身份迁移失败、数据违规出境、合规过不了审计),它们直接剪枝掉候选;Step 4-5(M365 耦合/定价 eval)是软偏好——只在硬约束筛剩多个候选时做 tie-breaker。AISA 面试里把这个「硬约束剪枝 → 软偏好排序」的两段式讲清楚,比逐维报分数更能体现架构判断力:架构选型的本质是先用硬约束把解空间砍到很小,再在小空间里优化软指标,而不是给 8 维各打 1-5 分加权求和(那是新手做法,因为它假设所有维度可补偿,而硬约束恰恰不可补偿)。
反直觉洞察②(选型的第一性原理是「身份在哪」,不是「谁最强」):直觉会按「功能最全/最便宜」选,于是陷入逐维比分。但 AISA 实践的第一筛是**「你的身份与数据已经在哪朵云」——因为把企业的 IAM/Entra 身份体系迁到另一朵云的成本,是任何功能差或 15% 单价差的几个数量级之上。一个已全栈 Azure + M365 的银行,几乎不可能因为 AgentCore 记忆更成熟就迁去 AWS。「最适合的平台」≈「你身份和数据已经在的那个平台」**,强弱排第二。
D. 数据平台原生 + 私有化两条旁路
表 B 是「通用云托管」三家,但 2026-06 有两条不进主表的重要旁路,AISA 必须知道:
旁路 1:数据平台原生(agent 建在数据旁)。 当数据在数仓里,搬 agent 比搬数据便宜:
- Databricks Agent Bricks(2025-06 Beta,Knowledge Assistant 2026-02 GA):Unity Catalog 治理,agent 直接在 lakehouse 上跑。
- Snowflake Cortex Agents(GA):GPA 评估框架(Goal-Plan-Action)、多租户、Cortex AI Guardrails(2026-05-14 GA)。
- 选它的判据:数据已在 Snowflake/Databricks 且不想出仓(合规/重力)。这是 Step 2 的分支。
旁路 2:私有化/气隙。 当数据绝不能出企业边界(主权/军政/极敏感金融):
- Gemini on GDC(air-gapped GA,2025-08,全离线);
- Microsoft Sovereign Private Cloud / Foundry Local + vLLM(2026-02);
- AgentCore VPC/PrivateLink(2025-10 GA);
- 自托管推理事实标准:vLLM / NVIDIA NIM on K8s。
- 选它的判据:驻留是法律硬约束,宁可牺牲托管便利。本项目自建路线天然落在这条——驻留完全可控是自建对托管的唯一结构性优势(功能/成本都打不过托管)。
三类路线的适用场景对照:
| 路线 | 适用 | 代价 | 本项目相关 |
|---|---|---|---|
| 通用云托管(表 B 三家) | 数据可出仓、要快上线 | 平台 markup + 锁定 | 对标对象 |
| 数据平台原生 | 数据在数仓、不出仓 | 绑定数仓厂商 | AML 数据若在 Snowflake 可选 |
| 私有化/自建 | 驻留硬约束、要定制 | 自担工程+运维 | 本项目路线(展示能力+驻留可控) |
设计要点/决策表
| 要点 | 决策 | 理由 |
|---|---|---|
| 面板 IA | Registry/Sessions/Cost/Eval 四区一屏 | 四区=身份×状态×成本×质量四治理面 |
| 选型维度 | 8 维,每维真实状态/数字 | 覆盖 runtime/记忆/网关/身份/观测/eval/合规/定价 |
| 维度加权 | 不平权,按场景加权 | 无全维最优平台,选型=场景加权 |
| 决策顺序 | 云身份栈→数据地→合规→M365→定价eval | 身份迁移成本 >> 单价差,定价排最后 |
| 旁路 | 数据平台原生 + 私有化两条 | 数据在数仓/驻留硬约束时主表三家不适用 |
| 自建定位 | 驻留可控+eval 定制,非省钱 | 诚实:功能/成本打不过托管,赢在可控与展示 |
对本项目的落地
- 升级
src/components/agent-arch/AgentArchLab.tsx:现有 3 tab(durable/cache/mcp)扩成平台控制台——新增一个顶层「Platform」视图,内含 A 节四区(Registry/Sessions/Cost/Eval)。Sessions 区接 Day 106sessionStore+ Day 107durableSession+ Day 108sessionMeter的档位;Cost 区接CostMeter.tsx加 token 占比条;Eval 区接 P1 的 judge κ / P3 的 SAR 质量数字。复用现有ACCENT配色与响应式滚动 tab 模式,不破坏既有三装置。 - 新建
src/components/agent-arch/SelectionMatrix.tsx:把 B 节 8 维矩阵 + C 节决策漏斗做成交互组件——8 维表格可按「我的云栈/数据地/合规」筛选高亮推荐列(实现 C 节漏斗逻辑)。数据源建src/agent/platform/selectionMatrix.ts常量(带asOf: '2026-06'与 recheck 注释,引用 Day 108platformPricing.ts的定价维度)。这是作品集可点击演示的选型工具,不只是静态表。 - 诚实标注:
selectionMatrix.ts头注——所有平台状态(GA/preview)、定价、合规认证为 2026-06 一手采集,平台迭代快,执行当周须按各官方页重新确认;自建列诚实标注「驻留可控/eval 定制为优势,功能完整性与单位成本不及托管」。 - 求职话术固化:本笔记的 C 节决策漏斗 + D 节三路线,整理进面试答案集(agentic 系统设计八域之「平台选型」域)——一句话版本:「先看身份和数据在哪朵云,合规卡死就私有化,token 是大头所以单价排最后,eval 成熟度做 tie-breaker。」
参考资料
- AgentMarketCap — AWS Bedrock AgentCore vs Azure vs Google Vertex: Q2 2026 Managed Agent Runtime Comparison:逐维 winner——隔离/身份/记忆完整性/eval→AgentCore,工具网关→Vertex(Apigee 100+),memory GA 对比(Azure preview vs AWS episodic GA vs Google BigQuery);token 主导 10-100×(2026-04-09)
- AWS — AgentCore 合规:继承 Bedrock——HIPAA eligible(列入 2026-02-10)、FedRAMP High(GovCloud)、SOC 1/2/3、PCI DSS、ISO 27001;Policy/Evaluations preview(2025-12)(2026-06)
- Microsoft Foundry Blog — Foundry Agent Service is GA:2026-03-16 GA,Evaluations GA,BYO VNet 私网,Entra RBAC/Agent Identity;Memory 仍 preview(2026-03)
- Google Cloud — Gemini Enterprise Agent Platform(原 Vertex AI,2026-04 更名,控制台 2026-05-21 生效):ADK + Agent Engine,Sessions/Memory Bank GA(2025-12),A2A v1.2 签名 agent card;$0.0864/vCPU-h(2026-05~06)
- Databricks Agent Bricks(Knowledge Assistant GA 2026-02,Unity Catalog)/ Snowflake Cortex Agents(GA,GPA 评估,Guardrails GA 2026-05-14):数据平台原生路线 (2026)
- 私有化:Gemini on GDC air-gapped GA(2025-08)、Microsoft Sovereign Private Cloud / Foundry Local + vLLM(2026-02)、AgentCore VPC/PrivateLink(2025-10)、vLLM/NVIDIA NIM on K8s (2026)
- 本仓库
src/components/agent-arch/AgentArchLab.tsx(TABS/ACCENT/响应式模式)、src/agent/ui/CostMeter.tsx、src/agent/shared/platformPricing.ts(Day 108) (2026-06)
SOTA 检查 (2026-06-11)
- 三大云 + 数据平台 + 私有化的「五选一」格局在 2026-06 稳定:通用云托管(AgentCore/Foundry/Agent Engine)+ 数据平台原生(Databricks/Snowflake)+ 私有化(GDC/Sovereign/自建 vLLM)三类并存,各有明确适用场景。本日 WebSearch 未见格局性变化。
- 「记忆 GA 状态」是 2026-06 三家的关键差异点:Agent Engine(Sessions+Memory Bank GA 2025-12)、AgentCore(episodic GA)领先,Foundry Memory 仍 preview——这是选型矩阵第 2 维的现状,执行当周须重查 Foundry Memory 是否转 GA(一旦转 GA,矩阵第 2 维需更新)。
- eval 框架成熟度成为 SA JD 显式职责:Foundry Evaluations GA(2026-03)、AgentCore 13 评估器(preview)、Snowflake GPA——eval 框架设计是 LangChain/Anthropic SA JD 明文要求,本项目自建 judge κ gate(P1)是这块的差异化资产。
- 过时认知警示:「Vertex AI」名称过时——2026-04 更名 Gemini Enterprise Agent Platform,控制台 2026-05-21 旧名禁用;「按谁功能最全/最便宜选平台」过时——C 节证明应按身份/数据所在地优先,定价排最后。
- 待跟踪:(1) AgentCore Policy/Evaluations/Payments 转 GA 时间(影响第 6 维);(2) Foundry hosted agents 转 GA 时间(影响第 1 维隔离 preview 标注);(3) Open Group 的 TOGAF×agentic 标准截至 2026-06 仍空白——若出标准,选型框架应对齐,回填 C 节决策漏斗。