返回 AIPA 笔记
AIPA Day 109

平台管理面板 + 8 维选型矩阵

平台管理面板 + 8 维选型矩阵

2026-10-01
selection-matrixplatform-comparisonagent-lab

日期: 2026-10-01 阶段: Phase 4 - 自建 Agent 平台×求职冲刺 标签: #selection-matrix #platform-comparison #agent-lab

核心问题

Day 106-108 把自建 agent 平台的三块底座补齐了:会话隔离、durable 会话、计量计费。今天做两件收口的事,把它们变成作品集求职话术

  1. 平台管理面板:把 agent 注册、会话列表、成本档位、eval 结果收进一屏——让 agent-lab 从「单装置演示」升级成「平台控制台」形状,对标托管平台的管理控制台。
  2. 8 维选型矩阵:这是 AISA(AI Solutions Architect)面试与作品集的核心交付物——「自建 vs AgentCore vs Foundry vs Agent Engine,按 8 个维度怎么选」。这道题在 agentic 系统设计八域面试里是必考,能不能讲清楚直接决定 offer。

对求职:本笔记产出的选型矩阵 + 「按现有云栈/数据所在地/合规/M365 耦合/定价 eval 成熟度排序」的决策框架,是 LangChain/Anthropic SA JD 的显式职责(eval 框架设计 + 平台选型)。这是把前 108 天的「能建」转译成「能选、能讲」的一天。

关键内容

A. agent-lab 升级为平台控制台:四区一屏

P2 的 src/components/agent-arch/AgentArchLab.tsx 现在是三 tab 装置(durable / 语义缓存 / MCP 注册)。Day 109 把它升级成平台管理面板形状——一屏四区,对标托管平台控制台的信息架构:

┌─────────────────────────────────────────────────────────┐
│  [Agent Registry]        │  [Sessions]                   │
│  · aml-copilot   v1.2 ●  │  case-0421  张三  DEGRADE 🟡  │
│  · research-sub  v0.8 ●  │  case-0419  李四  OK     🟢   │
│  · sar-narrator  v1.0 ●  │  case-0388  王五  REJECT 🔴   │
│  注册/版本/状态           │  会话隔离 + durable + 档位     │
├──────────────────────────┼───────────────────────────────┤
│  [Cost Meter]            │  [Eval Gate]                  │
│  本月 $42.18 / cap $100  │  judge κ=0.73 ✅ recall 0.91  │
│  token 占比 96% ▓▓▓░     │  FPR 0.04  hard-cases 18/20   │
│  Runtime 占比 1% ░       │  CI gate: PASS                │
└──────────────────────────┴───────────────────────────────┘

四区分别复用前期成果:Registry(Day 106 的 (tenantId, sessionId) + agentId 命名空间)、Sessions(Day 106 隔离 + Day 107 durable + Day 108 档位)、Cost Meter(Day 108 的 CostMeter.tsx + token 占比可视化,呼应「token 主导」洞察)、Eval Gate(P1 的 judge κ / recall / FPR + P3 的 SAR 质量)。一屏把 P1-P4 的全部能力串成一个「平台」叙事——这是作品集的收束点。

反直觉洞察①(控制台的信息架构本身是选型能力的证明):直觉「管理面板就是把数据列出来」。但列哪四区、怎么排恰恰暴露你对 agent 平台的理解深度——把 Registry/Sessions/Cost/Eval 并列,等于声明「agent 平台 = 身份×状态×成本×质量四个治理面」。这正是 AgentCore(Runtime/Memory/Gateway/Identity/Observability)和 Foundry(Agent/Tools/Eval/Network)的控制台抽象。面板的 IA 就是你的平台心智模型,面试官一眼看穿。

B. 8 维选型矩阵(自建 vs AgentCore vs Foundry vs Agent Engine)

核心交付物。8 个维度的选取依据是 Q2 2026 第三方对比 + AISA 选型实践,每维给真实状态/数字(2026-06 口径):

#维度自建(本项目)AWS AgentCoreMS FoundryGoogle Agent Engine
1Runtime/隔离教学装置(应用层逻辑隔离)microVM-per-session,调到 8h 会话 ⭐per-session VM sandbox(hosted preview)per-session 计费
2记忆pinnedFacts+summarizer(P2 骨架)短期+长期,episodic GAMemory 仍 previewSessions+Memory Bank GA(2025-12) ⭐
3工具网关MCP toolRegistry(P2)Gateway:API/Lambda→MCP,IAM+OAuthToolbox MCP + 私网工具Apigee 100+ 连接器→MCP ⭐
4身份/授权双键命名空间+RBAC 断言vault 存/轮换 refresh tokenEntra Agent ID(M365 原生)IAM Principal+签名 agent card
5可观测OTel GenAI(P1 day22-26)CloudWatch+OTel(无上限⚠️)App Insights+OTel,Observability GACloud Logging/Trace
6Evaljudge κ gate(P1)+ SAR 质量(P3)⭐Evaluations preview(13 评估器)Evaluations GA(2026-03) ⭐无独立 eval 框架
7合规认证自托管可控驻留HIPAA elig.(2026-02)/FedRAMP High/SOC2/PCI ⭐HIPAA BAA/FedRAMP/SOC2/驻留控制HIPAA/FedRAMP/SOC2
8定价仅底层+token(省 markup,付工程)$0.0895/vCPU-h,12 组件$0.0994/vCPU-h,scale-to-zero$0.0864/vCPU-h ⭐最低

读这张表的纪律:没有「全维最优」的平台——AgentCore 赢隔离/身份/记忆完整性/合规,Agent Engine 赢工具网关/定价/记忆 GA,Foundry 赢 eval GA/M365 耦合,自建赢 eval 定制/驻留可控/无 markup。选型是按场景给维度加权,不是找冠军。

C. AISA 选型决策顺序:5 步漏斗

8 维不是平权打分,AISA 实践有优先级顺序——按这个漏斗逐层筛,落到唯一答案:

[AISA 选型决策漏斗]

  Step 1: 现有云与身份栈?
    ├─ 已重度 AWS/IAM ────────────► AgentCore(身份零迁移)
    ├─ 已重度 Azure/Entra/M365 ──► Foundry(Entra 原生+Teams)
    └─ 已重度 GCP/BigQuery ──────► Agent Engine(IAM+数据旁)
                │(无强绑定 ↓)
  Step 2: 数据所在地? (agent 建在数据旁,少搬数据)
    ├─ 数据在 Snowflake/Databricks ► Cortex Agents/Agent Bricks(不进表 B/C 列)
    └─ 数据在对象存储/DB ──────────► 跟随 Step1 云
                │
  Step 3: 合规硬约束? (HIPAA/FedRAMP/驻留)
    ├─ 政府/FedRAMP High ────────► AgentCore GovCloud
    ├─ 医疗 HIPAA ───────────────► 三家均可,看 BAA 覆盖
    └─ 数据驻留严格 ─────────────► 自建/私有化(D 节)
                │
  Step 4: M365 耦合? ──────────► 强耦合则 Foundry(Copilot Studio 三层)
                │
  Step 5: 定价 & eval 成熟度? ──► 平局时的 tie-breaker(eval GA→Foundry)

关键:定价排在最后——呼应 Day 108「token 主导、vCPU 差异是噪声」,单价不该是首要决策因子。而现有云与身份栈排第一——因为身份迁移成本远高于任何单价差。这是反直觉但正确的排序。

每一步漏斗都是「硬约束优先于软偏好」的体现:Step 1-3(身份/数据/合规)是硬约束——违反就根本不能用(身份迁移失败、数据违规出境、合规过不了审计),它们直接剪枝掉候选;Step 4-5(M365 耦合/定价 eval)是软偏好——只在硬约束筛剩多个候选时做 tie-breaker。AISA 面试里把这个「硬约束剪枝 → 软偏好排序」的两段式讲清楚,比逐维报分数更能体现架构判断力:架构选型的本质是先用硬约束把解空间砍到很小,再在小空间里优化软指标,而不是给 8 维各打 1-5 分加权求和(那是新手做法,因为它假设所有维度可补偿,而硬约束恰恰不可补偿)。

反直觉洞察②(选型的第一性原理是「身份在哪」,不是「谁最强」):直觉会按「功能最全/最便宜」选,于是陷入逐维比分。但 AISA 实践的第一筛是**「你的身份与数据已经在哪朵云」——因为把企业的 IAM/Entra 身份体系迁到另一朵云的成本,是任何功能差或 15% 单价差的几个数量级之上。一个已全栈 Azure + M365 的银行,几乎不可能因为 AgentCore 记忆更成熟就迁去 AWS。「最适合的平台」≈「你身份和数据已经在的那个平台」**,强弱排第二。

D. 数据平台原生 + 私有化两条旁路

表 B 是「通用云托管」三家,但 2026-06 有两条不进主表的重要旁路,AISA 必须知道:

旁路 1:数据平台原生(agent 建在数据旁)。 当数据在数仓里,搬 agent 比搬数据便宜:

  • Databricks Agent Bricks(2025-06 Beta,Knowledge Assistant 2026-02 GA):Unity Catalog 治理,agent 直接在 lakehouse 上跑。
  • Snowflake Cortex Agents(GA):GPA 评估框架(Goal-Plan-Action)、多租户、Cortex AI Guardrails(2026-05-14 GA)。
  • 选它的判据:数据已在 Snowflake/Databricks 且不想出仓(合规/重力)。这是 Step 2 的分支。

旁路 2:私有化/气隙。 当数据绝不能出企业边界(主权/军政/极敏感金融):

  • Gemini on GDC(air-gapped GA,2025-08,全离线);
  • Microsoft Sovereign Private Cloud / Foundry Local + vLLM(2026-02);
  • AgentCore VPC/PrivateLink(2025-10 GA);
  • 自托管推理事实标准:vLLM / NVIDIA NIM on K8s
  • 选它的判据:驻留是法律硬约束,宁可牺牲托管便利。本项目自建路线天然落在这条——驻留完全可控是自建对托管的唯一结构性优势(功能/成本都打不过托管)。

三类路线的适用场景对照:

路线适用代价本项目相关
通用云托管(表 B 三家)数据可出仓、要快上线平台 markup + 锁定对标对象
数据平台原生数据在数仓、不出仓绑定数仓厂商AML 数据若在 Snowflake 可选
私有化/自建驻留硬约束、要定制自担工程+运维本项目路线(展示能力+驻留可控)

设计要点/决策表

要点决策理由
面板 IARegistry/Sessions/Cost/Eval 四区一屏四区=身份×状态×成本×质量四治理面
选型维度8 维,每维真实状态/数字覆盖 runtime/记忆/网关/身份/观测/eval/合规/定价
维度加权不平权,按场景加权无全维最优平台,选型=场景加权
决策顺序云身份栈→数据地→合规→M365→定价eval身份迁移成本 >> 单价差,定价排最后
旁路数据平台原生 + 私有化两条数据在数仓/驻留硬约束时主表三家不适用
自建定位驻留可控+eval 定制,非省钱诚实:功能/成本打不过托管,赢在可控与展示

对本项目的落地

  • 升级 src/components/agent-arch/AgentArchLab.tsx:现有 3 tab(durable/cache/mcp)扩成平台控制台——新增一个顶层「Platform」视图,内含 A 节四区(Registry/Sessions/Cost/Eval)。Sessions 区接 Day 106 sessionStore + Day 107 durableSession + Day 108 sessionMeter 的档位;Cost 区接 CostMeter.tsx 加 token 占比条;Eval 区接 P1 的 judge κ / P3 的 SAR 质量数字。复用现有 ACCENT 配色与响应式滚动 tab 模式,不破坏既有三装置。
  • 新建 src/components/agent-arch/SelectionMatrix.tsx:把 B 节 8 维矩阵 + C 节决策漏斗做成交互组件——8 维表格可按「我的云栈/数据地/合规」筛选高亮推荐列(实现 C 节漏斗逻辑)。数据源建 src/agent/platform/selectionMatrix.ts 常量(带 asOf: '2026-06' 与 recheck 注释,引用 Day 108 platformPricing.ts 的定价维度)。这是作品集可点击演示的选型工具,不只是静态表。
  • 诚实标注selectionMatrix.ts 头注——所有平台状态(GA/preview)、定价、合规认证为 2026-06 一手采集,平台迭代快,执行当周须按各官方页重新确认;自建列诚实标注「驻留可控/eval 定制为优势,功能完整性与单位成本不及托管」。
  • 求职话术固化:本笔记的 C 节决策漏斗 + D 节三路线,整理进面试答案集(agentic 系统设计八域之「平台选型」域)——一句话版本:「先看身份和数据在哪朵云,合规卡死就私有化,token 是大头所以单价排最后,eval 成熟度做 tie-breaker。」

参考资料

  1. AgentMarketCap — AWS Bedrock AgentCore vs Azure vs Google Vertex: Q2 2026 Managed Agent Runtime Comparison:逐维 winner——隔离/身份/记忆完整性/eval→AgentCore,工具网关→Vertex(Apigee 100+),memory GA 对比(Azure preview vs AWS episodic GA vs Google BigQuery);token 主导 10-100×(2026-04-09)
  2. AWS — AgentCore 合规:继承 Bedrock——HIPAA eligible(列入 2026-02-10)、FedRAMP High(GovCloud)、SOC 1/2/3、PCI DSS、ISO 27001;Policy/Evaluations preview(2025-12)(2026-06)
  3. Microsoft Foundry Blog — Foundry Agent Service is GA:2026-03-16 GA,Evaluations GA,BYO VNet 私网,Entra RBAC/Agent Identity;Memory 仍 preview(2026-03)
  4. Google Cloud — Gemini Enterprise Agent Platform(原 Vertex AI,2026-04 更名,控制台 2026-05-21 生效):ADK + Agent Engine,Sessions/Memory Bank GA(2025-12),A2A v1.2 签名 agent card;$0.0864/vCPU-h(2026-05~06)
  5. Databricks Agent Bricks(Knowledge Assistant GA 2026-02,Unity Catalog)/ Snowflake Cortex Agents(GA,GPA 评估,Guardrails GA 2026-05-14):数据平台原生路线 (2026)
  6. 私有化:Gemini on GDC air-gapped GA(2025-08)、Microsoft Sovereign Private Cloud / Foundry Local + vLLM(2026-02)、AgentCore VPC/PrivateLink(2025-10)、vLLM/NVIDIA NIM on K8s (2026)
  7. 本仓库 src/components/agent-arch/AgentArchLab.tsx(TABS/ACCENT/响应式模式)、src/agent/ui/CostMeter.tsxsrc/agent/shared/platformPricing.ts(Day 108) (2026-06)

SOTA 检查 (2026-06-11)

  • 三大云 + 数据平台 + 私有化的「五选一」格局在 2026-06 稳定:通用云托管(AgentCore/Foundry/Agent Engine)+ 数据平台原生(Databricks/Snowflake)+ 私有化(GDC/Sovereign/自建 vLLM)三类并存,各有明确适用场景。本日 WebSearch 未见格局性变化。
  • 「记忆 GA 状态」是 2026-06 三家的关键差异点:Agent Engine(Sessions+Memory Bank GA 2025-12)、AgentCore(episodic GA)领先,Foundry Memory 仍 preview——这是选型矩阵第 2 维的现状,执行当周须重查 Foundry Memory 是否转 GA(一旦转 GA,矩阵第 2 维需更新)。
  • eval 框架成熟度成为 SA JD 显式职责:Foundry Evaluations GA(2026-03)、AgentCore 13 评估器(preview)、Snowflake GPA——eval 框架设计是 LangChain/Anthropic SA JD 明文要求,本项目自建 judge κ gate(P1)是这块的差异化资产。
  • 过时认知警示:「Vertex AI」名称过时——2026-04 更名 Gemini Enterprise Agent Platform,控制台 2026-05-21 旧名禁用;「按谁功能最全/最便宜选平台」过时——C 节证明应按身份/数据所在地优先,定价排最后。
  • 待跟踪:(1) AgentCore Policy/Evaluations/Payments 转 GA 时间(影响第 6 维);(2) Foundry hosted agents 转 GA 时间(影响第 1 维隔离 preview 标注);(3) Open Group 的 TOGAF×agentic 标准截至 2026-06 仍空白——若出标准,选型框架应对齐,回填 C 节决策漏斗。