AIPA Day 109

平台管理面板 + 8 维选型矩阵

2026-10-01

selection-matrixplatform-comparisonagent-lab

日期: 2026-10-01 阶段: Phase 4 - 自建 Agent 平台×求职冲刺标签: #selection-matrix #platform-comparison #agent-lab

核心问题

Day 106-108 把自建 agent 平台的三块底座补齐了：会话隔离、durable 会话、计量计费。今天做两件收口的事，把它们变成作品集和求职话术：

平台管理面板：把 agent 注册、会话列表、成本档位、eval 结果收进一屏——让 agent-lab 从「单装置演示」升级成「平台控制台」形状，对标托管平台的管理控制台。
8 维选型矩阵：这是 AISA（AI Solutions Architect）面试与作品集的核心交付物——「自建 vs AgentCore vs Foundry vs Agent Engine，按 8 个维度怎么选」。这道题在 agentic 系统设计八域面试里是必考，能不能讲清楚直接决定 offer。

对求职：本笔记产出的选型矩阵 + 「按现有云栈/数据所在地/合规/M365 耦合/定价 eval 成熟度排序」的决策框架，是 LangChain/Anthropic SA JD 的显式职责（eval 框架设计 + 平台选型）。这是把前 108 天的「能建」转译成「能选、能讲」的一天。

关键内容

A. agent-lab 升级为平台控制台：四区一屏

P2 的 src/components/agent-arch/AgentArchLab.tsx 现在是三 tab 装置（durable / 语义缓存 / MCP 注册）。Day 109 把它升级成平台管理面板形状——一屏四区，对标托管平台控制台的信息架构：

┌─────────────────────────────────────────────────────────┐
│  [Agent Registry]        │  [Sessions]                   │
│  · aml-copilot   v1.2 ●  │  case-0421  张三  DEGRADE 🟡  │
│  · research-sub  v0.8 ●  │  case-0419  李四  OK     🟢   │
│  · sar-narrator  v1.0 ●  │  case-0388  王五  REJECT 🔴   │
│  注册/版本/状态           │  会话隔离 + durable + 档位     │
├──────────────────────────┼───────────────────────────────┤
│  [Cost Meter]            │  [Eval Gate]                  │
│  本月 $42.18 / cap $100  │  judge κ=0.73 ✅ recall 0.91  │
│  token 占比 96% ▓▓▓░     │  FPR 0.04  hard-cases 18/20   │
│  Runtime 占比 1% ░       │  CI gate: PASS                │
└──────────────────────────┴───────────────────────────────┘

四区分别复用前期成果：Registry（Day 106 的 (tenantId, sessionId) + agentId 命名空间）、Sessions（Day 106 隔离 + Day 107 durable + Day 108 档位）、Cost Meter（Day 108 的 CostMeter.tsx + token 占比可视化，呼应「token 主导」洞察）、Eval Gate（P1 的 judge κ / recall / FPR + P3 的 SAR 质量）。一屏把 P1-P4 的全部能力串成一个「平台」叙事——这是作品集的收束点。

反直觉洞察①（控制台的信息架构本身是选型能力的证明）：直觉「管理面板就是把数据列出来」。但列哪四区、怎么排恰恰暴露你对 agent 平台的理解深度——把 Registry/Sessions/Cost/Eval 并列，等于声明「agent 平台 = 身份×状态×成本×质量四个治理面」。这正是 AgentCore（Runtime/Memory/Gateway/Identity/Observability）和 Foundry（Agent/Tools/Eval/Network）的控制台抽象。面板的 IA 就是你的平台心智模型，面试官一眼看穿。

B. 8 维选型矩阵（自建 vs AgentCore vs Foundry vs Agent Engine）

核心交付物。8 个维度的选取依据是 Q2 2026 第三方对比 + AISA 选型实践，每维给真实状态/数字（2026-06 口径）：

#	维度	自建（本项目）	AWS AgentCore	MS Foundry	Google Agent Engine
1	Runtime/隔离	教学装置（应用层逻辑隔离）	microVM-per-session，调到 8h 会话 ⭐	per-session VM sandbox（hosted preview）	per-session 计费
2	记忆	pinnedFacts+summarizer（P2 骨架）	短期+长期，episodic GA ⭐	Memory 仍 preview	Sessions+Memory Bank GA(2025-12) ⭐
3	工具网关	MCP toolRegistry（P2）	Gateway：API/Lambda→MCP，IAM+OAuth	Toolbox MCP + 私网工具	Apigee 100+ 连接器→MCP ⭐
4	身份/授权	双键命名空间+RBAC 断言	vault 存/轮换 refresh token ⭐	Entra Agent ID（M365 原生）	IAM Principal+签名 agent card
5	可观测	OTel GenAI（P1 day22-26）	CloudWatch+OTel（无上限⚠️）	App Insights+OTel，Observability GA	Cloud Logging/Trace
6	Eval	judge κ gate（P1）+ SAR 质量（P3）⭐	Evaluations preview（13 评估器）	Evaluations GA(2026-03) ⭐	无独立 eval 框架
7	合规认证	自托管可控驻留	HIPAA elig.(2026-02)/FedRAMP High/SOC2/PCI ⭐	HIPAA BAA/FedRAMP/SOC2/驻留控制	HIPAA/FedRAMP/SOC2
8	定价	仅底层+token（省 markup，付工程）	$0.0895/vCPU-h，12 组件	$0.0994/vCPU-h，scale-to-zero	$0.0864/vCPU-h ⭐最低

读这张表的纪律：没有「全维最优」的平台——AgentCore 赢隔离/身份/记忆完整性/合规，Agent Engine 赢工具网关/定价/记忆 GA，Foundry 赢 eval GA/M365 耦合，自建赢 eval 定制/驻留可控/无 markup。选型是按场景给维度加权，不是找冠军。

C. AISA 选型决策顺序：5 步漏斗

8 维不是平权打分，AISA 实践有优先级顺序——按这个漏斗逐层筛，落到唯一答案：

[AISA 选型决策漏斗]

  Step 1: 现有云与身份栈?
    ├─ 已重度 AWS/IAM ────────────► AgentCore（身份零迁移）
    ├─ 已重度 Azure/Entra/M365 ──► Foundry（Entra 原生+Teams）
    └─ 已重度 GCP/BigQuery ──────► Agent Engine（IAM+数据旁）
                │（无强绑定 ↓）
  Step 2: 数据所在地? （agent 建在数据旁，少搬数据）
    ├─ 数据在 Snowflake/Databricks ► Cortex Agents/Agent Bricks（不进表 B/C 列）
    └─ 数据在对象存储/DB ──────────► 跟随 Step1 云
                │
  Step 3: 合规硬约束? （HIPAA/FedRAMP/驻留）
    ├─ 政府/FedRAMP High ────────► AgentCore GovCloud
    ├─ 医疗 HIPAA ───────────────► 三家均可，看 BAA 覆盖
    └─ 数据驻留严格 ─────────────► 自建/私有化（D 节）
                │
  Step 4: M365 耦合? ──────────► 强耦合则 Foundry（Copilot Studio 三层）
                │
  Step 5: 定价 & eval 成熟度? ──► 平局时的 tie-breaker（eval GA→Foundry）

关键：定价排在最后——呼应 Day 108「token 主导、vCPU 差异是噪声」，单价不该是首要决策因子。而现有云与身份栈排第一——因为身份迁移成本远高于任何单价差。这是反直觉但正确的排序。

每一步漏斗都是「硬约束优先于软偏好」的体现：Step 1-3（身份/数据/合规）是硬约束——违反就根本不能用（身份迁移失败、数据违规出境、合规过不了审计），它们直接剪枝掉候选；Step 4-5（M365 耦合/定价 eval）是软偏好——只在硬约束筛剩多个候选时做 tie-breaker。AISA 面试里把这个「硬约束剪枝 → 软偏好排序」的两段式讲清楚，比逐维报分数更能体现架构判断力：架构选型的本质是先用硬约束把解空间砍到很小，再在小空间里优化软指标，而不是给 8 维各打 1-5 分加权求和（那是新手做法，因为它假设所有维度可补偿，而硬约束恰恰不可补偿）。

反直觉洞察②（选型的第一性原理是「身份在哪」，不是「谁最强」）：直觉会按「功能最全/最便宜」选，于是陷入逐维比分。但 AISA 实践的第一筛是**「你的身份与数据已经在哪朵云」——因为把企业的 IAM/Entra 身份体系迁到另一朵云的成本，是任何功能差或 15% 单价差的几个数量级之上。一个已全栈 Azure + M365 的银行，几乎不可能因为 AgentCore 记忆更成熟就迁去 AWS。「最适合的平台」≈「你身份和数据已经在的那个平台」**，强弱排第二。

D. 数据平台原生 + 私有化两条旁路

表 B 是「通用云托管」三家，但 2026-06 有两条不进主表的重要旁路，AISA 必须知道：

旁路 1：数据平台原生（agent 建在数据旁）。 当数据在数仓里，搬 agent 比搬数据便宜：

Databricks Agent Bricks（2025-06 Beta，Knowledge Assistant 2026-02 GA）：Unity Catalog 治理，agent 直接在 lakehouse 上跑。
Snowflake Cortex Agents（GA）：GPA 评估框架（Goal-Plan-Action）、多租户、Cortex AI Guardrails（2026-05-14 GA）。
选它的判据：数据已在 Snowflake/Databricks 且不想出仓（合规/重力）。这是 Step 2 的分支。

旁路 2：私有化/气隙。 当数据绝不能出企业边界（主权/军政/极敏感金融）：

Gemini on GDC（air-gapped GA，2025-08，全离线）；
Microsoft Sovereign Private Cloud / Foundry Local + vLLM（2026-02）；
AgentCore VPC/PrivateLink（2025-10 GA）；
自托管推理事实标准：vLLM / NVIDIA NIM on K8s。
选它的判据：驻留是法律硬约束，宁可牺牲托管便利。本项目自建路线天然落在这条——驻留完全可控是自建对托管的唯一结构性优势（功能/成本都打不过托管）。

三类路线的适用场景对照：

路线	适用	代价	本项目相关
通用云托管（表 B 三家）	数据可出仓、要快上线	平台 markup + 锁定	对标对象
数据平台原生	数据在数仓、不出仓	绑定数仓厂商	AML 数据若在 Snowflake 可选
私有化/自建	驻留硬约束、要定制	自担工程+运维	本项目路线（展示能力+驻留可控）

设计要点/决策表

要点	决策	理由
面板 IA	Registry/Sessions/Cost/Eval 四区一屏	四区=身份×状态×成本×质量四治理面
选型维度	8 维，每维真实状态/数字	覆盖 runtime/记忆/网关/身份/观测/eval/合规/定价
维度加权	不平权，按场景加权	无全维最优平台，选型=场景加权
决策顺序	云身份栈→数据地→合规→M365→定价eval	身份迁移成本 >> 单价差，定价排最后
旁路	数据平台原生 + 私有化两条	数据在数仓/驻留硬约束时主表三家不适用
自建定位	驻留可控+eval 定制，非省钱	诚实：功能/成本打不过托管，赢在可控与展示

对本项目的落地

升级 src/components/agent-arch/AgentArchLab.tsx：现有 3 tab（durable/cache/mcp）扩成平台控制台——新增一个顶层「Platform」视图，内含 A 节四区（Registry/Sessions/Cost/Eval）。Sessions 区接 Day 106 sessionStore + Day 107 durableSession + Day 108 sessionMeter 的档位；Cost 区接 CostMeter.tsx 加 token 占比条；Eval 区接 P1 的 judge κ / P3 的 SAR 质量数字。复用现有 ACCENT 配色与响应式滚动 tab 模式，不破坏既有三装置。
新建 src/components/agent-arch/SelectionMatrix.tsx：把 B 节 8 维矩阵 + C 节决策漏斗做成交互组件——8 维表格可按「我的云栈/数据地/合规」筛选高亮推荐列（实现 C 节漏斗逻辑）。数据源建 src/agent/platform/selectionMatrix.ts 常量（带 asOf: '2026-06' 与 recheck 注释，引用 Day 108 platformPricing.ts 的定价维度）。这是作品集可点击演示的选型工具，不只是静态表。
诚实标注：selectionMatrix.ts 头注——所有平台状态（GA/preview）、定价、合规认证为 2026-06 一手采集，平台迭代快，执行当周须按各官方页重新确认；自建列诚实标注「驻留可控/eval 定制为优势，功能完整性与单位成本不及托管」。
求职话术固化：本笔记的 C 节决策漏斗 + D 节三路线，整理进面试答案集（agentic 系统设计八域之「平台选型」域）——一句话版本：「先看身份和数据在哪朵云，合规卡死就私有化，token 是大头所以单价排最后，eval 成熟度做 tie-breaker。」

参考资料

AgentMarketCap — AWS Bedrock AgentCore vs Azure vs Google Vertex: Q2 2026 Managed Agent Runtime Comparison：逐维 winner——隔离/身份/记忆完整性/eval→AgentCore，工具网关→Vertex（Apigee 100+），memory GA 对比（Azure preview vs AWS episodic GA vs Google BigQuery）；token 主导 10-100×（2026-04-09）
AWS — AgentCore 合规：继承 Bedrock——HIPAA eligible（列入 2026-02-10）、FedRAMP High（GovCloud）、SOC 1/2/3、PCI DSS、ISO 27001；Policy/Evaluations preview（2025-12）(2026-06)
Microsoft Foundry Blog — Foundry Agent Service is GA：2026-03-16 GA，Evaluations GA，BYO VNet 私网，Entra RBAC/Agent Identity；Memory 仍 preview（2026-03）
Google Cloud — Gemini Enterprise Agent Platform（原 Vertex AI，2026-04 更名，控制台 2026-05-21 生效）：ADK + Agent Engine，Sessions/Memory Bank GA(2025-12)，A2A v1.2 签名 agent card；$0.0864/vCPU-h（2026-05~06）
Databricks Agent Bricks（Knowledge Assistant GA 2026-02，Unity Catalog）/ Snowflake Cortex Agents（GA，GPA 评估，Guardrails GA 2026-05-14）：数据平台原生路线 (2026)
私有化：Gemini on GDC air-gapped GA(2025-08)、Microsoft Sovereign Private Cloud / Foundry Local + vLLM(2026-02)、AgentCore VPC/PrivateLink(2025-10)、vLLM/NVIDIA NIM on K8s (2026)
本仓库 src/components/agent-arch/AgentArchLab.tsx（TABS/ACCENT/响应式模式）、src/agent/ui/CostMeter.tsx、src/agent/shared/platformPricing.ts(Day 108) (2026-06)

SOTA 检查 (2026-06-11)

三大云 + 数据平台 + 私有化的「五选一」格局在 2026-06 稳定：通用云托管（AgentCore/Foundry/Agent Engine）+ 数据平台原生（Databricks/Snowflake）+ 私有化（GDC/Sovereign/自建 vLLM）三类并存，各有明确适用场景。本日 WebSearch 未见格局性变化。
「记忆 GA 状态」是 2026-06 三家的关键差异点：Agent Engine（Sessions+Memory Bank GA 2025-12）、AgentCore（episodic GA）领先，Foundry Memory 仍 preview——这是选型矩阵第 2 维的现状，执行当周须重查 Foundry Memory 是否转 GA（一旦转 GA，矩阵第 2 维需更新）。
eval 框架成熟度成为 SA JD 显式职责：Foundry Evaluations GA(2026-03)、AgentCore 13 评估器（preview）、Snowflake GPA——eval 框架设计是 LangChain/Anthropic SA JD 明文要求，本项目自建 judge κ gate（P1）是这块的差异化资产。
过时认知警示：「Vertex AI」名称过时——2026-04 更名 Gemini Enterprise Agent Platform，控制台 2026-05-21 旧名禁用；「按谁功能最全/最便宜选平台」过时——C 节证明应按身份/数据所在地优先，定价排最后。
待跟踪：(1) AgentCore Policy/Evaluations/Payments 转 GA 时间（影响第 6 维）；(2) Foundry hosted agents 转 GA 时间（影响第 1 维隔离 preview 标注）；(3) Open Group 的 TOGAF×agentic 标准截至 2026-06 仍空白——若出标准，选型框架应对齐，回填 C 节决策漏斗。