AIPA-120 知识图谱总图
本图是「学习内容 → 作品产出 → 能力证据」三层的索引,不是计划复述。三个状态标记贯穿全文:
AIPA-120 知识图谱总图
日期:2026-10-12 AIPA-120(AI产品×架构 120天融合计划)收官交付物 · 知识图谱总图 · AI Solutions Architect 主轴 定位:把 4 阶段 × 98+ 篇笔记 + 8 篇长文 + 3 大作品 + 合规蓝图织成一张可导航、带交叉引用的能力地图,对照计划「能力验证标准」逐条标注覆盖证据,并交代与已完成 5 大计划的衔接。 配套文件:计划
docs/AIPA_120_PLAN.md· 进度docs/daily/AIPA_PROGRESS.md· 笔记目录docs/aipa/dayN-*.md(站点路由/learn/aipa)· 长文/papers/AIPA_LONGFORM_*
0. 阅读说明与诚实状态标注
本图是「学习内容 → 作品产出 → 能力证据」三层的索引,不是计划复述。三个状态标记贯穿全文:
| 标记 | 含义 |
|---|---|
| ✅ shipped | 笔记/代码/长文已落仓库并提交,可链接、可运行 |
| 🚧 prototype | 已有可运行原型,但未到「作品集级包装」(缺 C4/ADR/成本模型/演示视频之一) |
| ⬜ planned | 计划已排期、知识依赖已就位但构建尚未执行(编制时本图已无此状态项——P4 主体已 shipped,剩余均为 🚧 收尾件) |
诚实状态(截至本图编制 2026-10-12 收官):四阶段主体已 ✅ shipped——P1–P3 的 D1–D98 笔记、长文#1–#5、AML Copilot(原型→深化逻辑层)、eval 套件、OTel 映射层、agent-arch-lab 三装置;P4 的长文#6–#8(dated 2026-10-04/07/08)与平台化关键节点笔记(day99/103/106/110/113/117 等)。P4 的部分逐日笔记仍在按 D110 构建截止 → D111 起只写不建的节奏收尾合龙,故个别 day99–120 节点链接以「关键节点已落、逐日补全收尾中」呈现,凡未最终合龙处以 🚧 标注,不冒充全绿。这一诚实标注本身符合计划「反 KPI:不做无作品落点的学习」与「诚实标注教学边界」纪律。
A. 全景结构:4 阶段 × 主题 × 笔记(文字版图谱)
节点 = 笔记,dayN 链接到 docs/aipa/dayN-*.md。每阶段先给「主题骨架」,再给「逐日节点表」。
AIPA-120
├── P1 产品定义×评测×可观测底座 (D1-28, W1-4) ✅
│ ├── W1 产品发现+PRD+原型 ──────── AML Copilot 产品定义 (作品②种子)
│ ├── W2 数据与错误分析 ─────────── failure taxonomy + golden set (评测地基)
│ ├── W3 三类 evals 落地 ────────── 代码型/LLM-judge/人工抽检 + 阻断式 CI gate
│ └── W4 可观测性 ───────────────── OTel 映射层 + Langfuse + 失败归因面板 + 长文#1
├── P2 AI-native 参考架构 (D29-63, W5-9) ✅ (作品①骨架)
│ ├── W5 编排范式 ───────────────── orchestrator-worker + ADR#1(不上多 agent)
│ ├── W6 durable execution ─────── checkpoint/HITL 持久化/time-travel + context 增量
│ ├── W7 AI gateway ─────────────── LiteLLM 自托管 + 语义缓存 + Pareto + MCP 规范精读
│ ├── W8 MCP server + 安全 ──────── 无状态 MCP server + MCPTox 红队 + 风控网关 + 长文#2
│ └── W9 框架对比 + memory 评审 ─── 四框架 trade-off 矩阵 + 长文#3
├── P3 AML 调查 Copilot (D64-98, W10-14) ✅ (作品②旗舰)
│ ├── W10 证据汇集×类型学比对 ───── RRF 多源检索 + 规则引擎 v2 + 金标≥100
│ ├── W11 SAR LLM 化×审计轨迹 ───── SAR 草稿生成 + 不可篡改 trail + 每日 evals 防退化
│ ├── W12 HITL 界面×Agent UX ────── plan-and-execute/置信度/渐进授权/错误恢复
│ ├── W13 SAR eval×红队×v1.0 ────── SAR 质量 suite + 对抗红队 + 单位成本 + 长文#4
│ └── W14 合规即架构蓝图 ────────── AI Act×DORA×SR11-7×NIST×ISO42001 + 长文#5 + AI PRD
└── P4 自建 Agent 平台×求职冲刺 (D99-120, W15-17) ✅ 主体 shipped / 🚧 收口件 (作品③+变现)
├── W15 自建工具网关+策略引擎 ─── 注册/鉴权/审计 + 事中拦截 (↔AgentCore Gateway/Policy)
├── W16 会话运行时+计量 ────────── 隔离+durable 会话 + 预算强制 + 8 维矩阵 + TCO
└── W17 只写不建 ──────────────── 私有化方案 + 售前书 + 长文#6-8 + 面试三件套 + 三层投递
表 A1 — 逐日笔记节点(P1–P3 ✅ shipped;P4 关键节点 ✅,逐日 🚧 收尾中)
| 阶段/周 | day 节点(链接 docs/aipa/dayN-*.md) | 主题主线 |
|---|---|---|
| P1·W1 | day1 / day2 / day3 / day4 / day5 / day6 / day7 | AML 产品发现 JTBD→竞品格局→一页纸 PRD(evals 即成功指标)→洗钱类型学与合成数据→SAR 结构与 HITL→原型复盘→周总结(尺子先于引擎) |
| P1·W2 | day8 / day9 / day10 / day11 / day12 / day13 / day14 | trace 导出采样→开放编码→轴向编码→failure taxonomy 定稿→定向补难例→taxonomy→eval 映射→周总结 |
| P1·W3 | day15 / day16 / day17 / day18 / day19 / day20 / day21 | 代码型检查→LLM-judge 四段式 rubric→judge 校准一致率(κ)→人工抽检协议→阻断式 CI gate→agent-lab evals 面板→周总结 |
| P1·W4 | day22 / day23 / day24 / day25 / day26 / day27 / day28 | OTel GenAI semconv→属性映射层→全链路埋点→Langfuse 自托管→失败归因面板→长文#1 定稿→P1 阶段总结 |
| P2·W5 | day29 / day30 / day31 / day32 / day33 / day34 / day35 | orchestrator-worker→handoff 对比→Princeton 单 agent 核查→token economics→ADR#1→LangGraph checkpoint 接入→周总结 |
| P2·W6 | day36 / day37 / day38 / day39 / day40 / day41 / day42 | 断点续跑→HITL 持久化→time-travel 调试→Temporal 分层→JIT 检索→agentic 自适应检索→周总结 |
| P2·W7 | day43 / day44 / day45 / day46 / day47 / day48 / day49 | LiteLLM 网关→MCP 规范精读→语义缓存实测→网关路由治理→Pareto 面板 I→Pareto 报告→Article 50 合规确认 |
| P2·W8 | day50 / day51 / day52 / day53 / day54 / day55 / day56 | MCP server 构建 I/II→MCPTox 红队→风控网关→拦截后复测 ASR→A2A v1.2 精读→长文#2 |
| P2·W9 | day57 / day58 / day59 / day60 / day61 / day62 / day63 | 框架基准→Vercel AI SDK→Claude Agent SDK→trade-off 矩阵→memory 批判评审→长文#3→P2 阶段总结 |
| P3·W10 | day64 / day65 / day66 / day67 / day68 / day69 / day70 | 证据汇集 pipeline 设计→RRF 多源检索→dispatch+Budget→类型学引擎 v2→mule 图比对→金标扩集≥100→周总结判别力 |
| P3·W11 | day71 / day72 / day73 / day74 / day75 / day76 / day77 | SAR 规则基线→SAR LLM 草稿 I→LLM vs 模板→审计轨迹 OTel→不可篡改 trail→每日 eval runner→周总结 |
| P3·W12 | day78 / day79 / day80 / day81 / day82 / day83 / day84 | Agent UX 模式选型→plan-and-execute 预览→置信度信号→渐进式授权→结构化错误恢复→HITL×durable 打通→周总结 |
| P3·W13 | day85 / day86 / day87 / day88 / day89 / day90 / day91 | SAR 质量 rubric→SAR eval suite→对抗红队→v1.0 发布工程→单位成本测算→长文#4 初稿→周总结 |
| P3·W14 | day92 / day93 / day94 / day95 / day96 / day97 / day98 | AI Act 映射 I/II→DORA/CRD→SR11-7/NIST/ISO→C4 合规架构图→AI PRD 定稿→P3 阶段总结 |
| P4·W15 | day99 ✅ · day100–102 / day103 ✅ / day104–105 | 平台化边界 ADR→工具注册表→鉴权层→调用审计→策略 DSL→事中拦截执行器→agent 注册表+AgentCore 定价拆解 |
| P4·W16 | day106 ✅ / day107–109 / day110 ✅(v1 合龙+TCO)/ day111–112(长文#6) | 会话隔离→durable 会话→计量计费+预算强制→管理面板+8 维矩阵→平台 v1 合龙+TCO→长文#6 |
| P4·W17 | day113 ✅ / day114–116 / day117 ✅(八域)/ day118–119 | 私有化部署方案→售前书→长文#7(spec-driven)→长文#8(TOGAF×agentic)→面试三件套→作品集改写→三层投递 |
| D120 | day120(本图) | 总结日:本知识图谱 + 能力复盘 + Q4 移交清单 |
节点总数:P1–P3 已落 98 篇(day1–day98,✅);P4 22 篇(day99–day120)——关键节点(平台边界/策略引擎/会话运行时/平台 v1+TCO/私有化/八域面试)已 ✅ 落仓,其余逐日节点按 D110 截止后「只写不建」节奏收尾补全(🚧 收尾中)。长文#6–#8 已 ✅ 发布(见 §C)。计划「不设笔记数量目标」,此处仅作覆盖盘点。
表 A2 — 主题枢纽节点(跨周复用最频繁的「概念中心」)
| 枢纽概念 | 定义节点 | 被下游复用于 |
|---|---|---|
| failure taxonomy(失败分类法) | day11(6 类定稿) | day13 映射 eval / day26 三分归因面板 / day77 增补 SAR 特有失败类 / 八域面试 war story 库 |
| golden dataset(金标集) | day6(66 案)→day12(80 案)→day69(≥100 案) | 全部 evals、框架对比基准(day57)、红队回放(day52/87) |
| LLM-as-judge 四段式 rubric | day16 | day17 校准 / day73 SAR 对照 / day85 SAR 质量四维 rubric |
| 阻断式 CI eval gate | day19 | 此后每次提交的质量门,约束 P2/P3 全部构建提交 |
| OTel 属性映射层 | day23(防 semconv 漂移) | day24 埋点 / day74 AML 审计轨迹 / day102 平台调用审计 |
| 三段式风控(事前/事中/事后) | day53(风控网关 v1,平移支付反欺诈范式) | day87 AML 红队 / day81 渐进授权 / day103–104 策略引擎事中拦截 ✅ |
| durable execution(checkpoint) | day34/day36 | day37 HITL 持久化 / day83 AML 审批跨会话恢复 / day106–107 平台 durable 会话 ✅ |
B. 三大作品的能力支撑关系(作品 × 支撑笔记+代码)
每个作品回答「由哪些笔记的知识 + 哪些仓库代码支撑」。代码路径均为仓库实存目录/文件。
作品① AI-native 参考架构(agent-v2 升级)— ✅ 部件 shipped,AISA 包装件 🚧 收尾中
| 能力部件 | 支撑笔记 | 支撑代码(仓库实存) | 状态 |
|---|---|---|---|
| 三类 evals + judge×人工一致率 | day15–18, day85–86 | src/agent/eval/(retrievalGolden/runRetrievalEval)、src/aml/evalChecks.ts、src/aml/sarQualityRubric.ts | ✅ |
| 阻断式 CI eval gate | day19 | .github/workflows(eval gate)+ src/agent/__tests__ / src/aml/__tests__ | ✅ |
| OTel 映射层 + Langfuse + 失败归因面板 | day22–26 | src/aml/observability/attributeMap.ts、src/agent/trace、src/components/agent-arch/ | ✅ |
| durable execution(checkpoint/HITL/time-travel) | day34–38 | src/agent/durable/、src/components/agent-arch/DurableExecutionPanel.tsx | ✅ |
| AI gateway(语义缓存实测 + Pareto) | day43–48 | src/agent/gateway/、src/components/agent-arch/SemanticCachePanel.tsx、Budget/CostMeter | ✅ |
| 无状态 MCP server(2026-07-28 规范)+ 红队 + 风控网关 | day44, day50–54 | src/agent/mcp/(toolRegistry)、src/components/agent-arch/McpRegistryPanel.tsx | ✅(教学装置,边界见长文#2) |
| AISA 包装:C4 图 + ADR 集 + 成本模型 + 10 分钟演示视频 + 部署上云 | day116/day118 整合(C4 移自架构 120 天,ADR 集见 day33 等) | 作品集三件套改写(day118) | 🚧 收尾中 |
落点:
/agent-arch-lab(三装置:durable / 语义缓存 / MCP 注册)。作品①的「教学装置 → AISA 作品集件」的最后一公里(C4/ADR/成本模型/演示视频)属 P4 W17「只写不建」收口件,证据依赖已全部就位,本图标 🚧 收尾中。
作品② AML 调查 Copilot — ✅ 逻辑层与原型 shipped(v0.1→深化),作品集包装在 P4
| 五段架构 | 支撑笔记 | 支撑代码(仓库实存) | 状态 |
|---|---|---|---|
| 合成数据生成器(金标 66→80→≥100) | day4, day6, day12, day69 | src/aml/generator.ts、src/aml/types.ts(契约先行) | ✅ |
| 证据汇集(RRF 多源检索 + dispatch + Budget) | day64–66 | src/agent/rag(hybridSearch RRF 复用)、src/agent/orchestrator | ✅ |
| 类型学比对引擎(structuring/layering/mule 图 + 叠加仲裁) | day67–68 | src/aml/typology.ts、src/components/aml/AmlTypologyPanel.tsx | ✅ |
| SAR 草稿生成(规则基线 + LLM 化 + 对照评测) | day71–73 | src/aml/evalBaseline.ts、src/aml/sarNarrative.ts、src/aml/sarDraft.ts、src/components/aml/AmlSarPanel.tsx | ✅ |
| HITL 复核 + Agent UX 实装(plan/置信度/渐进授权/错误恢复) | day78–84 | src/components/aml/AmlCopilot.tsx、AmlEvidencePanel/AmlEvalsPanel/AmlShared | ✅ 原型 |
| 不可篡改审计轨迹(append-only + 哈希链 + OTel) | day74–75 | src/aml/auditTrail.ts、src/aml/observability/、src/components/aml/AmlAuditPanel.tsx | ✅ |
| failure taxonomy(含 SAR 特有失败类) | day11, day77 | src/aml/failureTaxonomy.ts | ✅ |
| SAR 质量 eval suite + 对抗红队 + 单位成本 | day85–89 | src/aml/sarQualityRubric.ts + __tests__ | ✅(红队/单位成本数字归档于长文#4) |
| 合规蓝图(AI Act×DORA×SR11-7×NIST×ISO42001)+ AI PRD | day92–98 | docs/AIPA_LONGFORM_5_COMPLIANCE.md、docs/AML_COPILOT_PRD.md | ✅ |
落点:
/aml-copilot(多屏:证据 / 类型学 / SAR / Evals / 审计)。进度文件标 v0.1 原型;P3 深化后逻辑层(可解释类型学 / SAR LLM 化 / 不可篡改审计 / HITL)均 ✅ shipped。「v1.0 公开上线 + 完整三件套包装」在 P4 收口。
作品③ 自建 Agent 平台(mini-AgentCore)— ✅ 平台逻辑层 shipped(P4 主线)
| 平台部件 | 支撑笔记 | 支撑代码(仓库实存) / 升级自 | 对标对象 | 状态 |
|---|---|---|---|---|
| 自建工具网关(API→MCP 注册/鉴权/审计) | day99–102 | src/agent/platform/toolGateway.ts ← 作品① MCP server(day50–51) | AgentCore Gateway / Identity / Observability | ✅ |
| 策略引擎(声明式规则→事中拦截) | day103–104 | src/agent/platform/policyEngine.ts ← 风控网关 day53 + 三段式风控范式 | AgentCore Policy(Cedar 思路;已 GA 2026-03-03) | ✅ |
| 多会话运行时(隔离 + durable) | day106–107 | src/agent/platform/sessionRuntime.ts ← durable execution day34–38 | AgentCore Runtime / Foundry Agent Service / Agent Engine Sessions | ✅ |
| 计量计费与预算强制 | day108 | sessionRuntime + Budget/CostMeter + gateway 计量 day46 | AgentCore ~12 计费组件 / Foundry / Agent Engine | ✅ |
| agent 注册表 + 平台管理面板 + 8 维矩阵 + build-vs-buy TCO | day105, day109–110 | src/agent/platform/agentRegistry.ts + agent-lab 升级 + 长文#6 | 自建 vs AgentCore/Foundry/Agent Engine | ✅ |
| 金融私有化部署方案 + 售前书 | day113–114 | 合规蓝图(长文#5)+ TCO(长文#6) | Foundry Local+vLLM / GDC air-gapped / VPC自建栈 | ✅ |
作品③不依赖托管服务——它把作品①的部件平台化(
src/agent/platform/四件套:toolGateway / policyEngine / sessionRuntime / agentRegistry),云平台仅作对标研究对象。知识依赖(MCP server / 风控网关 / durable / 计量)全部在 P1–P2 ✅ 就位,故 P4 是「组装与对标」,非「从零学」。build-vs-buy TCO 与 8 维选型矩阵落 §C 长文#6。
C. 8 篇长文的论点地图(论点 × 一手证据 × 支撑作品)
| # | 题目 / 链接 | 核心论点(一句话) | 关键一手证据(带日期) | 落地作品/代码 | 状态 |
|---|---|---|---|---|---|
| 1 | 从 recall@k 到生产级 evals · /papers/AIPA_LONGFORM_1_EVALS | evals 是 AI PM/AISA 的第一硬技能,错误分析是被最多跳过却最重要的一步 | Hamel+Shreya《AI Evals》Maven 2000+ 学员(2025-09 / 2026-01);Aman Khan「Evals are the new PRDs」(2025-06,2026-04 更新) | src/agent/eval/ + src/aml/(recall 1.0×3、normal FPR 5.6%、judge×人工 κ) | ✅ |
| 2 | 红队自己的 MCP server · /papers/AIPA_LONGFORM_2_MCP_REDTEAM | MCP 安全要落到「事前授权/事中拦截/事后审计」三段风控网关,把支付反欺诈范式平移过来 | MCPTox(AAAI 2026,ASR 最高 72.8%);CVE-2025-54136;MCP 2026-07-28 规范 | src/agent/mcp/ 教学装置(拦截前后 ASR 对比;诚实标教学边界) | ✅ |
| 3 | 同一个金融 agent,四种框架 · /papers/AIPA_LONGFORM_3_FRAMEWORKS | 框架选型不是「选最强」而是「在约束下选最不后悔」;memory 厂商 benchmark 数字需批判性归属 | Vercel AI SDK 6(2025-12-22)/LangGraph 1.0(2025-10-22 GA)/OpenAI Agents SDK(2026-04 | 对账异常调查 agent 统一基准 + trade-off 矩阵 | ✅ |
| 4 | 复刻 FIS-Anthropic(旗舰)· /papers/AIPA_LONGFORM_4_AML_AGENT | 银行第一个生产级 agent 落在金融犯罪合规(高价值×强审计×结构化),非客服;合规即架构 | FIS+Anthropic(2026-05-04);Fiserv agentOS Agentic AML Triage(2026-05-14);误报 85–95%、EY 调查时长砍约 50%(2025-11) | src/aml/ 五段全链 + 每案件单位成本 + failure war stories | ✅ |
| 5 | 合规即架构 · /papers/AIPA_LONGFORM_5_COMPLIANCE | 把监管条款逐条翻译成架构组件/数据流约束,一次设计满足 N 套审计的公共交集 | EU AI Act Art.12/14/50(Omnibus 2026-05-07,期限 2027-12-02 / Art.50 2026-08-02);DORA/CRD;SR 11-7;NIST AI RMF GenAI Profile(2024-07);ISO/IEC 42001:2023 | C4 合规架构图 +「已实现/缺口」对照(audit trail=已实现,model registry=缺口) | ✅ |
| 6 | 自建 mini agent 平台 build-vs-buy 解剖 · /papers/AIPA_LONGFORM_6_BUILD_VS_BUY(2026-10-04) | 自建过同等物,才讲得清托管平台每个组件存在的理由;给「该 build / 该 buy」决策树 | AgentCore GA(2025-10)+ Policy GA(2026-03-03)/Evaluations GA(2026-03-31);Foundry Agent Service GA(2026-03-16);Agent Engine(2025-12 GA) | 作品③ src/agent/platform/ + 8 维矩阵 + TCO | ✅ |
| 7 | spec-driven 多 coding agent 工作方式 · /papers/AIPA_LONGFORM_7_SPEC_DRIVEN(2026-10-07) | 以本计划 120 天构建实践为一手素材,论 spec 驱动的多 agent 协作(架构师为 agent 团队写 ADR 与验收门禁) | ThoughtWorks Radar Vol 34 spec-driven development(2026-04) | 120 天构建过程实录 + 阻断式 CI gate(day19) | ✅ |
| 8 | TOGAF ADM × agentic AI 治理悖论 · /papers/AIPA_LONGFORM_8_TOGAF_AGENTIC(2026-10-08) | 传统 EA 治理节奏 vs agent 半衰期 6 个月的冲突与调和 | TOGAF×agentic 空白(Open Group 截至 2026-06 无标准);AI platform engineering「企业操作系统」论(2026-02) | C4 图 + 治理调和方案(ATAM/C4 移植自架构 120 天) | ✅ |
长文 #1–#8 全部 ✅ 已发布(落仓库
docs/AIPA_LONGFORM_*.md,站点/papers);#6–#8 依赖作品③src/agent/platform/,于 P4·W16–W17 完成(dated 2026-10-04/07/08)。
D. 能力验证标准对照(对照计划「能力验证标准」逐条标注覆盖证据)
逐条对照 AIPA_120_PLAN.md 第 371–388 行「能力验证标准」。证据列指向具体 day 笔记 / 代码 / 长文。
| # | 能力验证标准(计划原文摘要) | 覆盖证据 | 状态 |
|---|---|---|---|
| 1 | 真实 traces 上跑完「错误分析→开放编码→轴向编码→judge→代码型检查」全流程,说出 judge×人工一致率 | day8–18(采样→开放编码→轴向编码→taxonomy→judge→κ)+ 长文#1 | ✅ |
| 2 | 对任一失败执行做三分归因(工具失败/模型幻觉/上下文污染)+ 修复路径 | day26 失败归因面板(taxonomy 折叠进三分框架) | ✅ |
| 3 | 用实测 token economics 论证单/多 agent 选型并写成 ADR | day31–33(Princeton 核查→economics→ADR#1) | ✅ |
| 4 | 解释 durable execution 三方案(checkpoint/Temporal/事件溯源)取舍及本项目选型 | day34–39(checkpoint 接入 + Temporal 分层 + ADR 附注) | ✅ |
| 5 | 按 2026-07-28 规范写无状态 MCP server,讲清与旧版差异并能红队它;解释 A2A v1.2 | day44(diff)+ day50–54(构建+红队)+ day55(A2A v1.2)+ 长文#2 | ✅ |
| 6 | 解释 pass^k 与 pass@k 差异,benchmark 90% 为何对应生产 70% | day31(τ²-bench pass^k / HAL 辅证) | ✅ |
| 7 | 白板深挖 agentic 系统设计八域任一域,每域带真实 failure war story | day117 八域白板图集(素材=全程 war story 库 day11/day77/红队报告) | ✅ |
| 8 | 逐组件讲清自建平台 ↔ 托管平台对应关系,并解释每组件存在理由 | day99–105 + src/agent/platform/(自建网关↔Gateway/策略引擎↔Policy/运行时↔Runtime)+ 长文#6 | ✅ |
| 9 | 用 8 维矩阵做 build-vs-buy(含 HIPAA/SOC2/FedRAMP/数据驻留)+ 同负载 TCO | day109–110(8 维矩阵 + TCO)+ 长文#6 | ✅ |
| 10 | 按「数据敏感度→断网→GPU」给监管行业私有化方案(Foundry Local/GDC/VPC/自建栈) | day113 私有化部署决策树 | ✅ |
| 11 | 处理 customer roleplay 异议(「为什么不用竞品」「ROI 怎么算」)+ 向高管翻译价值 | day117–119(roleplay 演练,ATAM/C4 方法移植自架构 120 天) | 🚧 收尾中 |
| 12 | 把 AI Act Articles 9–15 映射为架构组件(引用 2027-12-02 期限)+ DORA/SR 11-7 叠加 | day92–95(Art.9–15 映射 + DORA/CRD + SR11-7/NIST/ISO)+ 长文#5 | ✅ |
| 13 | 对 memory 厂商 benchmark 矛盾做批判性架构评审(数字归属正确) | day60–61(Zep 63.8 / Mem0 49.0 GPT-4o vs Mem0 自报 94.4,ATAM 式)+ 长文#3 | ✅ |
| 14 | 解释「银行 agentic AI 为什么从金融犯罪合规切入而非客服」 | day1–2 + 长文#4(高价值×强审计×结构化三问框架) | ✅ |
| 15 | 45 分钟完成 agentic 系统设计面试(evals/guardrails/HITL/可观测/成本/合规六要素) | 六要素证据散落 P1–P3 ✅;day118 45min POC 限时演练整合 | 🚧 收尾中 |
| 16 | 以「产品结果+eval 数字+单位成本」5 分钟讲完任一作品,逐条对照 Citi/LangChain JD | 作品①②证据 ✅;day118–119 作品集三件套改写 + JD-能力映射表 | 🚧 收尾中 |
小结:16 条能力标准中,13 条已 ✅ 覆盖(#1–10、#12–14:P1–P3 的方法论/金融/合规链全绿,P4 的自建平台↔托管对应/8 维 build-vs-buy TCO/私有化方案随
src/agent/platform/+ 长文#6 转 ✅);3 条(#11、#15、#16)为 🚧 收尾中——均属面试/roleplay/作品集改写类「只写不建」收口件,证据齐备待最终整合,无 ⬜ 缺口(知识与代码依赖全部就位)。
E. 与已完成 5 大计划的衔接
AIPA-120 是前五大计划的「变现层」——不重教,只把既有资产接成 AISA 叙事。
| 已完成计划 | 资产规模 | 在 AIPA-120 中的角色 | 具体接点(day / 文件) |
|---|---|---|---|
| 架构 120 天 | 251 篇笔记 | 不重教 TOGAF/DDD;金融风控知识喂 AML/合规;ATAM/C4 方法论移植到 GenAI 方案评审与 roleplay | day53/day67 用 docs/arch day31–60 风控;day96 移植 C4;day116/day117 移植 ATAM;长文#8 用 TOGAF |
| DSDB+LLM 150 天 | 312 文件(300 笔记+12 长文+2 图) | 模型层/agent 推理理论只引用不重教;一致性/事务知识支撑 durable execution 与不可篡改审计 | day6/day75 货币整数表示对照 src/dsdb-lab/ledger;day34–38 durable 借 DSDB 一致性;day75 哈希链借 WAL/append-only |
| AI 70 天(含 day47–69 产品方法论) | 73 篇 | P1 产品发现框架的底,只做增量 | day1–5 复用产品方法论做 AML JTBD/PRD/原型 |
| 270 天专家深度 | 137K 行 + 5 白皮书 + 120 面试题 | 金融系统设计与白皮书体例打底;docs/MASTER_PORTFOLIO.md 作总作品集母本 | 合规蓝图体例、白皮书写法、面试题结构复用 |
| Web3 90 天 + 实战 + Solidity 90 天 | 全部页面与工具 | 全部保留不下架;复合背景出现在简历/作品集,但不再新增 Web3 主题作品 | src/dsdb-lab/、x402/ERC-7683/swap-compare/whale 等页面照常维护 |
复用率:计划估「>60% 交付物是已有资产上的增量」。agent-v2/agent-lab/eval 原型/memory 三层是唯一实战载体,AIPA 在其上做增量而非重写——这正是「变现层」定位的工程体现。
SOTA 检查 (2026-06-11 编制 / 收官口径 2026-10-12)
本图为 AIPA-120 收官知识图谱,编制时(2026-06-11)经 WebSearch 复查关键平台 GA 状态,记录与计划文本(2026-06 口径)的差异,供 P4 执行当周再核:
- 仍是 SOTA 的主线:MCP 协议演进(2026-07-28 规范)、A2A v1.2、context engineering 叙事(2025-09 起)、LangGraph 1.0 / Temporal 分层共识(2026-03~04)、Hamel/Shreya evals 方法论(2025-09)、FIS-Anthropic / Fiserv agentOS(2026-05,GA 在途)——以上构成 P1–P3 长文#1–#5 的主线证据,均未过时。
- 需修订的快变项(搜索 vs 计划文本冲突,以搜索为准):
- AgentCore Policy 已 GA(2026-03-03)、Evaluations 已 GA(2026-03-31)——计划/作品③对标笔记原标「2025-12 preview」需在 P4·W15 更新为「已 GA」;Payments 仍 preview(2026-05)。8 维矩阵的「eval 成熟度」维度据此应把 AgentCore 由 preview 上调为 GA。
- MCP 2026-07-28 官方博客标题为「Release Candidate」(含 10 周 SDK 验证窗口),非当日「最终规范定版」。长文#2 与 day44 的「最终规范」措辞在 P4 复核时应校准为「RC→正式定版在 10 周窗口后」,避免把发布日当定版日。
- 本图自身的诚实边界:四阶段主体已 shipped——作品③自建平台(
src/agent/platform/四件套 ✅)、长文#6–#8(2026-10-04/07/08 ✅)、P4 关键节点笔记(day99/103/106/110/113/117 ✅)。仍 🚧 收尾中者为 P4·W17「只写不建」收口件:部分逐日笔记(day100–102/104–105/107–109/111–112/114–116/118–119)、作品①②的 AISA 作品集三件套改写与演示视频、面试 roleplay/45min POC 整合(能力标准 #11/#15/#16)——证据与代码依赖全部就位,无 ⬜ 知识缺口,只待最终组装与录屏。本图已逐处标 ✅/🚧,不冒充全绿。 - 下次复查触发点:MCP RC(2026-07-28)10 周窗口后的正式定版日;EU AI Act Omnibus 正式通过确认(~2026-08);Fiserv agentOS / FIS Financial Crimes Agent GA(2026-08 口径);ThoughtWorks Radar Vol 35(~2026-10);Q4 移交项(NIST CAISI agent profile / OTel semconv 转 stable / AWS ML Engineer Associate 备考窗口)。
- AgentCore 对标数字校准(已据 2026-06-11 搜索更新全文):Policy GA 2026-03-03、Evaluations GA 2026-03-31、Payments preview(2026-05)——作品③ 8 维矩阵「eval/策略成熟度」维度已按「GA」而非「preview」计;长文#2 与 day44 的「MCP 最终规范」措辞应理解为「2026-07-28 发布的 RC,正式定版在 10 周 SDK 验证窗口之后」。
本图为活文档:P4·W17 收口件最终合龙后,把 🚧 收尾中转 ✅,回填剩余逐日笔记链接,并补 D120 实际收官签字。