AIPA Notes

AI产品×架构 120天融合计划 — AI Solutions Architect 主轴：evals/可观测/AML Copilot/自建 Agent 平台

120天 AIPA 融合计划

120/120

120 篇 AIPA 学习笔记

P1 产品定义×评测×可观测底座

28篇 · Day 1-28

P2 AI-native 参考架构

35篇 · Day 29-63

P3 AML 调查 Copilot

35篇 · Day 64-98

P4 自建 Agent 平台×求职冲刺

22篇 · Day 99-120

P1 产品定义×评测×可观测底座

AIPA Day 1

AML Copilot 产品发现与 JTBD

2026-06-15

amljtbdproduct-discovery+1

AIPA Day 2

AML×AI 竞品格局 2026

2026-06-16

amlcompetitive-landscapeagentic-ai+1

AIPA Day 3

一页纸 PRD 与 evals 即成功指标

2026-06-17

evalsprdllm-as-judge+1

AIPA Day 4

洗钱类型学与合成数据生成器设计

2026-06-18

amltypologysynthetic-data+1

AIPA Day 5

SAR 叙述结构与 HITL 复核设计

2026-06-19

sarhitlagent-ux+1

AIPA Day 6

W1 原型实现复盘 — 契约先行与诚实标注

2026-06-20

contract-firstsynthetic-dataevals+1

AIPA Day 7

W1 周总结 — 尺子先于引擎

2026-06-21

weekly-summaryevalsaml+1

AIPA Day 8

agent-v2 真实 traces 导出与采样

2026-06-22

tracessamplingerror-analysis+1

AIPA Day 9

开放编码 open coding

2026-06-23

open-codinggrounded-theoryerror-analysis+1

AIPA Day 10

轴向编码 axial coding

2026-06-24

axial-codingclusteringseverity-matrix+1

AIPA Day 11

failure taxonomy 定稿

2026-06-25

failure-taxonomyeval-designdecision-tree+1

AIPA Day 12

金标定向补难例 —— 用信息增益指导数据集扩充

2026-06-26

hard-casesactive-learninggolden-dataset+1

AIPA Day 13

taxonomy → eval 映射 —— 每条失败该交给哪种评测

2026-06-27

eval-typesllm-as-judgetaxonomy+1

AIPA Day 14

W2 周总结 —— 错误分析方法论的因果闭环与偏差登记

2026-06-28

error-analysisbiassaturation+1

AIPA Day 15

代码型检查 evals — 评测金字塔的确定性底座

2026-06-29

evalscode-based-checksci-gate+1

AIPA Day 16

LLM-as-judge 四段式 rubric — judge prompt 结构与刻度选择

2026-06-30

llm-as-judgerubricbinary-vs-likert+1

AIPA Day 17

judge 校准与一致率 — Cohen's kappa 与校准闭环

2026-07-01

judge-calibrationcohens-kappainter-rater+1

AIPA Day 18

人工抽检协议 — 抽检率、漏检概率与升级路径

2026-07-02

human-in-the-loopsamplingllm-simulated-users+1

AIPA Day 19

阻断式 CI eval gate — 让"尺子"挡住 merge

2026-07-03

eval-gateci-cdeval-driven-development+1

AIPA Day 20

agent-lab evals 面板 — 把"尺子"做成可演示装置

2026-07-04

evals-panelinteractive-demodeterministic+1

AIPA Day 21

W3 周总结 — 三类 eval 齐备，尺子刻度成形

2026-07-05

weekly-summaryevalsci-gate+1

AIPA Day 22

OTel GenAI semconv 精读

2026-07-06

opentelemetrygenai-semconvobservability+1

AIPA Day 23

独立属性映射层

2026-07-07

anti-corruption-layerdddtelemetry+1

AIPA Day 24

埋点接入全链路

2026-07-08

instrumentationtrace-treetrace-eval-correlation+1

AIPA Day 25

Langfuse 自托管

2026-07-09

langfuseself-hostingclickhouse+1

AIPA Day 26

失败归因面板 — 工具失败 / 模型幻觉 / 上下文污染三分

2026-07-10

failure-attributionobservabilityagentic-control-plane

AIPA Day 27

缓冲 + 长文#1 定稿 + P1 主线 SOTA 复查

2026-07-11

longformsota-recheckevals+1

AIPA Day 28

P1 阶段总结 — 尺子先于引擎，证据先于声明

2026-07-12

phase-summaryevals-firstsota-check+1

P2 AI-native 参考架构

AIPA Day 29

Anthropic orchestrator-worker 精读 — +90.2% 背后的 15× token 与超线性

2026-07-13

orchestrator-workermulti-agenttoken-economics

AIPA Day 30

handoff vs orchestrator-worker — 控制权转移的两种语义

2026-07-14

handofforchestratormulti-agent-pattern

AIPA Day 31

单 agent vs 多 agent 的证据核查 — pass^k、HAL 与 64% 的出处

2026-07-15

single-vs-multi-agentpass-kreliability

AIPA Day 32

token economics 决策框架 — 15× 成本何时换得回 +90.2%

2026-07-16

token-economicscost-quality-tradeoffbudget

AIPA Day 33

ADR#1 — 本项目为什么(暂)不上多 agent

2026-07-17

adrmulti-agentorchestrator-worker+1

AIPA Day 34

LangGraph 1.0 checkpointing 接入 — 节点级恢复与静态站现实

2026-07-18

langgraphcheckpointingdurable-execution+1

AIPA Day 35

W5 周总结 — 编排半周方法论、checkpoint 验收与 token 经济学框架

2026-07-19

week-summaryorchestrationtoken-economics+1

AIPA Day 36

checkpoint 断点续跑 — 难点不在保存，在幂等重放

2026-07-20

durable-executionidempotencycrash-recovery

AIPA Day 37

HITL 审批点持久化 — interrupt 节点与跨会话恢复

2026-07-21

human-in-the-loopinterruptapproval-queue

AIPA Day 38

time-travel 调试 — 「重放」不等于「重现」

2026-07-22

time-travelrecord-replaynon-determinism

AIPA Day 39

durable execution 三方案取舍 — 宏观工作流 / 微观推理 / 事件溯源

2026-07-23

durable-executiontemporallayered-architecture

AIPA Day 40

context engineering — JIT 检索与 context rot

2026-07-24

context-engineeringjit-retrievalcontext-rot

AIPA Day 41

agentic 自适应检索 — 查询改写、多跳与防重复

2026-07-25

agentic-ragadaptive-retrievalmulti-hop

AIPA Day 42

W6 周总结 — durable execution × context engineering 收口

2026-07-26

week-summarydurable-executioncontext-engineering

AIPA Day 43

自托管 AI gateway — LiteLLM/Bifrost/Portkey 与统一接入层

2026-07-27

ai-gatewaylitellmcost-control

AIPA Day 44

MCP 2026-07-28 最终规范精读 — 无状态核心如何重写会话语义

2026-07-28

mcpstatelessprotocol-spec

AIPA Day 45

语义缓存实测 — 双层判定、命中率真相与假阳的代价

2026-07-29

semantic-cachecost-controlfalse-positive

AIPA Day 46

gateway 治理 — 路由策略、fallback 链、预算闸与意图感知路由

2026-07-30

llm-routingfallbackbudget-governance

AIPA Day 47

成本×延迟×质量 Pareto 面板 — 没有最优模型，只有前沿上的取舍

2026-07-31

pareto-frontiermulti-objectivemodel-selection+1

AIPA Day 48

gateway 实测报告 — 把 Day 47 的前沿填上真数字

2026-08-01

ai-gatewaysemantic-cachebenchmark+1

AIPA Day 49

EU AI Act Article 50 生效 — SAR 标注、Omnibus 推迟与 HITL 豁免同构

2026-08-02

eu-ai-actarticle-50transparency+1

AIPA Day 50

MCP server 构建 I — 把 agent-v2 检索封装成无状态 MCP server

2026-08-03

mcpstateless-servertool-registration+1

AIPA Day 51

MCP server 构建 II — Tasks 异步长任务 + OAuth 鉴权

2026-08-04

mcptasksoauth+2

AIPA Day 52

MCPTox 式红队 I — 工具描述即注入面

2026-08-05

mcptoxtool-poisoningprompt-injection+2

AIPA Day 53

agent 风控网关 v1 — 把支付风控三段式搬到 MCP 调用链

2026-08-06

risk-gatewayzero-trustleast-privilege+2

AIPA Day 54

红队 II — 拦截后对比与绕过归因

2026-08-07

red-teamasrdefense-in-depth+1

AIPA Day 55

A2A 协议精读 — Agent Card、任务委托与长任务生命周期

2026-08-08

a2aagent-cardtask-lifecycle+1

AIPA Day 56

长文#2 定稿《红队一个 MCP server》+ W8 周总结

2026-08-09

longformred-teamaisa+1

AIPA Day 57

框架对比基准 — 三固定原则与「对账异常调查」任务规范

2026-08-10

agent-frameworkbenchmark-methodologyvercel-ai-sdk-6+1

AIPA Day 58

Vercel AI SDK 6 实现 — usage vs totalUsage 的成本陷阱与数据点#1

2026-08-11

vercel-ai-sdk-6tool-loop-agenttoken-accounting+1

AIPA Day 59

Claude Agent SDK 对比实现 — 谁拥有 loop，谁拥有 context

2026-08-12

claude-agent-sdkharnesscompaction+1

AIPA Day 60

四框架 trade-off 矩阵 + memory 厂商 benchmark 批判（ATAM 式 I）

2026-08-13

framework-tradeoffatammemory-benchmark+1

AIPA Day 61

memory 厂商批判评审定稿 — 用 ATAM 砸碎 benchmark 排名

2026-08-14

agent-memoryatammem0-letta-zep+1

AIPA Day 62

长文#3 定稿 — 四框架 trade-off：同一桩 AML 调查，谁来编排？

2026-08-15

longformagent-frameworkslanggraph-temporal+1

AIPA Day 63

P2 阶段总结 — 参考架构落地，部件齐而引擎待接

2026-08-16

phase-summaryreference-architecturesota-check+1

P3 AML 调查 Copilot

AIPA Day 64

证据汇集 pipeline 架构设计 — 五段流程的接口契约与失败隔离

2026-08-17

evidence-pipelineinterface-contractfault-isolation

AIPA Day 65

证据汇集 — RRF 多源检索与召回优先

2026-08-18

rrfmulti-source-retrievalrecall-first

AIPA Day 66

dispatch + Budget 单案成本控制 — 子任务调度与超限降级

2026-08-19

budget-enforcementcost-capgraceful-degradation

AIPA Day 67

类型学比对引擎升级 I — structuring/layering 的阈值、可解释与证据对齐

2026-08-20

structuringlayeringexplainable-rules

AIPA Day 68

类型学升级 II — mule network 图比对与叠加命中仲裁

2026-08-21

mule-networkgraph-topologytypology-arbitration

AIPA Day 69

金标扩集 ≥100 — 难例不是堆数量，是造区分度

2026-08-22

golden-datasethard-casesdiscriminability

AIPA Day 70

W10 周总结 — 金标扩集后，基线第一次掉分

2026-08-23

weekly-summarydiscriminabilityopen-coding

AIPA Day 71

SAR 规则模板基线 — 先建「愚蠢但确定」的对照系

2026-08-24

sar-narrativedeterministic-baselineeval-floor+1

AIPA Day 72

SAR 叙述 LLM 化 I — 引用锚点与闭世界幻觉防护

2026-08-25

sar-llmcitation-anchorclosed-world+1

AIPA Day 73

SAR LLM vs 模板对照评测 — LLM 必须打败基线才配上线

2026-08-26

sar-evalfaithfulness-fluency-tradeoffpaired-comparison+1

AIPA Day 74

审计轨迹 I — 全链路 OTel 与"案件 ID 贯穿"四段 span

2026-08-27

audit-trailopentelemetrygenai-spans+1

AIPA Day 75

审计轨迹 II — 不可篡改：哈希链、监管要件与落盘

2026-08-28

immutable-audithash-chaintamper-evident+1

AIPA Day 76

每日 evals 防退化固化 — daily runner、退化告警与 CI gate

2026-08-29

daily-evalsregression-gateci+1

AIPA Day 77

W11 周总结 — SAR LLM 对照定稿、failure taxonomy v2、审计 trail 完成

2026-08-30

weekly-summarysar-llmfailure-taxonomy+2

AIPA Day 78

Agent UX 模式选型 — 七模式与金融 HITL 的适配，以及"信任决定模式"的反直觉

2026-08-31

agent-uxhuman-in-the-loopprogressive-authorization

AIPA Day 79

plan-and-execute 预览实装 — 冻结计划、执行前授权与成本预估

2026-09-01

plan-and-executehitl-approvalcost-budget

AIPA Day 80

置信度信号实装 — 类型学命中与 SAR 字段级置信度，judge 分到三档信号的映射

2026-09-02

confidence-signalingtrust-calibrationhitl

AIPA Day 81

渐进式授权实装 — 分级授权决策树、复用 P2 风控网关、授权决策写审计轨迹

2026-09-03

progressive-authorizationleast-privilegeaudit-trail

AIPA Day 82

结构化错误恢复实装 — 让用户保持控制，而非自动重试

2026-09-04

error-recoverygraceful-degradationagent-ux

AIPA Day 83

HITL × durable execution 打通 — 审批等待是一种「对时钟的中断」

2026-09-05

human-in-the-loopdurable-executionapproval-timeout

AIPA Day 84

W12 周总结 — Agent UX 模式库定稿，以及「金融特化」如何重写每一个通用模式

2026-09-06

agent-uxpattern-libraryfinancial-specialization

AIPA Day 85

SAR 质量 rubric — 四维 LLM-judge 评分锚定 taxonomy，与 Fiserv/FIS GA 对照

2026-09-07

sar-qualityllm-as-judgerubric+1

AIPA Day 86

SAR eval suite — judge×人工抽检的分层校准，与「LLM 模拟用户不可靠」的红线

2026-09-08

eval-suitejudge-human-agreementcohens-kappa+1

AIPA Day 87

AML 对抗红队 — 证据文本里的注入面，与 SAR 诱导遗漏

2026-09-09

red-teamindirect-prompt-injectionevidence-poisoning+1

AIPA Day 88

v1.0 发布工程 — Article 50 透明标注落地点、脱敏演示集与发布检查清单

2026-09-10

release-engineeringarticle-50transparency-labeling+1

AIPA Day 89

Copilot v1.0 发布 + 每案件单位成本 — $/案件如何成为定价基础而非事后核算

2026-09-11

unit-economicscost-per-casebudget-instrumentation

AIPA Day 90

长文#4 旗舰初稿 —《复刻 FIS-Anthropic：我从零做了一个 AML 调查 agent》

2026-09-12

longformportfoliofis-anthropic+1

AIPA Day 91

W13 周总结 + 长文#4 发布 — v1.0 交付复盘与「认证的价值边界」

2026-09-13

weekly-summaryv1-releaseaws-certification+1

AIPA Day 92

AI Act 映射 I — Articles 9-12 落到 audit log / model registry / 数据血缘

2026-09-14

eu-ai-acthigh-riskrisk-management+1

AIPA Day 93

AI Act 映射 II — Articles 13-15 落到 HITL gateway / eval suite / 红队

2026-09-15

eu-ai-acthuman-oversightautomation-bias+1

AIPA Day 94

DORA/CRD 叠加 — 模型供应商是关键 ICT 第三方，韧性接 durable execution

2026-09-16

doraict-third-partyoperational-resilience+1

AIPA Day 95

美国线 + 治理底座 — SR 11-7 三道防线 / NIST AI RMF / ISO 42001 落到自家组件

2026-09-17

sr11-7model-risknist-ai-rmf+1

AIPA Day 96

C4 合规架构图 — 把法条画成着色组件，长文#5 初稿开骨架

2026-09-18

c4-modelcompliance-as-architecturegap-analysis

AIPA Day 97

AML Copilot AI PRD 定稿 — 组装而非新写，附定价模型与长文#5 发布

2026-09-19

ai-prdevals-as-specoutcome-pricing

AIPA Day 98

P3 阶段总结 — 旗舰交付清单、SOTA 重审与 P4 开工预查

2026-09-20

phase-summarysota-recheckp4-prep

P4 自建 Agent 平台×求职冲刺

AIPA Day 99

平台化开工 — Agent 平台五件套的组件边界设计

2026-09-21

agent-platformagentcorecomponent-boundaries

AIPA Day 100

工具网关 I — 工具注册表

2026-09-22

tool-gatewaymcptool-registry

AIPA Day 101

工具网关 II — 鉴权层

2026-09-23

gateway-authagent-identityleast-privilege

AIPA Day 102

工具网关 III — 调用审计 + 网关合龙

2026-09-24

call-auditobservabilityappend-only

AIPA Day 103

策略引擎 I — 声明式规则 (principal/action/resource/condition 四元组)

2026-09-25

policy-enginecedardeclarative-authz+1

AIPA Day 104

策略引擎 II — 事中拦截 (每次工具调用过判定 · allow/deny/escalate→HITL)

2026-09-26

policy-enforcementinterceptionhitl-escalation+1

AIPA Day 105

Agent 注册表 + AgentCore 计费拆解 + W15 周总结

2026-09-27

agent-registryversioningagentcore-pricing+1

AIPA Day 106

多会话运行时 I — 会话隔离与上下文不泄漏

2026-09-28

session-isolationmulti-tenantcontext-leakage

AIPA Day 107

多会话运行时 II — durable 会话与跨会话恢复

2026-09-29

durable-sessioncheckpointcross-session-resume

AIPA Day 108

计量计费与预算强制 — 三家定价与 TCO 输入

2026-09-30

meteringbudget-enforcementtco-pricing

AIPA Day 109

平台管理面板 + 8 维选型矩阵

2026-10-01

selection-matrixplatform-comparisonagent-lab

AIPA Day 110

自建平台 v1 合龙 + build-vs-buy TCO — 自建省的 API 费常被运维人力吃掉，但合规场景仍值

2026-10-02

build-vs-buytcoself-hosted-agent-platform

AIPA Day 111

长文#6 初稿 — build-vs-buy 解剖：我自建的每个零件，托管平台收你哪一层的钱

2026-10-03

longform6component-mappingdefense-in-depth

AIPA Day 112

长文#6 定稿 + W16 周总结 — build/buy 的线，不在你和厂商之间，在你自己技术栈的每一层

2026-10-04

longform6-finaldecision-treeweek16-summary

AIPA Day 113

金融私有化部署方案 — 数据敏感度→断网要求→GPU 资源的三问决策树

2026-10-05

private-deploymentair-gappedfoundry-local+1

AIPA Day 114

售前方案书 — KYC 审核 AI 改造的 TCO/ROI 与 POC 门禁

2026-10-06

presaleskyc-automationroi-tco+1

AIPA Day 115

长文#7 — spec-driven 下的多 coding agent 工作方式

2026-10-07

spec-drivenmulti-agent-codingadr-as-contract+1

AIPA Day 116

长文#8 — TOGAF ADM × agentic AI 的治理悖论

2026-10-08

togaf-admagentic-governancegovernance-paradox+1

AIPA Day 117

面试三件套 I — agentic 系统设计八域白板与 customer roleplay

2026-10-09

agentic-system-designinterviewcustomer-roleplay

AIPA Day 118

面试三件套 II — 作品集三件套改写与 45min POC 演练

2026-10-10

portfoliothree-piece-narrativepoc-demo

AIPA Day 119

主动出击 + 三层投递 + JD-能力映射 + 阶段末 SOTA 复查

2026-10-11

three-tier-applicationjd-mappingproactive-outreach

AIPA Day 120

收官日 — 知识图谱、能力验证对照与 Q4 移交清单

2026-10-12

capstoneknowledge-graphhandover