AIPA Day 91

W13 周总结 + 长文#4 发布 — v1.0 交付复盘与「认证的价值边界」

2026-09-13

weekly-summaryv1-releaseaws-certificationcert-value-boundary

日期: 2026-09-13 阶段: Phase 3 - AML 调查 Copilot 标签: #weekly-summary #v1-release #aws-certification #cert-value-boundary

核心问题

W13 是 P3 的收口周：Day 89 把 Copilot v1.0 发布 + $/案件实测口径定下来，Day 90 把旗舰长文#4 的骨架与「时间窗口套利」论点搭好。今天做三件事，回答三个问题：

v1.0 到底交付了什么、还欠什么？ 把 W13 的交付物按「物证 × 状态（已实现/估算/设计待落地）」逐一过一遍，杜绝把估算说成实测、把设计说成已实现——这是 P1 起就钉死的诚信纪律。
要不要去考 AWS AI Practitioner？ 这是 P3 阶段计划里安排的「认证窗口一」。今天回答一个比「考不考」更重要的问题：认证的价值边界在哪？ 它对哪类 JD 是门槛、对哪类是噪声？不搞清楚边界就去刷证，是把时间投到边际为零的地方。
长文#4 发不发？ 接 Day 90 的时间窗口论证——$S(t)$ 在 GA 前最高，发布不可拖。今天发。

贯穿全篇的主线：作品（长文+代码）是主资产，认证是边界明确的辅助资产。搞反主辅，就会陷入「刷了一堆证却没有一个能讲清楚的作品」的求职陷阱。

关键内容

A. v1.0 交付复盘：物证 × 状态三态对照

W13 收口，先把 P3 的交付物按「物证文件 × 状态」列清。状态严格分三态——已实现（代码真实产出）/ 实测估算（口径定了、数字待跑批回填）/ 设计待落地（接口/伪代码已设计、函数 W 后实装）。混淆三态是简历造假的温床。

交付物	物证文件	状态	备注
规则基线评测	`src/aml/evalBaseline.ts`	✅已实现	recall 1.0×3、normal FPR 5.6%（代码真实算出）
66 案金标 + V11 80 案	`src/aml/__tests__/`	✅已实现	P1 建，确定性
6 类失效分类法	`src/aml/failureTaxonomy.ts`	✅已实现	P1 建
lead-sub 编排	`src/agent/orchestrator/`	✅已实现	P2 建
RAG 混合检索 RRF	`src/agent/rag/hybridSearch.ts`	✅已实现	P2 建
durable checkpoint	`src/agent/durable/checkpointMachine.ts`	✅已实现	P2 建
gateway 语义缓存	`src/agent/gateway/semanticCache.ts`	✅已实现	P2 建（教学模拟，头注诚实标注）
judge κ 校准	`src/aml/judgeCalibration.ts`	🟡设计待落地	Day 17 设计公式，函数 W3 落、真实标注后测 κ
$/案件三段分解	`budget.ts` 扩 caseId/layer	🟡实测估算	$0.43/$0.51 为设计估算，W13 跑批回填
SAR LLM 草稿	`src/aml/sarNarrative.ts`	🟡设计待落地	prompt+rubric+接口，无 key 降级 ruleTemplateSar，未接 LLM
长文#4 旗舰	`docs/aipa/longform/longform4-*.md`	🟡骨架→正文中	Day 90 骨架，正文逐章补，今日发布

反直觉洞察①（三态混淆是简历最大的隐性风险，比「没做」更危险）：直觉觉得「把估算说得肯定一点、把设计说成已实现，简历更好看」。但在金融/架构岗的深度面试里，这是自杀——面试官随手深挖一层（「你这 $0.51/SAR 是怎么测出来的？跑了多少案？」）就会戳穿，而一旦戳穿一个夸大，整份作品的可信度归零。反过来，一个候选人能清清楚楚说「这部分是实测、这部分是设计估算口径待回填、这部分 LLM 还没接但接口和降级都写好了」，传递的是工程诚实——这在合规相关岗位（AML 本身就是合规）是比能力更稀缺的信号。sarNarrative.ts 头注那句「绝不在任何路径上伪造『已接入 LLM』的草稿」不是自我设限，是把诚信刻进代码——长文和简历必须继承这个纪律。

B. AWS AI Practitioner：认证的价值边界

P3 计划安排了「AWS AI Practitioner 考试窗口一」。先把事实钉死（均 2026 核实）：AIF-C01，$100，备考约 2-3 周，3 年有效，AWS 最入门的 AI 认证（aws.amazon.com / cbtnuggets 2026）。问题不是「难不难」（不难），而是「值不值」——答案取决于目标 JD 的类型。把价值边界画成一张「认证 vs 作品」的信号矩阵：

JD 类型	认证是…	作品是…	投入建议
云厂商（AWS/Azure 自家 AI 岗）	硬门槛（ATS 过滤项）	加分	考
SI / 咨询（埃森哲/德勤类）	半门槛（客户要求 partner 认证数）	加分	考
银行/金融 IT（合规驱动采购）	信任信号（厂商背书降低供应商风险）	加分	值得考
AI 原生创业公司 / 产品岗	噪声（「builder」看的是能不能 ship）	硬门槛	别花时间，全押作品
Web3 / 远程 PM-架构（本项目主目标）	基本噪声	决定性	跳过，作品优先

边界的统计依据：「currently 94 open US roles requiring this specific certification」（certdemand 2026）——94 个岗位说明它在特定赛道（云/SI/企业 IT）是真门槛，但相对于整个 AI 岗位池只是一个细分。另一面：「If Cloud Practitioner was the baseline for 2020, AI Practitioner is the baseline for 2026」「AI basics + cloud basics = the new minimum skillset」（flashgenius 2026）——它是地板不是天花板，能帮你过 ATS 过滤，但过不了深度面试。

把「认证 vs 作品」的边际价值写成一个简单的决策规则：

认证的边际价值 ≈ P(JD 把认证设为过滤项) × (它把你挡在门外的损失)

对本项目主目标（Web3/远程 PM-架构）:
    P(认证为过滤项) ≈ 低     → 认证边际价值低
    作品的边际价值   ≈ 高     → 时间应押作品（长文#4、$/案件实测）

对潜在备选（银行/金融 IT/SI）:
    P(认证为过滤项) ≈ 中      → 认证有边际价值（半门槛）
    → 决策：低成本（$100、2-3 周）顺手考一张，作"保底过滤器"，
            但绝不让它挤占作品时间。主辅不可倒。

反直觉洞察②（认证的价值是「过 ATS 过滤」，不是「证明能力」——别用它替代作品）：直觉把认证当「能力证明」，于是有人刷了一摞证以为竞争力翻倍。但 2026 的「builder」招聘范式说得很直白——「companies prioritize candidates with strong product intuition who can take projects from idea to completion」「hiring managers scan for production signals」（sfstandard / dataexpert.io 2026）。认证证明的是「我学过 AWS 的 AI 服务名词」，作品证明的是「我能把一个真实问题做成能上生产的系统」——后者才是面试官真正在找的。 认证的唯一硬作用是在 ATS 自动过滤这一关不被刷掉（云/SI/银行 JD 把它设为 required 时）。所以正确姿势是：把认证当成「低成本保底过滤器」（$100、2-3 周顺手拿），把绝大部分时间押在作品上。用认证替代作品，是把辅助资产当主资产的典型错配。 本项目主目标是 Web3/远程 PM-架构——这里认证基本是噪声，AML Copilot 作品 + 长文#4 才是决定性资产，AWS 证至多是「若转投银行 IT 备选时的保底」。

注意一个时效坑：AI-102 于 2026-06-30 退役 → AI-103 接替（2026-06 上线）；AWS ML Specialty 已 2026-03-31 退役（核实 2026-06）。认证体系本身在快速换代——这反过来印证反直觉②：押注一个3 年内会改版、考的是厂商当下产品名词的认证作为核心竞争力，性价比远低于一个展示底层工程能力的作品。作品不会因为 AWS 换个服务名就过期。

C. 长文#4 发布 + W13 收口

接 Day 90 的时间窗口论证：$V(t)=D(t)\times S(t)$ 的峰值在「FIS 宣布（2026-05）→ GA（H2 2026）」窗口内，今天（2026-09-13）在窗口内，$S(t)$ 在 GA 后崩塌，发布不可拖。今天发布长文#4（骨架 + §1/§7 论点段先行，§2-§6 正文随后补，但论点链完整可读）。

W13 收口的「交付 × 证据」总表（作品②的招聘方索引）：

W13 交付	证据/链接	对招聘方的信号
Copilot v1.0	`src/components/aml/AmlCopilot.tsx` 三屏 + Evals 面板	能 ship 可演示产品
$/案件单位经济	Day 89 笔记 + `budget.ts` 计量维度	懂单位经济/能定价（AISA 信号）
长文#4 旗舰	`docs/aipa/longform/longform4-*.md`	能把复杂系统讲成说服性叙事
三护城河硬数字	evalBaseline / judgeCalibration / failureTaxonomy	production signal（非 toy demo）
诚信三态标注	各文件头注 + 长文限定语	工程诚实（合规岗稀缺信号）

W13 的元复盘：P3 这一周完成了从「能跑的 Copilot」到「能讲清楚、能定价、敢发布」的跃迁。最大的认知收获不是某个技术点，而是作品的价值不在代码本身，而在「能不能把代码组织成一个让招聘方在窗口期内、用三个硬数字、十秒看懂」的叙事——这正是 PM/架构师与纯工程师的分水岭。

设计要点/决策表

要点	决策	理由
交付状态标注	严格三态（已实现/实测估算/设计待落地）	三态混淆=简历造假，比「没做」更危险
AWS AI Practitioner	主目标（Web3/远程）跳过；银行/SI 备选时低成本顺手考	认证对云/SI/银行是门槛，对产品/Web3 是噪声
认证 vs 作品	作品是主资产，认证是边界明确的保底过滤器	builder 范式看 ship 能力，非认证
认证时效	不押会改版的认证作核心竞争力（AI-102→103、ML Specialty 退役）	作品不会因厂商改名过期
长文#4	今日发布（窗口内，$S(t)$ 将崩塌）	保鲜期以季度计，发布不可拖
主辅次序	时间分配：作品 ≫ 认证	主辅倒置=求职陷阱

对本项目的落地

W13 收口产物：本笔记即 W13 周总结（与 P1/P2 周总结同体例）；交付物三态表是作品②的「招聘方索引」，与长文#4 §2-§5 的物证指针一一对应（DRY，不重复维护两份清单）。
长文#4 发布：docs/aipa/longform/longform4-replicate-fis-anthropic.md 今日落地骨架 + §1/§7 论点段（Day 90 骨架转正文），§2-§6 正文随后补；发布渠道（Mirror/个人站）随作品集主页 docs/MASTER_PORTFOLIO.md 链接，呼应 optimization-roadmap 的「收敛到 3 条叙事」（AML Copilot 是其一）。
AWS AI Practitioner 决策落地：对本项目主目标（remote Web3 PM/架构）不投入；仅在简历投向银行 IT/SI 备选赛道时，以「$100、2-3 周」低成本顺手考一张作 ATS 保底——写进求职策略文档（docs/ 求职冲刺计划），明确标「辅助资产，不挤占作品时间」。绝不把刷证写进 P3-P4 的核心学习时间。
核心数字单一真相源（再强调）：W13 表里的 recall/FPR/$/案件全部从代码实测读取，长文、简历、周总结三处引用同一份数字，禁止各自硬编码（防漂移，呼应 Day 89/90）。
诚实标注（严格）：本笔记交付状态表的「🟡实测估算」「🟡设计待落地」是硬约束——v1.0 发布材料、长文、简历凡引用 $/案件（$0.43/$0.51）必标「设计估算 W13 跑批回填」；凡述及 SAR 草稿必标「prompt+rubric，无 key 降级 ruleTemplateSar，未接 LLM」；judge κ 必标「阈值 0.6 为 v1 门槛，真实标注后测算」。延续 P1 Day 27/28、P2 Day 63、Day 89/90 的降本数字诚信纪律。

参考资料

AWS — AWS Certified AI Practitioner (AIF-C01)（官方认证页，持续）+ cbtnuggets Is AIF-C01 Worth It?（2026）：$100、备考约 2-3 周、3 年有效、AWS 最入门 AI 认证；2024-10 推出，应对「employer demand for AI-literate candidates exceeds supply」
flashgenius — AWS AI Certifications 2026: AI Practitioner, ML Engineer & GenAI Developer（2026）：「If Cloud Practitioner was the baseline for 2020, AI Practitioner is the baseline for 2026」「AI basics + cloud basics = the new minimum skillset」——认证是地板非天花板
certdemand — AWS-AIP Certification (2026 Guide): Requirements, Salary & Jobs（2026）：「currently 94 open US roles requiring this specific certification」——认证为特定赛道（云/SI/企业 IT）门槛的统计依据
sfstandard — 'Engineer' is so 2025. In AI land, everyone's a 'builder' now（2026-03）+ dataexpert.io Ultimate Guide to AI Engineering Portfolios（2026）：「companies prioritize candidates with strong product intuition who can take projects from idea to completion」「hiring managers scan for production signals」——builder 范式看 ship 能力非认证
认证时效（核实 2026-06）：AI-102 于 2026-06-30 退役 → AI-103（2026-06 上线）；AWS ML Specialty 已 2026-03-31 退役——认证体系快速换代，印证「不押会改版的认证作核心竞争力」
本仓物证：src/aml/evalBaseline.ts（recall/FPR 实测）、judgeCalibration.ts、failureTaxonomy.ts、sarNarrative.ts（诚实头注）、src/agent/orchestrator/budget.ts、src/components/aml/AmlCopilot.tsx、docs/MASTER_PORTFOLIO.md（2026-06）

SOTA 检查 (2026-09-13)

注：本笔记日历日为 2026-09-13；事实核查与一手原文检索（AWS 认证页、AI-102/103 与 ML Specialty 退役时间、builder 招聘范式、94 roles 统计）在 2026-06-11 完成。$/案件实测回填、长文正文补全在 W13/W13 后进行。

「认证是地板、作品是天花板」在 2026-09 是稳固共识：builder 招聘范式（sfstandard 2026-03）、production-signal 优先（dataexpert.io 2026）、AI Practitioner 作「2026 baseline」（flashgenius 2026）三方口径一致——认证帮过 ATS、作品赢深度面试。本项目「主押作品、认证作银行/SI 备选保底」的决策与此对齐，未见相反信号。
认证体系换代加速，印证「不押认证作核心竞争力」：AI-102→AI-103（2026-06）、ML Specialty 退役（2026-03-31）——一个 3 年内会改版、考厂商当下产品名词的认证，性价比低于展示底层能力的作品。此判断在 2026-09 仍 live。
AWS AI Practitioner 仍是「特定赛道门槛」非「通用门槛」：94 US roles requiring（certdemand 2026）说明它在云/SI/企业 IT 是真门槛，但对 Web3/远程 PM-架构（本项目主目标）基本噪声——价值边界判断未变。
过时认知警示：(1) 不可把估算/设计说成已实现——三态混淆是简历自杀（反直觉①）；(2) 不可用认证替代作品——认证证明「学过名词」，作品证明「能上生产」（反直觉②）；(3) 不可把刷证写进核心学习时间——主辅倒置是求职陷阱。
待跟踪（W13 后）：W13 跑批回填 $/案件实测，更新本表「🟡实测估算」为「✅已实测」；长文#4 §2-§6 正文补全后更新「🟡骨架→正文中」状态；若简历转投银行 IT/SI，再评估是否顺手考 AIF-C01（不挤占 P4 时间）；监控 AI-103 是否有金融/合规相关考点变化。