返回 AIPA 笔记
AIPA Day 91

W13 周总结 + 长文#4 发布 — v1.0 交付复盘与「认证的价值边界」

W13 周总结 + 长文#4 发布 — v1.0 交付复盘与「认证的价值边界」

2026-09-13
weekly-summaryv1-releaseaws-certificationcert-value-boundary

日期: 2026-09-13 阶段: Phase 3 - AML 调查 Copilot 标签: #weekly-summary #v1-release #aws-certification #cert-value-boundary

核心问题

W13 是 P3 的收口周:Day 89 把 Copilot v1.0 发布 + $/案件实测口径定下来,Day 90 把旗舰长文#4 的骨架与「时间窗口套利」论点搭好。今天做三件事,回答三个问题:

  1. v1.0 到底交付了什么、还欠什么? 把 W13 的交付物按「物证 × 状态(已实现/估算/设计待落地)」逐一过一遍,杜绝把估算说成实测、把设计说成已实现——这是 P1 起就钉死的诚信纪律。
  2. 要不要去考 AWS AI Practitioner? 这是 P3 阶段计划里安排的「认证窗口一」。今天回答一个比「考不考」更重要的问题:认证的价值边界在哪? 它对哪类 JD 是门槛、对哪类是噪声?不搞清楚边界就去刷证,是把时间投到边际为零的地方。
  3. 长文#4 发不发? 接 Day 90 的时间窗口论证——$S(t)$ 在 GA 前最高,发布不可拖。今天发。

贯穿全篇的主线:作品(长文+代码)是主资产,认证是边界明确的辅助资产。搞反主辅,就会陷入「刷了一堆证却没有一个能讲清楚的作品」的求职陷阱。

关键内容

A. v1.0 交付复盘:物证 × 状态三态对照

W13 收口,先把 P3 的交付物按「物证文件 × 状态」列清。状态严格分三态——已实现(代码真实产出)/ 实测估算(口径定了、数字待跑批回填)/ 设计待落地(接口/伪代码已设计、函数 W 后实装)。混淆三态是简历造假的温床。

交付物物证文件状态备注
规则基线评测src/aml/evalBaseline.ts✅已实现recall 1.0×3、normal FPR 5.6%(代码真实算出)
66 案金标 + V11 80 案src/aml/__tests__/✅已实现P1 建,确定性
6 类失效分类法src/aml/failureTaxonomy.ts✅已实现P1 建
lead-sub 编排src/agent/orchestrator/✅已实现P2 建
RAG 混合检索 RRFsrc/agent/rag/hybridSearch.ts✅已实现P2 建
durable checkpointsrc/agent/durable/checkpointMachine.ts✅已实现P2 建
gateway 语义缓存src/agent/gateway/semanticCache.ts✅已实现P2 建(教学模拟,头注诚实标注)
judge κ 校准src/aml/judgeCalibration.ts🟡设计待落地Day 17 设计公式,函数 W3 落、真实标注后测 κ
$/案件三段分解budget.ts 扩 caseId/layer🟡实测估算$0.43/$0.51 为设计估算,W13 跑批回填
SAR LLM 草稿src/aml/sarNarrative.ts🟡设计待落地prompt+rubric+接口,无 key 降级 ruleTemplateSar,未接 LLM
长文#4 旗舰docs/aipa/longform/longform4-*.md🟡骨架→正文中Day 90 骨架,正文逐章补,今日发布

反直觉洞察①(三态混淆是简历最大的隐性风险,比「没做」更危险):直觉觉得「把估算说得肯定一点、把设计说成已实现,简历更好看」。但在金融/架构岗的深度面试里,这是自杀——面试官随手深挖一层(「你这 $0.51/SAR 是怎么测出来的?跑了多少案?」)就会戳穿,而一旦戳穿一个夸大,整份作品的可信度归零。反过来,一个候选人能清清楚楚说「这部分是实测、这部分是设计估算口径待回填、这部分 LLM 还没接但接口和降级都写好了」,传递的是工程诚实——这在合规相关岗位(AML 本身就是合规)是比能力更稀缺的信号。sarNarrative.ts 头注那句「绝不在任何路径上伪造『已接入 LLM』的草稿」不是自我设限,是把诚信刻进代码——长文和简历必须继承这个纪律。

B. AWS AI Practitioner:认证的价值边界

P3 计划安排了「AWS AI Practitioner 考试窗口一」。先把事实钉死(均 2026 核实):AIF-C01,$100,备考约 2-3 周,3 年有效,AWS 最入门的 AI 认证(aws.amazon.com / cbtnuggets 2026)。问题不是「难不难」(不难),而是「值不值」——答案取决于目标 JD 的类型。把价值边界画成一张「认证 vs 作品」的信号矩阵:

JD 类型认证是…作品是…投入建议
云厂商(AWS/Azure 自家 AI 岗)硬门槛(ATS 过滤项)加分
SI / 咨询(埃森哲/德勤类)半门槛(客户要求 partner 认证数)加分
银行/金融 IT(合规驱动采购)信任信号(厂商背书降低供应商风险)加分值得考
AI 原生创业公司 / 产品岗噪声(「builder」看的是能不能 ship)硬门槛别花时间,全押作品
Web3 / 远程 PM-架构(本项目主目标)基本噪声决定性跳过,作品优先

边界的统计依据:「currently 94 open US roles requiring this specific certification」(certdemand 2026)——94 个岗位说明它在特定赛道(云/SI/企业 IT)是真门槛,但相对于整个 AI 岗位池只是一个细分。另一面:「If Cloud Practitioner was the baseline for 2020, AI Practitioner is the baseline for 2026」「AI basics + cloud basics = the new minimum skillset」(flashgenius 2026)——它是地板不是天花板,能帮你过 ATS 过滤,但过不了深度面试。

把「认证 vs 作品」的边际价值写成一个简单的决策规则:

认证的边际价值 ≈ P(JD 把认证设为过滤项) × (它把你挡在门外的损失)

对本项目主目标(Web3/远程 PM-架构):
    P(认证为过滤项) ≈ 低     → 认证边际价值低
    作品的边际价值   ≈ 高     → 时间应押作品(长文#4、$/案件实测)

对潜在备选(银行/金融 IT/SI):
    P(认证为过滤项) ≈ 中      → 认证有边际价值(半门槛)
    → 决策:低成本($100、2-3 周)顺手考一张,作"保底过滤器",
            但绝不让它挤占作品时间。主辅不可倒。

反直觉洞察②(认证的价值是「过 ATS 过滤」,不是「证明能力」——别用它替代作品):直觉把认证当「能力证明」,于是有人刷了一摞证以为竞争力翻倍。但 2026 的「builder」招聘范式说得很直白——「companies prioritize candidates with strong product intuition who can take projects from idea to completion」「hiring managers scan for production signals」(sfstandard / dataexpert.io 2026)。认证证明的是「我学过 AWS 的 AI 服务名词」,作品证明的是「我能把一个真实问题做成能上生产的系统」——后者才是面试官真正在找的。 认证的唯一硬作用是在 ATS 自动过滤这一关不被刷掉(云/SI/银行 JD 把它设为 required 时)。所以正确姿势是:把认证当成「低成本保底过滤器」($100、2-3 周顺手拿),把绝大部分时间押在作品上。用认证替代作品,是把辅助资产当主资产的典型错配。 本项目主目标是 Web3/远程 PM-架构——这里认证基本是噪声,AML Copilot 作品 + 长文#4 才是决定性资产,AWS 证至多是「若转投银行 IT 备选时的保底」。

注意一个时效坑:AI-102 于 2026-06-30 退役 → AI-103 接替(2026-06 上线);AWS ML Specialty 已 2026-03-31 退役(核实 2026-06)。认证体系本身在快速换代——这反过来印证反直觉②:押注一个3 年内会改版、考的是厂商当下产品名词的认证作为核心竞争力,性价比远低于一个展示底层工程能力的作品。作品不会因为 AWS 换个服务名就过期。

C. 长文#4 发布 + W13 收口

接 Day 90 的时间窗口论证:$V(t)=D(t)\times S(t)$ 的峰值在「FIS 宣布(2026-05)→ GA(H2 2026)」窗口内,今天(2026-09-13)在窗口内,$S(t)$ 在 GA 后崩塌,发布不可拖。今天发布长文#4(骨架 + §1/§7 论点段先行,§2-§6 正文随后补,但论点链完整可读)。

W13 收口的「交付 × 证据」总表(作品②的招聘方索引):

W13 交付证据/链接对招聘方的信号
Copilot v1.0src/components/aml/AmlCopilot.tsx 三屏 + Evals 面板能 ship 可演示产品
$/案件单位经济Day 89 笔记 + budget.ts 计量维度懂单位经济/能定价(AISA 信号)
长文#4 旗舰docs/aipa/longform/longform4-*.md能把复杂系统讲成说服性叙事
三护城河硬数字evalBaseline / judgeCalibration / failureTaxonomyproduction signal(非 toy demo)
诚信三态标注各文件头注 + 长文限定语工程诚实(合规岗稀缺信号)

W13 的元复盘:P3 这一周完成了从「能跑的 Copilot」到「能讲清楚、能定价、敢发布」的跃迁。最大的认知收获不是某个技术点,而是作品的价值不在代码本身,而在「能不能把代码组织成一个让招聘方在窗口期内、用三个硬数字、十秒看懂」的叙事——这正是 PM/架构师与纯工程师的分水岭。

设计要点/决策表

要点决策理由
交付状态标注严格三态(已实现/实测估算/设计待落地)三态混淆=简历造假,比「没做」更危险
AWS AI Practitioner主目标(Web3/远程)跳过;银行/SI 备选时低成本顺手考认证对云/SI/银行是门槛,对产品/Web3 是噪声
认证 vs 作品作品是主资产,认证是边界明确的保底过滤器builder 范式看 ship 能力,非认证
认证时效不押会改版的认证作核心竞争力(AI-102→103、ML Specialty 退役)作品不会因厂商改名过期
长文#4今日发布(窗口内,$S(t)$ 将崩塌)保鲜期以季度计,发布不可拖
主辅次序时间分配:作品 ≫ 认证主辅倒置=求职陷阱

对本项目的落地

  • W13 收口产物:本笔记即 W13 周总结(与 P1/P2 周总结同体例);交付物三态表是作品②的「招聘方索引」,与长文#4 §2-§5 的物证指针一一对应(DRY,不重复维护两份清单)。
  • 长文#4 发布docs/aipa/longform/longform4-replicate-fis-anthropic.md 今日落地骨架 + §1/§7 论点段(Day 90 骨架转正文),§2-§6 正文随后补;发布渠道(Mirror/个人站)随作品集主页 docs/MASTER_PORTFOLIO.md 链接,呼应 optimization-roadmap 的「收敛到 3 条叙事」(AML Copilot 是其一)。
  • AWS AI Practitioner 决策落地:对本项目主目标(remote Web3 PM/架构)不投入;仅在简历投向银行 IT/SI 备选赛道时,以「$100、2-3 周」低成本顺手考一张作 ATS 保底——写进求职策略文档(docs/ 求职冲刺计划),明确标「辅助资产,不挤占作品时间」。绝不把刷证写进 P3-P4 的核心学习时间
  • 核心数字单一真相源(再强调):W13 表里的 recall/FPR/$/案件 全部从代码实测读取,长文、简历、周总结三处引用同一份数字,禁止各自硬编码(防漂移,呼应 Day 89/90)。
  • 诚实标注(严格):本笔记交付状态表的「🟡实测估算」「🟡设计待落地」是硬约束——v1.0 发布材料、长文、简历凡引用 $/案件($0.43/$0.51)必标「设计估算 W13 跑批回填」;凡述及 SAR 草稿必标「prompt+rubric,无 key 降级 ruleTemplateSar,未接 LLM」;judge κ 必标「阈值 0.6 为 v1 门槛,真实标注后测算」。延续 P1 Day 27/28、P2 Day 63、Day 89/90 的降本数字诚信纪律。

参考资料

  1. AWS — AWS Certified AI Practitioner (AIF-C01)(官方认证页,持续)+ cbtnuggets Is AIF-C01 Worth It?(2026):$100、备考约 2-3 周、3 年有效、AWS 最入门 AI 认证;2024-10 推出,应对「employer demand for AI-literate candidates exceeds supply」
  2. flashgenius — AWS AI Certifications 2026: AI Practitioner, ML Engineer & GenAI Developer(2026):「If Cloud Practitioner was the baseline for 2020, AI Practitioner is the baseline for 2026」「AI basics + cloud basics = the new minimum skillset」——认证是地板非天花板
  3. certdemand — AWS-AIP Certification (2026 Guide): Requirements, Salary & Jobs(2026):「currently 94 open US roles requiring this specific certification」——认证为特定赛道(云/SI/企业 IT)门槛的统计依据
  4. sfstandard — 'Engineer' is so 2025. In AI land, everyone's a 'builder' now(2026-03)+ dataexpert.io Ultimate Guide to AI Engineering Portfolios(2026):「companies prioritize candidates with strong product intuition who can take projects from idea to completion」「hiring managers scan for production signals」——builder 范式看 ship 能力非认证
  5. 认证时效(核实 2026-06):AI-102 于 2026-06-30 退役 → AI-103(2026-06 上线);AWS ML Specialty 已 2026-03-31 退役——认证体系快速换代,印证「不押会改版的认证作核心竞争力」
  6. 本仓物证:src/aml/evalBaseline.ts(recall/FPR 实测)、judgeCalibration.tsfailureTaxonomy.tssarNarrative.ts(诚实头注)、src/agent/orchestrator/budget.tssrc/components/aml/AmlCopilot.tsxdocs/MASTER_PORTFOLIO.md(2026-06)

SOTA 检查 (2026-09-13)

注:本笔记日历日为 2026-09-13;事实核查与一手原文检索(AWS 认证页、AI-102/103 与 ML Specialty 退役时间、builder 招聘范式、94 roles 统计)在 2026-06-11 完成。$/案件实测回填、长文正文补全在 W13/W13 后进行。

  • 「认证是地板、作品是天花板」在 2026-09 是稳固共识:builder 招聘范式(sfstandard 2026-03)、production-signal 优先(dataexpert.io 2026)、AI Practitioner 作「2026 baseline」(flashgenius 2026)三方口径一致——认证帮过 ATS、作品赢深度面试。本项目「主押作品、认证作银行/SI 备选保底」的决策与此对齐,未见相反信号。
  • 认证体系换代加速,印证「不押认证作核心竞争力」:AI-102→AI-103(2026-06)、ML Specialty 退役(2026-03-31)——一个 3 年内会改版、考厂商当下产品名词的认证,性价比低于展示底层能力的作品。此判断在 2026-09 仍 live。
  • AWS AI Practitioner 仍是「特定赛道门槛」非「通用门槛」:94 US roles requiring(certdemand 2026)说明它在云/SI/企业 IT 是真门槛,但对 Web3/远程 PM-架构(本项目主目标)基本噪声——价值边界判断未变。
  • 过时认知警示:(1) 不可把估算/设计说成已实现——三态混淆是简历自杀(反直觉①);(2) 不可用认证替代作品——认证证明「学过名词」,作品证明「能上生产」(反直觉②);(3) 不可把刷证写进核心学习时间——主辅倒置是求职陷阱。
  • 待跟踪(W13 后):W13 跑批回填 $/案件 实测,更新本表「🟡实测估算」为「✅已实测」;长文#4 §2-§6 正文补全后更新「🟡骨架→正文中」状态;若简历转投银行 IT/SI,再评估是否顺手考 AIF-C01(不挤占 P4 时间);监控 AI-103 是否有金融/合规相关考点变化。