AI 系统化学习路线图 2026
当前仓库的 AI 内容已经足够多,问题不是“还缺材料”,而是材料容易被读成碎片:
AI 系统化学习路线图 2026:从论文笔记到产品与架构能力
Date: 2026-06-30
Status: active learning spine
Audience: experienced CBAP / financial retail PM / BA / product architect / solution architect
Purpose: 把现有 AI 论文解读、playbook、case drill 和面试资产重新组织成一条系统学习路径。旧内容不删除;本文件负责告诉你先读什么、怎么读、哪些内容第一遍先跳过。
1. 为什么需要这条主线
当前仓库的 AI 内容已经足够多,问题不是“还缺材料”,而是材料容易被读成碎片:
docs/ai-foundations/papers/已经有大量论文与架构解读,每篇都包含概念、架构、案例、ADR、面试表达和练习。docs/AI_2026_EXPANSION_START_HERE.md已经从启动路径膨胀成资产清单。- 很多内容是高价值的,但如果按文件顺序一篇篇啃,会出现“每篇都完整、整体不成体系”的阅读疲劳。
这条路线图把内容重新拆成三种用途:
| 用途 | 读法 | 对应材料 |
|---|---|---|
| 系统学习 | 按模块建立概念依赖和能力阶梯 | 本文件、AI_FOUNDATIONS_CLASSIC_PAPERS_PLAN.md、ai-foundations/README.md |
| 深度查询 | 遇到具体主题时回到原笔记查细节 | ai-foundations/papers/*.md 和各类 AI_*_PLAYBOOK.md |
| 面试/作品集 | 学完一轮后再整理表达和证据 | AI_INTERVIEW_PORTFOLIO_STORYLINE_PLAYBOOK.md、case drill、capstone |
核心原则:
第一遍读主线,不读完美;第二遍做案例,不追覆盖;第三遍再把面试、ADR、练习补齐。
2. 三遍阅读法
第一遍:建立系统理解
目标是看懂 AI 产品和架构的因果链:
模型能力 -> 上下文/数据 -> 工具/流程 -> 评测/控制 -> 运行证据 -> 产品价值
每篇笔记第一遍只读这些部分:
- 标题下的定位、边界、核心问题。
- 概念图或核心架构模型。
- 金融零售场景映射。
- 指标、控制、证据或 release gate。
第一遍先跳过:
Interview Answer/面试表达7-Day Practice Plan- 过长 checklist
- 详细 ADR 模板
- Source anchors 的完整逐条阅读
这些不是没用,而是第二、三遍用。
第二遍:把知识转成案例
每读完一个模块,选一个金融零售场景做一次小作品:
- AML investigation copilot
- KYC onboarding decision assistant
- payment dispute evidence workbench
- customer-facing policy RAG
- credit lifecycle governance
- AI platform gateway / EvalOps platform
输出不追求多,追求完整闭环:
业务问题 -> 用户/流程 -> AI 适配性 -> 架构方案 -> eval gate -> 风险控制 -> 运营证据
第三遍:整理面试和作品集
第三遍才集中处理面试内容:
- 把每个模块压成 30 秒、2 分钟、deep dive 三种表达。
- 把 ADR 改成自己的真实取舍,不照搬模板。
- 把 checklist 变成评审门禁或作品集证据。
3. 总体课程结构
这不是“174 篇每天一篇”的线性路线,而是 10 个能力模块。
| 模块 | 核心问题 | 主读材料 | 输出 |
|---|---|---|---|
| 0 | 我到底要训练什么能力 | 本文件、AI_EXPANSION_MASTER_INDEX.md、AI_ROLE_COMPETENCY_MATRIX_2026.md | 个人能力目标和证据地图 |
| 1 | LLM 为什么能工作,又为什么不可靠 | papers 01, 04, 05, 10, 11, 22 | 模型能力边界图 |
| 2 | 企业知识如何进入 AI 系统 | papers 02, 13, 14, 23, 31, 93 | RAG / GraphRAG 架构图 |
| 3 | AI 如何从回答走向行动 | papers 03, 12, 15, 16, 21, 27, 42, 99, 100 | Agent 权限与工作流边界 |
| 4 | AI 系统如何被评测和发布 | papers 08, 17, 18, 24, 26, 44, 60, 63, 88, 90 | Eval contract 和 release gate |
| 5 | 数据、模型和成本如何取舍 | papers 06, 07, 09, 28, 30, 37, 41, 45, 57, 59 | build/buy/model route 决策 |
| 6 | 传统 ML/决策智能如何补齐 LLM | papers 34-36, 47-56 | 决策系统组件地图 |
| 7 | 金融零售场景如何落地 | papers 128-147, 139-145 优先 | 1 个端到端金融 AI case |
| 8 | 治理、风险和证据如何系统化 | papers 58, 78, 82, 95-126, 170-174 | AI governance operating model |
| 9 | 产品、组织和架构能力如何沉淀 | papers 67-77, 79-81, 83-94, 150-162 | 作品集故事线和架构评审包 |
4. 12 周系统学习路径
Week 1:模型底座和边界
必读:
docs/ai-foundations/papers/01-attention-is-all-you-need.mddocs/ai-foundations/papers/10-scaling-laws-pretraining-bert-gpt-t5.mddocs/ai-foundations/papers/04-instructgpt-rlhf-alignment.mddocs/ai-foundations/papers/05-chain-of-thought-self-consistency.md
学习问题:
- Transformer 到底解决了什么序列建模问题?
- GPT、BERT、T5 的任务边界有什么不同?
- 为什么模型对齐不能替代产品控制?
- 推理能力为什么必须有证据和升级边界?
输出:
- 一张“模型能力边界图”。
- 一段 2 分钟解释:为什么 LLM 不是数据库、规则引擎或最终决策人。
Week 2:RAG、上下文和知识治理
必读:
docs/ai-foundations/papers/02-retrieval-augmented-generation.mddocs/ai-foundations/papers/13-rag-evaluation-ragas-retrieval-metrics.mddocs/ai-foundations/papers/14-graphrag-knowledge-graph-rag.mddocs/ai-foundations/papers/31-embeddings-ann-vector-search-faiss-hnsw.md
学习问题:
- 企业 RAG 为什么不是“上传文档问答”?
- 检索、rerank、引用、权限、版本和 freshness 如何组成系统?
- GraphRAG 适合什么问题,不适合什么问题?
输出:
- 一个 customer-facing policy RAG 的 C4 container view。
- 一个 RAG eval matrix:retrieval、groundedness、citation、permission、freshness。
Week 3:Agent、工具和权限边界
必读:
docs/ai-foundations/papers/03-react-toolformer-agent-foundations.mddocs/ai-foundations/papers/12-tool-use-security-prompt-injection.mddocs/ai-foundations/papers/16-autogen-multi-agent-orchestration.mddocs/ai-foundations/papers/27-structured-output-constrained-decoding-lmql-guidance.mddocs/ai-foundations/papers/99-ai-agent-autonomy-delegation-architecture.mddocs/ai-foundations/papers/100-ai-agent-identity-delegated-authorization.md
学习问题:
- Agent 和普通 chatbot 的架构差别是什么?
- 工具调用为什么会引入权限、幂等、审计和回滚问题?
- 什么动作必须 human approval?
输出:
- 一个 payment dispute agent 的 action authority matrix。
- 一个 tool gateway ADR:哪些动作只读、哪些动作建议、哪些动作需要审批。
Week 4:EvalOps 和发布门禁
必读:
docs/ai-foundations/papers/08-llm-as-judge-evaluation.mddocs/ai-foundations/papers/17-helm-holistic-evaluation-models.mddocs/ai-foundations/papers/18-model-cards-datasheets-ai-documentation.mddocs/ai-foundations/papers/26-process-supervision-step-by-step-verification.mddocs/ai-foundations/papers/60-cd4ml-mlops-continuous-delivery-ai-release.mddocs/ai-foundations/papers/88-ai-architecture-fitness-functions-continuous-governance.md
学习问题:
- AI eval 和传统 QA/testing 的差异是什么?
- release gate 应该看哪些指标,而不是只看 demo 效果?
- 什么时候可以用 LLM judge,什么时候必须 human review?
输出:
- 一个 eval contract。
- 一个 release evidence bundle checklist。
Week 5:模型组合、成本、性能和路线选择
必读:
docs/ai-foundations/papers/06-lora-peft-adaptation.mddocs/ai-foundations/papers/07-inference-optimization-kv-cache-flashattention-speculative.mddocs/ai-foundations/papers/09-mixture-of-experts-sparse-scaling.mddocs/ai-foundations/papers/28-model-routing-semantic-cache-frugal-ai.mddocs/ai-foundations/papers/41-knowledge-distillation-small-models-quantization.mddocs/ai-foundations/papers/168-ai-model-portfolio-benchmarking-capability-scorecard-selection-governance-architecture.md
学习问题:
- 什么时候 prompt 足够,什么时候 RAG,什么时候 LoRA/fine-tune?
- 成本、延迟、质量、风险如何共同决定 model route?
- 模型组合为什么需要 champion/challenger 和 retirement trigger?
输出:
- 一个 model selection scorecard。
- 一个 cost/SLO routing policy。
Week 6:决策智能和传统 ML 组件
必读:
docs/ai-foundations/papers/34-graph-neural-networks-gnn-fraud-risk-architecture.mddocs/ai-foundations/papers/35-recommender-systems-youtube-wide-deep-two-tower.mddocs/ai-foundations/papers/37-feature-stores-real-time-ml-feast-michelangelo.mddocs/ai-foundations/papers/47-time-series-forecasting-tft-deepar-foundation-models.mddocs/ai-foundations/papers/48-anomaly-detection-isolation-forest-autoencoder-risk-monitoring.mddocs/ai-foundations/papers/49-causal-discovery-dowhy-econml-structural-causal-models.mddocs/ai-foundations/papers/50-optimization-operations-research-or-tools-ai-decisioning.md
学习问题:
- 哪些金融问题不该只用 LLM?
- 预测、排序、推荐、异常检测、优化和因果推断分别解决什么问题?
- LLM 如何作为界面/解释/流程层,而不是替代全部决策系统?
输出:
- 一个“AI system component map”:LLM、RAG、ML model、rules、solver、human review 的职责边界。
Week 7:AI 产品发现和需求工程
必读:
docs/ai-foundations/papers/63-ai-requirements-engineering-gqm-eval-contracts.mddocs/ai-foundations/papers/71-continuous-discovery-opportunity-solution-tree-ai-products.mddocs/ai-foundations/papers/72-jtbd-outcome-driven-innovation-ai-use-case-selection.mddocs/ai-foundations/papers/73-north-star-ai-product-metrics-value-measurement.mddocs/ai-foundations/papers/76-service-blueprint-ai-customer-journey-trust.mddocs/AI_REQUIREMENTS_TO_EVAL_COOKBOOK.md
学习问题:
- AI 需求为什么不能只写 user story?
- 如何把 business outcome 变成 eval、control 和 release gate?
- AI 产品指标如何同时覆盖价值、风险、采用和客户伤害?
输出:
- 一个 AI opportunity brief。
- 一个 requirements-to-eval trace table。
Week 8:AI 架构表达和架构评审
必读:
docs/ai-foundations/papers/64-ai-quality-attributes-atam-architecture-tradeoff.mddocs/ai-foundations/papers/79-enterprise-ai-reference-architecture-control-plane.mddocs/ai-foundations/papers/87-ai-architecture-views-c4-arc42-42010.mddocs/ai-foundations/papers/89-contract-first-ai-tool-api-design-openapi-asyncapi.mddocs/ai-foundations/papers/90-ai-traceability-requirements-eval-control-graph.mddocs/AI_ARCHITECTURE_DIAGRAM_PLAYBOOK.md
学习问题:
- AI architecture view 为什么不能只画组件图?
- stakeholder concern、quality attribute、ADR、eval 和 evidence 如何连接?
- C4、BPMN、DMN、traceability graph 分别用于什么问题?
输出:
- 一个 AI architecture review pack。
- 至少 3 个 ADR:RAG vs fine-tune、tool authority、release gate。
Week 9:金融零售 AI 场景系统化
优先读:
docs/ai-foundations/papers/128-ai-authorized-push-payment-scam-intervention-architecture.mddocs/ai-foundations/papers/131-ai-payment-dispute-chargeback-claims-evidence-architecture.mddocs/ai-foundations/papers/139-ai-credit-lifecycle-underwriting-line-management-governance-architecture.mddocs/ai-foundations/papers/143-ai-account-opening-kyc-onboarding-decision-architecture.mddocs/ai-foundations/papers/144-ai-aml-alert-triage-investigation-workbench-architecture.mddocs/ai-foundations/papers/145-ai-payment-operations-reconciliation-settlement-exception-architecture.mddocs/FINANCIAL_RETAIL_AI_CASE_PORTFOLIO.md
学习问题:
- 金融零售 AI 的高风险点在哪里:客户权益、资金、合规、记录、解释还是操作?
- 哪些场景适合 copilot,哪些适合 decision support,哪些可以自动化?
输出:
- 选一个 flagship case,做一页 solution narrative。
- 把 case 拆成 capability、process、data、AI component、control、evidence。
Week 10:治理、风险、审计和证据
必读:
docs/ai-foundations/papers/58-ai-management-system-iso42001-operating-model.mddocs/ai-foundations/papers/82-ai-control-library-assurance-evidence-graph.mddocs/ai-foundations/papers/95-ai-regulatory-architecture-eu-ai-act-nist-iso42001.mddocs/ai-foundations/papers/96-ai-model-risk-validation-independent-challenge.mddocs/ai-foundations/papers/101-ai-runtime-evidence-observability-architecture.mddocs/ai-foundations/papers/171-ai-evidence-integrity-tamper-evident-audit-ledger-attestation-architecture.mddocs/ai-foundations/papers/174-ai-three-lines-governance-decision-rights-assurance-operating-model-architecture.md
学习问题:
- AI governance 如何从 checklist 变成 operating model?
- 什么证据能证明系统上线时可控,运行中仍然可控?
- 三道防线在 AI lifecycle 中分别拥有什么决策权?
输出:
- 一个 control-to-evidence graph。
- 一个 three-lines decision rights matrix。
Week 11:平台化、组织和运营
必读:
docs/ai-foundations/papers/67-ai-capability-based-planning-business-architecture.mddocs/ai-foundations/papers/69-conway-team-topologies-ai-platform-operating-model.mddocs/ai-foundations/papers/74-ai-product-operating-model-empowered-teams.mddocs/ai-foundations/papers/75-ai-portfolio-management-funding-governance.mddocs/ai-foundations/papers/86-ai-platform-service-catalog-golden-paths.mddocs/ai-foundations/papers/156-ai-product-operations-operating-cadence-outcome-review-architecture.mddocs/AI_PLATFORM_PM_PLAYBOOK.md
学习问题:
- AI 平台到底提供什么能力,避免每个团队重复 POC?
- 产品团队、平台团队、风险合规、审计、业务运营如何协作?
- 如何决定 scale、stop、pivot?
输出:
- AI platform service catalog。
- Quarterly AI portfolio review template。
Week 12:作品集和面试表达
必读:
docs/AI_INTERVIEW_PORTFOLIO_STORYLINE_PLAYBOOK.mddocs/AI_CAPABILITY_ASSESSMENT_RUBRIC.mddocs/AI_ADVANCED_CASE_DRILL_WORKBOOK_60_DAYS.mddocs/abpa/interview/AI_BA_PM_ARCHITECT_INTERVIEW_BANK.md
学习问题:
- 如何把复杂材料讲成 BA、PM、Architect 三种语言?
- 如何证明你不只是会说概念,而是能做 discovery、architecture、governance 和 delivery?
输出:
- 1 个 flagship portfolio case。
- 6 个 2 分钟面试叙事。
- 1 个 capability evidence map。
5. 论文解读笔记的新读法
以前的论文解读笔记每篇都很完整,适合做知识库。现在改成分层阅读:
| 层级 | 要读什么 | 目的 |
|---|---|---|
| A. 主线阅读 | 核心问题、概念图、架构模型、金融案例 | 建立理解 |
| B. 取舍阅读 | ADR、alternatives、failure modes、metrics | 建立判断 |
| C. 输出阅读 | practice、checklist、templates | 做作品集 |
| D. 面试阅读 | 30秒、2分钟、CTO版本 | 准备表达 |
第一遍只读 A。
第二遍读 A + B,并做一个 case。
第三遍读 C + D,把内容转成自己的作品集和面试表达。
单篇笔记阅读模板
每篇最多用 45-60 分钟:
| 时间 | 动作 | 产出 |
|---|---|---|
| 5 min | 看标题、定位、边界 | 这篇解决什么问题 |
| 15 min | 读核心机制和图 | 用自己的话讲清楚 |
| 15 min | 读架构/金融场景 | 映射到一个业务 case |
| 10 min | 读指标/控制/证据 | 形成上线判断 |
| 10 min | 只记录 3 个洞察 | 不整理百科式笔记 |
不要做:
- 不要第一遍就背所有表格。
- 不要第一遍就准备所有面试答案。
- 不要把每篇的 7-day practice 都做完。
- 不要为了“完整”而失去主线。
6. 旧内容如何保留和使用
旧内容继续保留,因为它们有三类价值:
| 旧内容类型 | 保留理由 | 新用法 |
|---|---|---|
| 论文解读正文 | 概念和架构细节完整 | 做深度查询 |
| ADR / checklist / practice | 可转成评审和作品集工件 | 第二遍或 case 阶段使用 |
| 面试问答 | 可训练表达 | 第三遍集中整理 |
后续新增或重写笔记时,优先使用新的学习结构:
1. 学习目标和边界
2. 核心机制
3. 架构模式
4. 金融零售案例
5. 产品/BA/架构判断
6. 指标、控制、证据
7. 附录: ADR / 面试 / 练习 / Source anchors
7. 推荐起步顺序
如果现在重新开始,不要从 174 篇列表第一页开始。
按这个顺序:
- 读本文件,确定 12 周主线。
- 读
docs/AI_EXPANSION_MASTER_INDEX.md的前两节,理解资产分层。 - 读
docs/AI_FOUNDATIONS_CLASSIC_PAPERS_PLAN.md的“定位”和“学习边界”。 - 读
docs/ai-foundations/README.md的“How To Use”和模块地图。 - 从 Week 1 的 4 篇开始读,严格跳过附录。
- 每周只做一个输出,不做全部练习。
最小可行学习闭环:
Week 1 Transformer/RLHF/CoT -> Week 2 RAG -> Week 3 Agent -> Week 4 EvalOps
这 4 周学完后,你应该已经能系统回答:
- 一个 AI 产品为什么不是简单接模型 API?
- RAG、Agent、Eval、Governance 如何组成生产系统?
- 金融零售 AI 为什么必须有权限、证据、升级和责任边界?
8. 旗舰作品集建议
建议不要同时做多个作品集。选一个主案例贯穿 12 周:
| 方向 | 推荐案例 | 为什么适合你 |
|---|---|---|
| AML / 金融犯罪 | AML investigation copilot | 结合金融经验、AI agent、证据、监管、工作流 |
| 支付运营 | payment dispute evidence workbench | 结合支付、客户权益、SLA、证据、自动化 |
| 信贷治理 | credit lifecycle AI governance | 结合 fair lending、adverse action、模型风险 |
| 客服/知识 | customer-facing regulated RAG | 结合产品体验、RAG、引用、投诉和合规 |
| AI 平台 | enterprise AI gateway + EvalOps | 结合架构、平台 PM、治理和成本 |
每个案例最终要能讲清:
- 业务问题和用户。
- 为什么适合 AI,为什么不能全自动。
- 目标流程和体验。
- 架构组件和数据流。
- Eval、control、evidence、human review。
- 上线、监控、incident、scale/stop。
9. 与现有文件的关系
| 文件 | 新定位 |
|---|---|
docs/AI_2026_EXPANSION_START_HERE.md | 保留为资产入口和历史扩展清单,顶部转向本路线图 |
docs/AI_EXPANSION_MASTER_INDEX.md | 资产地图,不再承担课程主线职责 |
docs/AI_FOUNDATIONS_CLASSIC_PAPERS_PLAN.md | 论文与底层机制的详细计划 |
docs/ai-foundations/README.md | 论文笔记索引和模块入口 |
docs/ai-foundations/papers/*.md | 深度知识库和 case/面试素材库 |
docs/AI_BA_PRODUCT_ARCHITECT_180_PLAN.md | 长周期能力建设计划 |
docs/AI_CASE_DRILL_WORKBOOK_30_DAYS.md / AI_ADVANCED_CASE_DRILL_WORKBOOK_60_DAYS.md | 第二遍输出和作品集训练 |
10. 本轮重构原则
- 不删除过去的内容。
- 不把所有笔记一次性改成新模板。
- 先解决阅读主线,再逐步优化单篇结构。
- 论文解读继续保留高阶深度,但要明确第一遍读法。
- 问答、面试、ADR 和练习仍然重要,但不再占据第一学习路径。