返回AI笔记
AI Day 15

AI Day 15: 第一阶段复习与架构总结 — 从概念到全景的知识地图

第一阶段不是14个孤立知识点的堆砌,而是一个完整技术栈的分层构建过程——从硬件和模型基底(Day 1-3),到知识注入和行为控制(Day 4-7),到性能工程(Day 8-9),到能力扩展(Day 10-11),到系统协作(Day 12-13),最后到质量保障(Day 14)。今天的任务是把这些碎片拼成一张可在面试中1分钟讲清的全景图。

2026-04-16
PhaseKnowledge技术栈全景Decision面试汇总Phase

日期:2026-04-16 阶段:第一阶段 — AI/LLM技术深潜 (Day 1-15) 标签Phase Review Knowledge Map 技术栈全景 Decision Framework 面试汇总 Phase 2 Preview


学习路径树

AI/LLM 深度技术学习 50天计划
├── 第一阶段:模型基础 (Day 1-15)
│   ├── Day 1:  Transformer架构与LLM基础 ✅
│   ├── Day 2:  模型量化与本地部署 ✅
│   ├── Day 3:  训练过程深度:Pre-training / SFT / RLHF / DPO ✅
│   ├── Day 4:  Prompt Engineering与上下文学习(ICL)原理 ✅
│   ├── Day 5:  RAG架构:检索增强生成全链路 ✅
│   ├── Day 6:  向量数据库与Embedding模型 ✅
│   ├── Day 7:  Fine-tuning实战:LoRA / QLoRA / Adapter ✅
│   ├── Day 8:  推理优化:vLLM / TensorRT-LLM / SGLang ✅
│   ├── Day 9:  长上下文技术:RoPE扩展 / Ring Attention ✅
│   ├── Day 10: 多模态模型:Vision-Language架构 ✅
│   ├── Day 11: Reasoning模型:CoT / o1 / R1 / Extended Thinking ✅
│   ├── Day 12: Agent框架:ReAct / Tool Use / Planning ✅
│   ├── Day 13: MCP协议与Tool生态 ✅
│   ├── Day 14: 模型评估:Benchmark / Arena / 安全评估 ✅
│   └── Day 15: 阶段复习与架构总结 ← 你在这里
│
├── 第二阶段:工程实践 (Day 16-30)
│   ├── Day 16-20: LLM应用架构设计(微服务/网关/缓存/监控)
│   ├── Day 21-25: 生产级RAG系统(Chunking/Rerank/评估/迭代)
│   └── Day 26-30: Agent系统工程化(状态管理/错误恢复/成本控制)
│
├── 第三阶段:金融零售AI应用 (Day 31-42)
│   ├── Day 31-35: 金融AI(风控模型/智能投顾/合规/反欺诈)
│   ├── Day 36-40: 零售AI(推荐系统/智能客服/供应链预测/营销)
│   └── Day 41-42: CeFi x DeFi x AI融合架构
│
└── 第四阶段:面试冲刺 (Day 43-50)
    ├── Day 43-46: 系统设计面试(LLM平台/RAG/Agent/推荐)
    ├── Day 47-49: 产品/架构面试模拟
    └── Day 50: 总结与作品集

核心概念

一句话定义

第一阶段不是14个孤立知识点的堆砌,而是一个完整技术栈的分层构建过程——从硬件和模型基底(Day 1-3),到知识注入和行为控制(Day 4-7),到性能工程(Day 8-9),到能力扩展(Day 10-11),到系统协作(Day 12-13),最后到质量保障(Day 14)。今天的任务是把这些碎片拼成一张可在面试中1分钟讲清的全景图

回顾方法论

这次复习不是简单"重读笔记",而是三层递进:

Layer 1 — 垂直贯通:把14天的知识排成完整技术栈
  → 每一层解决什么问题?上下层怎么衔接?

Layer 2 — 水平关联:找出跨天的概念连接
  → RAG和Long Context在竞争什么?
  → Agent和Reasoning各自需要什么底层能力?

Layer 3 — 决策框架:从"理解概念"升级到"技术选型"
  → 面对真实需求,我能做出有理有据的架构决策吗?

为什么PM/架构师需要这个全景图

场景需要全景图的原因
面试系统设计需要在白板上从底到顶勾勒LLM应用架构
技术评审判断团队提案是否在正确的层次解决问题
产品规划根据技术成熟度设定产品路线图
成本估算训练/推理/存储各层的成本模型完全不同
供应商选型OpenAI/Anthropic/开源的真正差异在哪一层
风险评估Hallucination/安全/延迟风险分别在哪一层处理

知识点1: LLM技术栈全景图

14天知识组装成一张从底到顶的完整地图

1.1 LLM技术栈分层架构

╔══════════════════════════════════════════════════════════════════════════╗
║                     LLM 技术栈全景图 (Day 1-14 知识地图)                ║
╠══════════════════════════════════════════════════════════════════════════╣
║                                                                        ║
║  ┌─────────────────────────────────────────────────────────────────┐   ║
║  │  Layer 7: 质量保障层 (Day 14)                                    │   ║
║  │  ┌──────────┐ ┌───────────┐ ┌──────────┐ ┌───────────────────┐│   ║
║  │  │Benchmark │ │LLM Arena  │ │Red Team  │ │Safety Evaluation ││   ║
║  │  │MMLU/GPQA │ │Elo Rating │ │对抗测试   │ │合规/偏见/幻觉检测 ││   ║
║  │  └──────────┘ └───────────┘ └──────────┘ └───────────────────┘│   ║
║  └─────────────────────────────────────────────────────────────────┘   ║
║                              ▲                                         ║
║  ┌─────────────────────────────────────────────────────────────────┐   ║
║  │  Layer 6: 系统协作层 (Day 12-13)                                 │   ║
║  │  ┌────────────┐ ┌──────────┐ ┌─────────┐ ┌──────────────────┐│   ║
║  │  │Agent框架   │ │Tool Use  │ │MCP协议  │ │Multi-Agent系统  ││   ║
║  │  │ReAct/Plan  │ │Function  │ │JSON-RPC │ │A2A/Orchestrator ││   ║
║  │  │LangGraph   │ │Calling   │ │标准化接口│ │CrewAI/AutoGen   ││   ║
║  │  └────────────┘ └──────────┘ └─────────┘ └──────────────────┘│   ║
║  └─────────────────────────────────────────────────────────────────┘   ║
║                              ▲                                         ║
║  ┌─────────────────────────────────────────────────────────────────┐   ║
║  │  Layer 5: 能力扩展层 (Day 10-11)                                 │   ║
║  │  ┌────────────────────┐  ┌──────────────────────────────────┐ │   ║
║  │  │多模态 VLM           │  │Reasoning 推理增强                 │ │   ║
║  │  │Vision Encoder+LLM  │  │CoT / o1 / R1 / Extended Thinking│ │   ║
║  │  │图像/视频/音频理解    │  │Test-Time Compute / PRM / ORM    │ │   ║
║  │  └────────────────────┘  └──────────────────────────────────┘ │   ║
║  └─────────────────────────────────────────────────────────────────┘   ║
║                              ▲                                         ║
║  ┌─────────────────────────────────────────────────────────────────┐   ║
║  │  Layer 4: 性能工程层 (Day 2, 8-9)                                │   ║
║  │  ┌────────────┐ ┌──────────────┐ ┌──────────────────────────┐│   ║
║  │  │模型量化     │ │推理优化       │ │长上下文                   ││   ║
║  │  │GPTQ/AWQ    │ │vLLM/TRT-LLM  │ │RoPE Scaling              ││   ║
║  │  │GGUF/EXL2   │ │PagedAttention │ │Ring/Flash Attention      ││   ║
║  │  │INT4→8GB跑  │ │Continuous     │ │KV Cache压缩              ││   ║
║  │  │7B/14B模型  │ │Batching       │ │1M+ Token窗口             ││   ║
║  │  └────────────┘ └──────────────┘ └──────────────────────────┘│   ║
║  └─────────────────────────────────────────────────────────────────┘   ║
║                              ▲                                         ║
║  ┌─────────────────────────────────────────────────────────────────┐   ║
║  │  Layer 3: 知识注入与行为控制层 (Day 4-7)                          │   ║
║  │  ┌──────────┐ ┌──────────┐ ┌───────────┐ ┌──────────────────┐│   ║
║  │  │Prompt    │ │RAG       │ │VectorDB & │ │Fine-tuning       ││   ║
║  │  │Engineer- │ │检索增强   │ │Embedding  │ │LoRA/QLoRA        ││   ║
║  │  │ing / ICL │ │生成      │ │HNSW/IVF   │ │Adapter方法       ││   ║
║  │  │Zero/Few  │ │Query→    │ │Pinecone/  │ │领域适配           ││   ║
║  │  │Shot/CoT  │ │Retrieve→ │ │Weaviate/  │ │<1%参数更新        ││   ║
║  │  │          │ │Generate  │ │Qdrant     │ │                  ││   ║
║  │  └──────────┘ └──────────┘ └───────────┘ └──────────────────┘│   ║
║  └─────────────────────────────────────────────────────────────────┘   ║
║                              ▲                                         ║
║  ┌─────────────────────────────────────────────────────────────────┐   ║
║  │  Layer 2: 模型训练层 (Day 3)                                      │   ║
║  │  ┌────────────┐  ┌──────────────┐  ┌────────────────────────┐│   ║
║  │  │Pre-training│  │SFT           │  │Alignment               ││   ║
║  │  │万亿Token   │  │指令微调       │  │RLHF / DPO / GRPO      ││   ║
║  │  │Next Token  │  │对话格式      │  │人类偏好对齐              ││   ║
║  │  │Prediction  │  │几万条高质数据 │  │Constitutional AI       ││   ║
║  │  │Scaling Laws│  │              │  │                        ││   ║
║  │  └────────────┘  └──────────────┘  └────────────────────────┘│   ║
║  └─────────────────────────────────────────────────────────────────┘   ║
║                              ▲                                         ║
║  ┌─────────────────────────────────────────────────────────────────┐   ║
║  │  Layer 1: 模型架构层 (Day 1)                                      │   ║
║  │  ┌────────────────────────────────────────────────────────────┐│   ║
║  │  │         Transformer (Decoder-Only)                        ││   ║
║  │  │  Self-Attention → Multi-Head → FFN → 残差连接 → LayerNorm ││   ║
║  │  │  位置编码: RoPE   注意力优化: GQA/MLA   架构: Dense/MoE   ││   ║
║  │  │  Tokenizer: BPE/SentencePiece   KV Cache: 推理核心瓶颈   ││   ║
║  │  └────────────────────────────────────────────────────────────┘│   ║
║  └─────────────────────────────────────────────────────────────────┘   ║
║                              ▲                                         ║
║  ┌─────────────────────────────────────────────────────────────────┐   ║
║  │  Layer 0: 硬件基础层                                              │   ║
║  │  GPU (NVIDIA A100/H100/H200)  |  TPU  |  推理芯片 (Groq)       │   ║
║  │  HBM显存 (决定模型大小上限)   |  NVLink (多卡通信)               │   ║
║  └─────────────────────────────────────────────────────────────────┘   ║
╚══════════════════════════════════════════════════════════════════════════╝

1.2 各层的核心问题与PM决策点

层级核心问题PM/架构师决策
L0 硬件多少GPU、什么型号预算和部署方式(云API vs 自建GPU集群)
L1 架构Dense还是MoE、多大模型模型选型的基础:参数量→能力→成本
L2 训练怎么炼出好模型评估开源模型的训练质量,判断是否需要SFT
L3 知识注入怎么让模型用上我的数据RAG vs Fine-tuning vs Long Context的选择
L4 性能怎么又快又便宜延迟SLA、并发量、成本预算三角平衡
L5 能力扩展怎么处理图片/复杂推理是否需要多模态?推理问题是否值得额外Token开销?
L6 系统协作怎么让AI完成复杂任务Agent的自主性边界、工具权限、失败回退策略
L7 质量保障怎么知道效果好不好评估指标选择、上线标准、持续监控方案

1.3 数据流视角:一次用户请求如何穿透技术栈

用户提问: "分析这份PDF年报中的风险因素"
         │
         ▼
┌─ Layer 6 ─ Agent判断需要多步操作 ─────────────────────────┐
│  Planning: 1.解析PDF  2.提取风险章节  3.分析总结           │
│  Tool Selection: PDF解析工具 + 检索工具                     │
└────────────┬──────────────────────────────────────────────┘
             ▼
┌─ Layer 5 ─ 多模态处理 ──────────────────────────────────┐
│  Vision Encoder处理PDF中的图表                            │
│  OCR提取表格数据                                          │
└────────────┬────────────────────────────────────────────┘
             ▼
┌─ Layer 3 ─ RAG检索 + Prompt构造 ────────────────────────┐
│  Embedding模型将PDF切片向量化                              │
│  VectorDB检索最相关的风险段落                               │
│  Prompt模板注入检索结果 + 用户问题                          │
└────────────┬────────────────────────────────────────────┘
             ▼
┌─ Layer 4 ─ 推理执行 ────────────────────────────────────┐
│  vLLM / TRT-LLM 高效推理                                 │
│  KV Cache管理长上下文                                      │
│  Continuous Batching并发处理                               │
└────────────┬────────────────────────────────────────────┘
             ▼
┌─ Layer 1+2 ─ 模型推理(前向传播) ──────────────────────┐
│  Transformer Decoder逐Token生成                           │
│  Self-Attention计算 → FFN → Softmax → 采样               │
│  训练阶段学到的知识在权重中被激活                            │
└────────────┬────────────────────────────────────────────┘
             ▼
┌─ Layer 7 ─ 质量检查 ────────────────────────────────────┐
│  Hallucination Detection: 检查引用是否准确                 │
│  Safety Filter: 确保输出合规                               │
│  Evaluation Metrics: 记录本次请求的质量分数                 │
└────────────┬────────────────────────────────────────────┘
             ▼
       返回给用户结构化的风险分析报告

知识点2: 14天知识回顾

2.1 每日一句话总结 + 核心收获

Day主题一句话总结核心收获
1Transformer架构Transformer是LLM的引擎,Self-Attention让每个Token关注全局QKV计算、MoE vs Dense、Scaling Laws、KV Cache是性能瓶颈
2量化与本地部署量化让7B模型跑在8GB显卡上,精度损失可控GPTQ/AWQ/GGUF选择、Ollama实操、INT4是成本效率甜点
3训练全流程Pre-training建知识,SFT教格式,RLHF/DPO对齐人类偏好三阶段成本差3个数量级、DPO/GRPO替代复杂RL、数据质量>数量
4Prompt Engineering不改权重,只改输入,就能极大提升输出质量Zero/Few-Shot/CoT技术、System Prompt设计、ICL的本质
5RAG架构先查资料再回答,解决幻觉和知识时效性问题全链路: Index→Retrieve→Generate、Naive→Advanced→Agentic RAG
6VectorDB & Embedding语义搜索的底层基础设施HNSW/IVF算法、Embedding模型选型、MTEB排行榜
7Fine-tuning / LoRA用不到1%的参数更新实现领域适配LoRA/QLoRA原理、何时Fine-tune vs RAG、灾难性遗忘风险
8推理优化同样GPU服务更多用户,每个用户等更短时间PagedAttention、Continuous Batching、Speculative Decoding
9长上下文技术让Transformer处理百万Token级别的输入RoPE扩展、Ring Attention、KV Cache压缩、Long Context vs RAG
10多模态VLMAI同时理解文本、图像和视频VLM = Vision Encoder + Projection + LLM、跨模态对齐
11Reasoning模型AI学会"深度思考",用更多推理时间换更高准确度CoT/o1/R1/Extended Thinking、Test-Time Compute、PRM/ORM
12Agent框架让AI不只聊天,而是自主执行多步任务ReAct循环、Tool Use、Planning策略、Multi-Agent架构
13MCP协议AI的"USB标准",标准化工具连接JSON-RPC协议、Server/Client架构、A2A互操作、OAuth 2.1
14模型评估衡量模型好不好的科学方法Benchmark体系、LLM Arena、Red Teaming、安全评估框架

2.2 掌握度自评

掌握度评级标准:
  ★☆☆☆☆ = 知道概念名词,但说不清原理
  ★★☆☆☆ = 能解释原理,但无法做技术决策
  ★★★☆☆ = 能解释 + 能做选型决策 + 能画架构图
  ★★★★☆ = 能讲清trade-off + 能在面试中深入讨论
  ★★★★★ = 能设计方案 + 能挑战他人方案 + 有实操经验
Day主题掌握度自评说明
1Transformer架构★★★★☆QKV/MHA/FFN能清晰解释,MoE细节还需加深
2量化与本地部署★★★★★有Ollama实操经验,量化选型决策清晰
3训练全流程★★★☆☆三阶段逻辑清楚,GRPO数学细节待加深
4Prompt Engineering★★★★☆日常大量使用,系统方法论已建立
5RAG架构★★★★☆全链路理解透彻,Advanced RAG策略掌握好
6VectorDB & Embedding★★★☆☆选型框架清晰,ANN算法数学细节偏弱
7Fine-tuning / LoRA★★★☆☆原理和选型清楚,缺少真实LoRA训练经验
8推理优化★★★★☆PagedAttention原理深入,Speculative Decoding理解到位
9长上下文★★★☆☆RoPE扩展理解好,Ring Attention工程细节偏弱
10多模态VLM★★★☆☆架构理解清楚,缺少多模态应用实操
11Reasoning模型★★★★☆o1/R1/Extended Thinking差异能讲清,PRM深度足够
12Agent框架★★★★☆ReAct/Planning/Multi-Agent框架对比熟练
13MCP协议★★★★☆协议细节掌握好,有Claude Code实操经验
14模型评估★★★☆☆Benchmark体系了解,实际评估经验不足

2.3 知识密度分布

按知识密度和难度,14天可分为四个梯队:

梯队1 — 基石层(必须烂熟于心):
  Day 1  Transformer    ████████████████████ 高密度高频考点
  Day 3  训练流程        ████████████████████ 面试必问
  Day 5  RAG            ████████████████████ 最常见应用架构

梯队2 — 核心技能(面试中等频率):
  Day 4  Prompt Eng     ████████████████ 日常工作核心
  Day 7  Fine-tuning    ████████████████ RAG vs FT是经典面试题
  Day 8  推理优化        ████████████████ 生产部署必知
  Day 12 Agent          ████████████████ 2025-2026热门方向

梯队3 — 进阶知识(体现深度):
  Day 6  VectorDB       ████████████ 支撑RAG的基础设施
  Day 9  长上下文        ████████████ 正在改变RAG的必要性
  Day 11 Reasoning      ████████████ 前沿方向,快速演进中

梯队4 — 广度知识(加分项):
  Day 2  量化部署        ████████ 本地/边缘场景
  Day 10 多模态          ████████ 特定应用场景
  Day 13 MCP            ████████ 新兴标准,快速普及
  Day 14 评估           ████████ 上线前最后一关

知识点3: 关键概念关联图

14天的知识不是14个独立模块,而是一张彼此交织的网络

3.1 概念关联全景

┌─────────────────────────────────────────────────────────────────────┐
│                     LLM 概念关联图                                    │
│                                                                     │
│   ┌──────────┐         训练出          ┌──────────┐                │
│   │Pre-train │ ─────────────────────→  │Base Model│                │
│   │RLHF/DPO  │    Scaling Laws指导      │Transformer│               │
│   └────┬─────┘                         └─────┬────┘                │
│        │                                     │                      │
│   SFT数据质量                           模型推理时                   │
│   决定对话能力                                │                      │
│        │         ┌───────────────────────────┼──────────┐           │
│        ▼         ▼                           ▼          ▼           │
│   ┌─────────┐  ┌────────┐  ┌─────────┐  ┌──────┐  ┌────────┐     │
│   │Prompt   │  │RAG     │  │Fine-tune│  │量化  │  │推理优化│     │
│   │Engineer │  │检索增强 │  │LoRA     │  │GPTQ  │  │vLLM    │     │
│   └────┬────┘  └───┬────┘  └────┬────┘  │AWQ   │  │Paged   │     │
│        │           │            │        │GGUF  │  │Attn    │     │
│   ICL利用          │       权重更新      └──┬───┘  └───┬────┘     │
│   上下文窗口   ┌───┴───┐   改变行为          │          │           │
│        │       │       │        │        降低显存    提高吞吐       │
│        │  ┌────┴──┐ ┌──┴────┐   │        需求         量          │
│        │  │Vector │ │Embed- │   │          │          │           │
│        │  │DB     │ │ding   │   │          ▼          ▼           │
│        │  │HNSW   │ │Model  │   │     ┌──────────────────┐       │
│        │  └───────┘ └───────┘   │     │  部署环境          │       │
│        │                        │     │  云API / 本地      │       │
│        ▼                        ▼     │  / 边缘            │       │
│   ┌──────────────────────────────┐    └──────────────────┘       │
│   │     长上下文 (Day 9)          │                                │
│   │  RoPE Scaling让窗口扩大       │                                │
│   │  正在"侵蚀"RAG的部分场景      │                                │
│   └──────────┬───────────────────┘                                │
│              │                                                     │
│         支撑更复杂的                                                │
│         Agent任务                                                  │
│              │                                                     │
│   ┌──────────▼─────────────┐      ┌────────────────────┐         │
│   │  Agent (Day 12)        │      │ Reasoning (Day 11) │         │
│   │  ReAct / Planning      │◄────►│ CoT / o1 / R1      │         │
│   │  Tool Use              │ 推理  │ Extended Thinking   │         │
│   │  Multi-Agent           │ 增强  │ Test-Time Compute   │         │
│   └──────────┬─────────────┘      └────────────────────┘         │
│              │                                                     │
│         标准化连接                                                  │
│              │                                                     │
│   ┌──────────▼─────────────┐      ┌────────────────────┐         │
│   │  MCP (Day 13)          │      │ 多模态 (Day 10)     │         │
│   │  JSON-RPC标准           │      │ Vision-Language     │         │
│   │  Tool Server/Client    │◄────►│ 图像/视频理解        │         │
│   │  A2A互操作              │ 多模态│ 扩展Agent感知能力   │         │
│   └────────────────────────┘ Tool └────────────────────┘         │
│              │                                                     │
│              ▼                                                     │
│   ┌────────────────────────┐                                      │
│   │  评估 (Day 14)         │                                      │
│   │  贯穿所有层的质量保障    │                                      │
│   │  Benchmark/Arena/      │                                      │
│   │  Red Team/Safety       │                                      │
│   └────────────────────────┘                                      │
└─────────────────────────────────────────────────────────────────────┘

3.2 四条核心关联链

关联链1: Transformer → Training → Inference (模型生命周期)

Transformer架构(Day 1)
  → 定义了模型的"硬件规格":参数量、层数、注意力头数
  → Pre-training在这个架构上灌入知识(Day 3)
  → SFT/RLHF/DPO在同一架构上调整行为(Day 3)
  → 量化把训练好的权重压缩(Day 2)
  → 推理优化让压缩后的模型高效运行(Day 8)
  → 长上下文技术扩展架构的处理能力(Day 9)

PM决策要点:
  模型选型时,要同时考虑训练质量(L2)和推理成本(L4)
  一个70B Dense模型可能比8x22B MoE效果好但推理贵3倍

关联链2: RAG ←→ Embedding ←→ VectorDB (知识管理三角)

RAG(Day 5) 是"方法论"——先检索再生成
  │
  ├── 依赖 Embedding(Day 6) 做语义表示
  │     → Embedding质量直接决定检索质量
  │     → 中文金融领域需要领域Embedding(BGE-M3/Jina)
  │
  └── 依赖 VectorDB(Day 6) 做高效存储检索
        → HNSW适合低延迟场景
        → IVF-PQ适合超大规模数据
        → 选型影响RAG的延迟和成本

三者的关系像"厨师(RAG) + 食材(Embedding) + 冰箱(VectorDB)"
  → 食材不新鲜(Embedding差) → 做不出好菜
  → 冰箱太小(VectorDB不行) → 存不了足够食材
  → 厨师手艺差(RAG链路差) → 浪费好食材

关联链3: Agent ←→ Tools ←→ MCP (自主执行三角)

Agent(Day 12) 是"大脑"——决定做什么、怎么做
  │
  ├── 通过 Tool Use / Function Calling 执行动作
  │     → Tool的质量决定Agent的能力上限
  │     → Tool的数量越多,Planning越复杂
  │
  └── 通过 MCP(Day 13) 标准化连接工具生态
        → MCP Server暴露能力,Client消费能力
        → A2A协议让Agent之间协作
        → OAuth 2.1保障安全

Agent的能力 = min(LLM推理能力, 可用工具集, 规划策略)
  → 推理能力来自Reasoning(Day 11)的提升
  → 长上下文(Day 9)让Agent记住更多历史
  → 多模态(Day 10)扩展Agent的感知维度

关联链4: Reasoning ←→ CoT ←→ RL (推理增强链)

Prompt Engineering的CoT(Day 4)
  → 是最早的推理增强方法,无需改模型
  → "让我一步步思考" 就能提升推理能力

o1/R1/Extended Thinking(Day 11)
  → 把CoT从Prompt技巧升级为模型能力
  → 通过RL训练(Day 3的GRPO)让模型自发产生推理链
  → Test-Time Compute: 推理时投入更多算力换更好结果

PRM/ORM(Day 11)
  → Process Reward Model评估每一步推理
  → 类似训练阶段的Reward Model(Day 3 RLHF)
  → 但在推理时使用,指导搜索最优推理路径

这条链揭示了一个趋势:
  训练阶段的技术(RL/Reward Model)正在"迁移"到推理阶段
  → 推理时间从固定成本变成可变成本
  → PM需要设计"推理预算"机制

知识点4: 技术选型决策树汇总

从"理解概念"升级到"在真实场景中做决策"

4.1 RAG vs Fine-tuning vs Long Context

                    需要让LLM使用特定知识?
                           │
                    ┌──────┴──────┐
                    │             │
               知识是否经常更新?    否 → 知识是否在训练数据中?
                    │                       │
              ┌─────┴─────┐           ┌─────┴─────┐
              │           │           │           │
             是           否         是           否
              │           │           │           │
              ▼           ▼           ▼           ▼
          ┌──────┐   数据量多大?   Prompt       需要改变
          │ RAG  │       │        Engineering    输出风格?
          │      │  ┌────┴────┐   (Day 4)         │
          └──────┘  │         │              ┌────┴────┐
                 <1000条   >1000条          是         否
                    │         │              │          │
                    ▼         ▼              ▼          ▼
                Few-Shot   Fine-tune     Fine-tune    RAG
                ICL(Day 4) LoRA(Day 7)   LoRA(Day 7)  (Day 5)

决策矩阵:

维度RAGFine-tuningLong ContextPrompt Engineering
知识更新频率高(实时更新)低(需重训)高(每次注入)低(硬编码)
数据量要求无限(向量库扩展)几百到几万条受窗口限制几条示例
成本中(向量库+检索)高(训练GPU)高(长序列推理)低(仅Prompt)
延迟中(检索+生成)低(直接生成)高(长序列)低(直接生成)
适用场景知识库问答、文档搜索领域适配、风格迁移整本书分析简单任务、格式控制
金融案例合规文档查询金融报告生成风格年报全文分析交易分类

4.2 何时使用Reasoning模型

                      任务复杂度评估
                           │
                    ┌──────┴──────┐
                    │             │
             需要多步推理?      简单问答/生成
                    │                  │
              ┌─────┴─────┐            ▼
              │           │       标准LLM
         推理深度?   对延迟敏感?   (GPT-4o / Claude Sonnet)
              │           │
        ┌─────┴───┐  ┌───┴────┐
        │         │  │        │
      深度推理   中等  敏感    不敏感
    (数学/代码)  推理    │        │
        │         │    ▼        ▼
        ▼         ▼  标准LLM  Reasoning模型
    Reasoning   CoT  + CoT    (o3 / R1 /
    模型(o3/R1) Prompt        Extended
                (Day 4)       Thinking)

Reasoning模型决策指南:

适合用Reasoning模型的场景:
  ✅ 多步数学计算(金融建模、风险计算)
  ✅ 复杂代码生成和调试
  ✅ 逻辑推理和策略规划
  ✅ 对准确性要求极高、可容忍高延迟

不适合Reasoning模型的场景:
  ❌ 简单问答和翻译(杀鸡用牛刀)
  ❌ 实时聊天(延迟5-30秒不可接受)
  ❌ 创意写作(不需要逻辑严密性)
  ❌ 高并发低成本场景(Token消耗大3-10倍)

4.3 本地部署 vs 云API

                      部署方式选择
                           │
                    ┌──────┴──────┐
                    │             │
              数据敏感性?        │
                    │             │
              ┌─────┴─────┐      │
              │           │      │
         极度敏感       一般     │
         (金融/医疗)   敏感度    │
              │           │      │
              ▼           │      │
         本地部署      ┌──┴───┐  │
         (Day 2)      │      │  │
         Ollama/      │  调用量多大?
         vLLM本地  ┌──┴──┐   │
                   │     │   │
                 高并发  低量  │
                   │     │   │
                   ▼     ▼   ▼
              自建GPU  云API  云API
              集群     按量计费 (OpenAI/
              (Day 8)         Anthropic/
                              Bedrock)

成本速算公式:

云API月成本 = 日均请求数 × 平均Token数 × Token单价 × 30
自建GPU月成本 = GPU租金 + 运维人力 + 带宽 + 冗余

经验阈值(2026年参考):
  < 100万Token/天  →  云API更划算
  100万-1亿Token/天 →  需要仔细算
  > 1亿Token/天    →  自建大概率划算

4.4 何时使用Agent

                      任务类型判断
                           │
                    ┌──────┴──────┐
                    │             │
               单次交互能完成?      需要多步操作?
                    │                    │
                    ▼                    │
              标准LLM调用         ┌──────┴──────┐
                                 │             │
                            步骤确定?      步骤不确定?
                                 │             │
                                 ▼             ▼
                            Pipeline        Agent
                            (固定流程)      (动态规划)
                                           (Day 12)
                                              │
                                        ┌─────┴─────┐
                                        │           │
                                   需要外部工具?  纯推理
                                        │           │
                                        ▼           ▼
                                  Agent+MCP    Reasoning
                                  (Day 12+13)  模型(Day 11)

Agent自主性光谱:

完全受控 ◄────────────────────────────────────────► 完全自主
   │                                                    │
固定Prompt    Prompt+Tools    ReAct       Planning    全自主Agent
单次调用      函数调用        观察-行动    多步规划    自己定目标
   │             │              │            │            │
 金融报告     查询API        客服Agent    研究Agent    通用助手
 生成         返回结果       多轮对话     搜索+分析    (风险最高)

4.5 综合决策框架

┌──────────────────────────────────────────────────────────────┐
│                  LLM应用技术选型决策框架                       │
├──────────────────────────────────────────────────────────────┤
│                                                              │
│  Step 1: 明确需求                                             │
│  ├── 任务类型:生成/分类/提取/推理/对话/自主执行?             │
│  ├── 质量要求:容错率多少?幻觉后果有多严重?                  │
│  ├── 延迟要求:实时(<1s) / 准实时(<5s) / 离线(>5s)?         │
│  └── 预算约束:月预算多少?是否有GPU资源?                     │
│                                                              │
│  Step 2: 选模型                                               │
│  ├── 需要最强推理 → o3/Claude Opus                            │
│  ├── 需要高性价比 → Claude Sonnet/GPT-4o/Qwen-72B            │
│  ├── 需要本地部署 → Qwen-7B/Llama-8B GGUF量化(Day 2)         │
│  ├── 需要多模态   → GPT-4o/Claude Sonnet(Day 10)             │
│  └── 需要中文特化 → Qwen系列/DeepSeek(Day 1)                 │
│                                                              │
│  Step 3: 选知识注入方式                                       │
│  ├── 知识频繁更新 + 大量文档 → RAG(Day 5+6)                   │
│  ├── 需要改变输出风格/格式   → Fine-tuning(Day 7)             │
│  ├── 少量上下文就够         → Prompt Engineering(Day 4)       │
│  └── 需要分析整本书/长文档  → Long Context(Day 9)             │
│                                                              │
│  Step 4: 选交互模式                                           │
│  ├── 单次问答   → 直接API调用                                 │
│  ├── 需要工具   → Function Calling + MCP(Day 13)             │
│  ├── 多步任务   → Agent框架(Day 12)                           │
│  └── 复杂推理   → Reasoning模型(Day 11)                       │
│                                                              │
│  Step 5: 性能和质量保障                                       │
│  ├── 高并发需求  → 推理优化: vLLM + Continuous Batch(Day 8)   │
│  ├── 成本压缩   → 量化(Day 2) + 模型蒸馏 + 缓存              │
│  └── 质量监控   → Benchmark + 人工评估 + Red Team(Day 14)     │
│                                                              │
└──────────────────────────────────────────────────────────────┘

知识点5: 面试高频题汇总

14天积累的所有核心面试题,按类别整理

5.1 基础架构类

#面试题来源核心答案要点
1解释Transformer的Self-Attention机制Day 1QKV三元组、softmax归一化、Multi-Head并行
2为什么现代LLM都用Decoder-only?Day 1Next Token Prediction统一了所有NLP任务
3MoE和Dense模型的trade-offDay 1激活参数少→推理快,但总参数大→显存多
4什么是Scaling Laws?Day 1参数/数据/算力的幂律关系,指导训练预算分配
5KV Cache是什么,为什么重要?Day 1避免重复计算,但占显存大,是推理瓶颈

5.2 训练与对齐类

#面试题来源核心答案要点
6Pre-training/SFT/RLHF三阶段各做什么?Day 3知识灌入→格式教学→偏好对齐,成本差3个数量级
7DPO相比RLHF的优势?Day 3不需要单独训练Reward Model,训练更稳定
8GRPO是什么?DeepSeek R1怎么训练的?Day 3Group Relative Policy Optimization,纯RL涌现推理
9数据质量vs数据量,哪个更重要?Day 3质量远大于数量,Phi系列用教科书级数据证明
10Constitutional AI是什么?Day 3Anthropic方法:用AI自己评判自己,减少人工标注

5.3 推理与部署类

#面试题来源核心答案要点
11INT4/INT8/FP16量化的trade-offDay 2精度损失vs显存节省vs推理速度,INT4是性价比甜点
12GPTQ vs AWQ vs GGUF选哪个?Day 2GPTQ GPU推理、AWQ激活感知更准、GGUF CPU兼容
13PagedAttention解决了什么问题?Day 8KV Cache内存碎片化,用虚拟内存分页管理
14Continuous Batching vs Static BatchingDay 8动态插入新请求、已完成的立即释放,吞吐量提升2-4x
15Speculative Decoding原理Day 8小模型草稿→大模型验证,降低延迟不损质量

5.4 RAG与知识管理类

#面试题来源核心答案要点
16RAG的完整链路是什么?Day 5文档切片→Embedding→向量存储→检索→Rerank→生成
17RAG vs Fine-tuning什么时候用哪个?Day 5+7知识更新频繁用RAG,改风格/格式用FT,可组合使用
18Embedding模型怎么选?Day 6MTEB排行榜、考虑语言/维度/推理速度、领域适配
19HNSW vs IVF索引的区别Day 6HNSW图搜索延迟低、IVF倒排适合大规模+过滤
20Long Context会替代RAG吗?Day 9不会完全替代:RAG在成本、更新频率、数据规模上仍有优势
21Naive RAG的常见失败原因?Day 5切片粒度不当、检索召回低、缺少Rerank、Prompt差

5.5 Agent与工具类

#面试题来源核心答案要点
22ReAct模式是什么?Day 12Reasoning+Acting循环:思考→行动→观察→再思考
23Single-Agent vs Multi-Agent的选择Day 12复杂度vs可控性的trade-off,大多数场景Single足够
24Agent的Planning策略有哪些?Day 12Task Decomposition、ReWOO、Plan-and-Execute
25MCP协议解决了什么问题?Day 13工具连接标准化,避免每个LLM为每个工具写适配器
26Agent安全性如何保障?Day 12+13权限最小化、人工审批门、操作沙箱、OAuth 2.1

5.6 评估与安全类

#面试题来源核心答案要点
27怎么评估LLM的好坏?Day 14Benchmark(MMLU/HumanEval) + Arena(人类投票) + 领域评估
28如何检测和减少Hallucination?Day 5+14RAG提供引用、自我一致性检查、Fact-checking pipeline
29Red Teaming是什么?Day 14对抗性测试:故意找模型的安全漏洞和失败模式
30LLM上线前需要哪些评估?Day 14功能评估+安全评估+偏见检测+合规检查+成本压测

5.7 综合架构类(面试高频压轴题)

#面试题涉及Day核心答案要点
31设计一个企业级RAG系统5+6+8+14文档处理→Embedding→VectorDB→检索→Rerank→生成→评估
32设计一个智能客服Agent12+13+5+11ReAct架构+知识库RAG+工具MCP+Fallback人工
33如何控制LLM应用成本?2+4+8+9分层路由+缓存+量化+Prompt压缩+批处理
34Reasoning模型如何影响产品设计?11异步架构+推理预算+Streaming+用户预期管理
35从0到1搭建LLM平台的架构?全部API Gateway→模型路由→推理引擎→RAG→Agent→监控→评估

知识点6: 第一阶段遗留问题和盲区

6.1 概念层面的盲区

盲区现状原因第二阶段补救计划
MoE路由机制细节知道Expert/Router概念,不清楚Load Balancing LossDay 1篇幅有限Day 16-20 LLM架构设计时补
GRPO数学推导知道GRPO是Group Relative PO,不清楚数学细节Day 3侧重宏观理解阅读DeepSeek R1论文Section 2
ANN算法数学HNSW/IVF知道概念,不清楚图构建算法Day 6时间不够Day 21-25 生产RAG系统时深入
Ring Attention工程实现理解分布式注意力概念,不清楚通信开销Day 9偏理论结合实际部署时理解
VLM训练细节知道Vision Encoder+Projection+LLM架构,不清楚对齐训练Day 10广度优先Day 31-42 金融AI应用时深入

6.2 实操层面的不足

还缺少的实操经验(第二阶段必须补上):

1. 真实LoRA Fine-tuning
   现状: 理解原理和选型,但没跑过完整训练流程
   计划: Day 21-25 用金融领域数据做一次完整LoRA

2. 生产级RAG系统搭建
   现状: 理解全链路,但没搭过端到端系统
   计划: Day 21-25 搭建包含Chunking/Rerank/评估的完整RAG

3. Agent系统的错误处理和状态管理
   现状: 理解框架和模式,缺少生产环境经验
   计划: Day 26-30 Agent工程化专题

4. 模型评估Pipeline
   现状: 知道Benchmark和方法,没建过自动化评估流程
   计划: Day 21-25 RAG评估部分实操

5. 多模型路由和成本控制
   现状: 知道分层路由策略,没实现过
   计划: Day 16-20 LLM应用架构设计时实现

6.3 知识深度 vs 广度的自我诊断

用"能否应对连续3个追问"来检验深度:

✅ 深度足够(能扛住追问):
  → Transformer架构: QKV → Multi-Head → 为什么GQA更好 → MLA原理
  → RAG链路: 基本链路 → Advanced RAG策略 → Agentic RAG设计
  → Agent: ReAct → Planning策略对比 → Multi-Agent编排
  → Prompt: 基本技巧 → ICL原理 → In-Context Learning的局限性

⚠️ 深度一般(第二个追问可能卡壳):
  → 训练: 三阶段流程 → DPO vs RLHF → GRPO的具体算法?(卡)
  → VectorDB: HNSW概念 → 图构建过程 → 调参经验?(卡)
  → 评估: Benchmark知识 → 自定义评估设计 → 实际案例?(卡)

❌ 深度不够(第一个追问就薄弱):
  → Ring Attention的具体通信协议
  → VLM对齐训练(Contrastive Learning)的数学
  → Speculative Decoding的接受率计算

知识点7: 第二阶段预告

7.1 第二阶段总览: 从概念到工程

第一阶段: "我知道LLM技术栈的每一层是什么"
第二阶段: "我能用这些技术搭建生产级系统"

核心转变:
  概念理解 → 工程实现
  技术选型 → 架构设计
  单点知识 → 系统集成
  理论分析 → 动手实操

7.2 Day 16-30 路线图

┌─────────────────────────────────────────────────────────┐
│  第二阶段:工程实践 (Day 16-30)                           │
├─────────────────────────────────────────────────────────┤
│                                                         │
│  ┌─ Day 16-20: LLM应用架构设计 ──────────────────────┐ │
│  │                                                    │ │
│  │  Day 16: API Gateway + 模型路由                    │ │
│  │    → 多模型统一接口、负载均衡、限流降级             │ │
│  │    → 补第一阶段盲区: 分层路由实现                   │ │
│  │                                                    │ │
│  │  Day 17: Prompt管理与版本控制                       │ │
│  │    → Prompt模板引擎、A/B测试框架                    │ │
│  │    → 衔接Day 4 Prompt Engineering                  │ │
│  │                                                    │ │
│  │  Day 18: 缓存与成本控制                             │ │
│  │    → Semantic Cache、Token预算管理                  │ │
│  │    → 补第一阶段盲区: 成本优化实操                   │ │
│  │                                                    │ │
│  │  Day 19: 可观测性与监控                             │ │
│  │    → 延迟/成本/质量三维监控                         │ │
│  │    → 衔接Day 14评估,延伸到生产监控                 │ │
│  │                                                    │ │
│  │  Day 20: 安全与合规                                 │ │
│  │    → 输入过滤/输出审核/PII脱敏                     │ │
│  │    → 金融场景的特殊合规要求                         │ │
│  └────────────────────────────────────────────────────┘ │
│                                                         │
│  ┌─ Day 21-25: 生产级RAG系统 ─────────────────────────┐ │
│  │                                                    │ │
│  │  Day 21: 文档处理Pipeline(PDF/表格/多语言)        │ │
│  │  Day 22: Chunking策略与Embedding优化               │ │
│  │  Day 23: 高级检索(HyDE/Multi-Query/Rerank)         │ │
│  │  Day 24: RAG评估与迭代(RAGAS/自定义指标)            │ │
│  │  Day 25: 端到端RAG系统搭建实操                      │ │
│  │    → 补第一阶段盲区: LoRA + RAG组合实操             │ │
│  └────────────────────────────────────────────────────┘ │
│                                                         │
│  ┌─ Day 26-30: Agent系统工程化 ───────────────────────┐ │
│  │                                                    │ │
│  │  Day 26: Agent状态管理与持久化                      │ │
│  │  Day 27: 错误恢复与重试策略                         │ │
│  │  Day 28: 成本控制与Token预算                        │ │
│  │  Day 29: Multi-Agent编排实战                        │ │
│  │  Day 30: Agent安全沙箱与权限控制                    │ │
│  │    → 补第一阶段盲区: Agent生产环境经验              │ │
│  └────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────┘

7.3 第二阶段的检验标准

Day 30结束时,必须能做到:

1. 画出完整的LLM应用架构图(15分钟白板题)
   → API Gateway → 路由 → 缓存 → 推理 → RAG → Agent → 监控

2. 搭建一个端到端RAG系统(有代码可运行)
   → 文档处理 → Embedding → VectorDB → 检索 → Rerank → 生成 → 评估

3. 实现一个可靠的Agent系统(有错误处理)
   → ReAct循环 → MCP工具连接 → 状态管理 → 失败回退

4. 解答"设计一个企业级LLM平台"面试题(完整45分钟)
   → 需求分析 → 架构设计 → 技术选型 → 成本估算 → 风险评估

5. 对金融零售场景有针对性的技术方案
   → 知道金融合规对LLM的特殊要求
   → 知道零售推荐和客服的具体架构

今日思考

思考1: 14天最大的认知转变是什么?

入门前的认知:
  "LLM就是ChatGPT,输入问题输出答案,技术上就是一个大模型"

14天后的认知:
  LLM是一个至少7层的技术栈,每一层都有独立的技术选型和trade-off。
  一个看似简单的"智能客服"背后涉及:
    → 模型选型(L1) → 是否Fine-tune(L3) → RAG知识库(L3)
    → 推理优化(L4) → Agent编排(L6) → MCP工具连接(L6) → 质量监控(L7)

  PM/架构师的价值不在于懂每一层的数学,
  而在于知道每一层的trade-off,能在约束条件下做出最优决策。

思考2: 10年金融零售经验和LLM技术的连接点

金融零售背景在LLM领域的独特价值:

1. 风控思维 → Agent安全设计
   传统风控: 交易限额/黑名单/异常检测
   Agent风控: 权限最小化/操作沙箱/人工审批门/Token预算

2. 合规经验 → LLM合规架构
   传统合规: KYC/AML/数据隐私/审计追溯
   LLM合规: PII脱敏/输出过滤/Hallucination检测/决策可解释性

3. 产品迭代方法论 → RAG/Agent的迭代优化
   传统PM: 数据驱动/A-B测试/漏斗分析/留存曲线
   LLM PM: 评估指标/Prompt A-B测试/RAG召回率优化/Agent成功率

4. 系统架构经验 → LLM应用架构
   传统架构: 微服务/消息队列/缓存/限流
   LLM架构: API Gateway/模型路由/Semantic Cache/Token限流

结论: 不是"转行学AI",而是"用AI增强10年积累的领域能力"

思考3: 第一阶段学习方法的反思

做得好的:
  ✅ 每天用金融类比解释技术概念,降低了认知负荷
  ✅ 每天整理面试题,积累了35道高质量问答
  ✅ 按技术栈分层学习,知识结构清晰
  ✅ 前沿技术(Reasoning/MCP/Agent)没落下

需要改进的:
  ⚠️ 实操太少,Day 2之后缺少动手环节
  ⚠️ 有些天的笔记深度不一致(Day 2/9偏简略)
  ⚠️ 概念间的关联在学习过程中发现得太晚
  ⚠️ 没有建立Spaced Repetition机制,早期知识可能遗忘

第二阶段改进:
  → 每天至少1小时实操(写代码/搭系统/跑实验)
  → 每5天做一次概念串联复习
  → 用"教别人"的方式检验理解深度
  → 建立面试题的间隔重复复习计划

面试表达: 1分钟讲清LLM技术栈

30秒版本

LLM技术栈可以分为7层:底层是Transformer架构和训练流程,这决定了模型的基础能力;中间层是知识注入(RAG/Fine-tuning)和性能工程(量化/推理优化),解决"怎么让模型用上我的数据"和"怎么又快又便宜"的问题;上层是能力扩展(多模态/Reasoning)和系统协作(Agent/MCP),让AI能看图、深度思考、自主执行任务;最顶层是评估和安全保障,确保上线质量。作为架构师,核心价值是在每一层的trade-off中做出最优决策。

2分钟深入版本

我把LLM技术栈分为7层来理解:

第一层是模型架构——Transformer的Self-Attention让模型能理解Token间的关系,2025年的趋势是MoE架构用更少激活参数达到更强效果,比如DeepSeek V3只激活37B但总参数671B。

第二层是训练——Pre-training用万亿Token建知识基座,SFT用几万条高质数据教对话格式,RLHF/DPO对齐人类偏好。关键洞察是数据质量远比数量重要。

第三层是知识注入——这是PM最常做决策的层。RAG适合知识频繁更新的场景,Fine-tuning适合改变输出风格,Long Context适合分析长文档,三者可以组合使用。

第四层是性能工程——量化让模型跑在更便宜的硬件上,vLLM的PagedAttention让吞吐量翻倍,长上下文技术在扩展模型的处理能力。

第五六层是能力扩展和系统协作——多模态让AI能看图,Reasoning模型用更多推理时间换更高准确度,Agent让AI自主执行多步任务,MCP标准化了工具连接。

第七层是质量保障——Benchmark评基础能力,Arena评人类偏好,Red Teaming找安全漏洞。

结合我的金融零售背景,我特别关注三个点:一是成本控制(分层路由可降低80%成本),二是合规要求(PII脱敏、Hallucination检测),三是Agent安全(权限最小化、操作沙箱)。这些恰好是金融行业最看重的。


明日预告

Day 16: LLM应用架构设计 — API Gateway与模型路由

从今天开始进入第二阶段: 工程实践

Day 16 核心内容预览:

1. LLM应用的整体架构设计(微服务视角)
2. API Gateway设计:统一入口、鉴权、限流、日志
3. 模型路由策略:根据任务复杂度选择不同模型
4. 负载均衡:多模型实例的流量分配
5. 降级策略:主模型不可用时的Fallback方案
6. 金融场景特殊需求:审计追溯、合规过滤

准备:
  → 回顾Day 8推理优化的部署层知识
  → 回顾Day 14评估的质量监控思路
  → 思考:如果要为一个银行设计LLM平台,架构怎么画?

今日总结

┌────────────────────────────────────────────────────────────────┐
│  Day 15 核心收获                                                │
├────────────────────────────────────────────────────────────────┤
│                                                                │
│  1. LLM技术栈全景图: 7层架构                                    │
│     L0 硬件 → L1 Transformer → L2 训练 → L3 知识注入           │
│     → L4 性能 → L5 能力扩展 → L6 系统协作 → L7 质量保障        │
│                                                                │
│  2. 14天知识回顾: 不是孤立知识点,而是相互关联的网络            │
│     → 4条核心关联链把碎片知识串成体系                           │
│     → 掌握度自评发现3个需要深入的盲区                           │
│                                                                │
│  3. 技术选型决策框架: 5个核心决策树                              │
│     → RAG vs FT vs Long Context vs Prompt Eng                  │
│     → Reasoning模型使用场景                                     │
│     → 本地 vs 云API部署                                         │
│     → 是否使用Agent                                             │
│     → 综合5步选型框架                                           │
│                                                                │
│  4. 面试准备: 35道核心面试题 + 1分钟技术栈讲解                  │
│     → 按6类整理,覆盖基础/训练/推理/RAG/Agent/评估              │
│     → 30秒版和2分钟版面试表达已准备                              │
│                                                                │
│  5. 第二阶段方向: 从概念理解 → 工程实现                         │
│     → 5个实操盲区已识别,有明确补救计划                          │
│     → Day 16开始搭建真实系统                                     │
│                                                                │
│  学习耗时:约 5 小时(复习+整理+反思)                           │
│  下一步:Day 16 LLM应用架构设计 — API Gateway与模型路由         │
│                                                                │
└────────────────────────────────────────────────────────────────┘