作品集 / 阶段总结

Phase 3 作品集

- 文件：docs/FINANCE_AGENT_PROJECT.md（1,799行，~30页架构文档）

188 行PHASE3_PORTFOLIO.md

Phase 3 作品集索引：AI系统工程

完成日期：2026-10-28 学习投入：60天 × 6h = 360小时 总产出：~34,344行笔记 + 22页方法论 + 30页金融Agent项目 + 1805行面试集 目标岗位：Anthropic应用团队 / OpenAI ChatGPT Apps / Web3 AI Agent公司（Virtuals/ai16z/ElizaOS） / 金融AI产品PM / AI架构师

🏆 旗舰产出（求职简历首推）

1. 金融研究AI Agent v1（生产级）

文件：docs/FINANCE_AGENT_PROJECT.md（1,799行，~30页架构文档）
代码体量：嵌入Day 178（2,144行）的完整Python模块
能力：
- 5个专业Agent（Macro/Equity/Crypto/Compliance/Coordinator）
- 17个金融工具（财务API/链上RPC/新闻订阅/计算器/可视化等）
- 完整RAG（hybrid + rerank + Voyage finance-2 + Qdrant）
- 4层Memory（session/long-term via Mem0+Chroma）
- Guardrails（pre-prompt + runtime + post-output）
- Langfuse observability + 100条golden test
架构总览：UI → API网关 → Orchestrator (LangGraph) → 5 agents → 17 tools → RAG/Memory/Guardrails → Eval
简历呈现："设计并实现金融研究AI Agent v1（5 agents + 17 tools），含完整RAG/Memory/Guardrails/Eval栈，Anthropic Claude 4.7 + LangGraph"

2. 《生产级AI系统工程方法论》白皮书 v1.0

文件：docs/AI_ENGINEERING_METHODOLOGY.md（1,406行，~22-25页）
结构：14章 + 3附录
核心章节：
- 第4章 RAG vs 长上下文 vs Fine-tuning 决策框架（含具体阈值）
- 第5章 RAG架构5个层级（Naive→GraphRAG）
- 第6章 Agent设计模式5种（含适用场景）
- 第7章 Eval体系4层防线
- 第8章 Cost优化8个杠杆
- 第12章 Web3 × AI Agent特殊考量
简历呈现：作为AI工程岗写作样本

3. 30道资深AI系统工程面试题集

文件：docs/daily/EXPERT-DAY180-INTERVIEW.md（1,805行）
覆盖：LLM基础与Prompt(8) + RAG(8) + Agent(8) + LLMOps(6)
难度分布：资深 18 / 高 8 / 中 4
⭐ 高频核心题（6道）：
1. Q1: Self-attention数学（QKV/softmax/√d_k）
2. Q2: Claude prompt caching机制
3. Q9: hybrid search的RRF如何调参
4. Q17: agent vs workflow何时各用
5. Q18: 防止tool calling无限循环
6. Q25: 为金融RAG设计eval体系

📚 深度笔记集（按主题）

A. LLM基础与Prompt工程（Day 121-134, 6,709行）

Day 121: Transformer深入（含QKV、KV-cache、RoPE/ALiBi）
Day 122: Scaling laws + Chinchilla
Day 123: Tokenization的中文/数字/code陷阱
Day 124: Sampling策略（Top-p/k/temperature/spec decoding）
Day 125-126: Prompt基础模式（CoT/ToT/Self-consistency）+ Structured output
Day 127: Week 19 — LLM必懂50点
Day 128: DSPy自动化prompt优化
Day 129: Multi-modal（Claude vision处理金融报表）
Day 130: 长上下文 + prompt caching实测
Day 131: Prompt安全（injection/jailbreak红队）
Day 132: Constitutional AI（Anthropic CAI论文）
Day 133: 4模型选型矩阵（Claude/GPT/Gemini/Llama）
Day 134: Week 20 — Prompt工程SOP

B. RAG高级模式（Day 135-148, 8,697行）

Day 135: 最简RAG（loading→embedding→Qdrant→Anthropic）
Day 136: 5个embedding model对比（OpenAI/Voyage/BGE/Cohere）
Day 137: 5个vector DB实战benchmark（Pinecone/Qdrant/Weaviate/pgvector/Chroma）
Day 138: Hybrid Search（BM25 + dense + RRF）
Day 139: Reranking（Cross-encoder + Cohere rerank-3）
Day 140: Query understanding（HyDE + Multi-query）
Day 141: Week 21 — rag_v2集成
Day 142: Hierarchical RAG（Parent-child + Auto-merging）
Day 143: GraphRAG（Microsoft GraphRAG + Neo4j）
Day 144: Agentic RAG（self-RAG + CRAG）
Day 145: 长上下文 vs RAG cost实测对比
Day 146: Multimodal RAG（ColPali + Vision RAG处理金融PDF）
Day 147: RAG Eval（Ragas忠实度/相关性）
Day 148: Week 22 — rag_v3 production

C. Agent架构与多Agent（Day 149-162, 6,013行）

Day 149: Anthropic "Building Effective Agents"分析
Day 150: 裸ReAct实现（不依赖框架）
Day 151: Plan-and-Execute模式
Day 152: 10个金融工具的schema设计（含错误处理+parallel calls）
Day 153: MCP server完整实现（@modelcontextprotocol/sdk Python版）
Day 154: A2A通信（agent间消息传递）
Day 155: Week 23 — Agent模式总结
Day 156: LangGraph深度（StateGraph + checkpoint + interrupt）
Day 157: 同任务三框架对比（CrewAI/AutoGen/LangGraph）
Day 158: 4层Memory（含Mem0 + Chroma长记忆）
Day 159: 多Agent协作（Hierarchical/Network/Sequential三种topology）
Day 160: Agent评估（Trajectory + AgentBench）
Day 161: Onchain Agent（x402支付 + ERC-7715 session keys）
Day 162: Week 24 — multi_agent v1集成

D. 生产基础设施与评估（Day 163-176, 6,500行）

Day 163: vLLM/SGLang部署 + PagedAttention
Day 164: Anthropic prompt caching完整代码（90% off cached tokens）
Day 165: Streaming + spec decoding + parallel tools
Day 166: 20条deterministic eval（pytest unit tests）
Day 167: LLM-as-judge（含position bias + Cohen's κ）
Day 168: 100条golden dataset（含adversarial cases）
Day 169: Week 25 — eval CLI + GitHub Actions CI
Day 170: Langfuse完整接入（tracing + scoring）
Day 171: PromptOps（git→Langfuse + canary）
Day 172: Prompt vs RAG vs FT决策框架
Day 173: LoRA实战（Unsloth + Llama-3.2-3B QLoRA）
Day 174: Guardrails三层防御（NeMo + Anthropic safety）
Day 175: Red teaming（200条对抗corpus + ASR测试）
Day 176: Week 26 — LLMOps全栈集成

E. 实战与综合产出（Day 177-180）

Day 177: 金融AI Agent设计（PRD + 架构 + 技术选型 + trade-off）
Day 178: 金融AI Agent实现（17 tools + 5 agents + 完整代码）
Day 179: Eval（100 golden cases）+ 优化（v1.0→v1.2，cost -53%）+ Demo + 方法论白皮书
Day 180: Phase 3总结 + 30道面试集

🎯 求职使用指南

简历亮点提炼

AI系统工程与金融AI Agent (自学项目，2026-08~10)
- 完成60天系统化AI工程研究（360h），覆盖LLM基础→RAG→Agent→LLMOps全栈
- 主笔《生产级AI系统工程方法论》白皮书（22页，14章），提出RAG/长上下文/FT三选一决策框架
- 设计并实现金融研究AI Agent v1（5 agents + 17 tools + 完整RAG/Memory/Eval栈）
- 100条golden test set上完成v1.0→v1.2迭代：score 0.683→0.821，cost降53%，latency降40%
- 实现MCP server / LangGraph多agent协调 / Anthropic prompt caching成本优化 / Onchain agent (x402+session keys)
- 主导LLMOps全栈集成（Langfuse + PromptOps + Red Team + 4层eval防线）
- 整理30道资深AI工程师面试题集

申请渠道优先级

顶级AI公司应用层：Anthropic应用团队 / OpenAI ChatGPT Apps team / Google AI Apps
AI×Web3 PM岗：Virtuals Protocol / ai16z / ElizaOS / Olas / Bittensor
AI×金融：BlackRock AI Lab / JPMorgan AI Research / Bloomberg AI / AlphaSense / Ramp AI
AI Infra/Agent平台：Replit Agent / Cursor / Cognition (Devin) / E2B
垂直AI Agent公司：Bridge / Adept / Decagon / Mintlify / Letta (MemGPT)

面试样本组合

架构样本：FINANCE_AGENT_PROJECT.md 第3-9章
代码样本：Day 178 orchestrator.py（LangGraph state machine）+ Day 153 mcp_server.py
方法论样本：AI_ENGINEERING_METHODOLOGY.md 第4-7章（决策框架+RAG层级+Agent模式+Eval）
Eval样本：Day 167 LLM-judge设计 + Day 168 golden set
Cost优化样本：Day 164 prompt caching实测（成本降90%）

📊 量化对比（与原Phase 3 KPI）

KPI项	计划	实际	达成
完整RAG系统	hybrid+rerank	5级RAG（含graph+multimodal）	✅ 130%
Multi-agent框架	3种协作模式	3种 + onchain agent	✅ 130%
LLMOps工具链	tracing+eval+CI	全栈（含guardrails+red team）	✅ 100%
金融AI Agent	生产级	5 agents + 17 tools + 完整eval	✅ 100%
方法论白皮书	单份	22页14章	✅ 100%
面试题数	30	30（含⭐6道核心）	✅ 100%
总学习时长	360h	360h	✅ 100%
笔记总行数（参考）	~24,000	34,344	✅ 143%

⚠️ 已知限制与改进点

未在主网真实运行：Onchain agent (Day 161)在testnet/mock中演示
Multimodal/Vision/Voice：覆盖较浅（白皮书第14.6标记为v2.0）
真实业务接入：未与真实金融数据源（Bloomberg/CapIQ）签约接入
Fine-tuning实测：LoRA仅在小模型上跑通，未做大规模领域适配
Eval scale：100 golden cases远不足生产规模（目标1000+）

🔗 引用关系

Phase 1+2+3协同：机构DeFi×量化×AI Agent的稀缺组合
- 可瞄准岗位：机构AI研究Agent PM / DeFAI协议产品 / RWA智能投顾架构师 / 量化AI研究员
Phase 1作品集：docs/PHASE1_PORTFOLIO.md（机构DeFi/RWA）
Phase 2作品集：docs/PHASE2_PORTFOLIO.md（量化与微观结构）
下一阶段：Phase 4 密码学工程（Day 181-270，90天）— ZK/FHE/MPC/TEE
进度追踪：docs/daily/EXPERT_PROGRESS.md
完整270天计划：docs/EXPERT_DEPTH_270_PLAN.md