返回 Papers
作品集 / 阶段总结

Phase 3 作品集

- 文件:docs/FINANCE_AGENT_PROJECT.md(1,799行,~30页架构文档)

188PHASE3_PORTFOLIO.md

Phase 3 作品集索引:AI系统工程

完成日期:2026-10-28 学习投入:60天 × 6h = 360小时 总产出:~34,344行笔记 + 22页方法论 + 30页金融Agent项目 + 1805行面试集 目标岗位:Anthropic应用团队 / OpenAI ChatGPT Apps / Web3 AI Agent公司(Virtuals/ai16z/ElizaOS) / 金融AI产品PM / AI架构师


🏆 旗舰产出(求职简历首推)

1. 金融研究AI Agent v1(生产级)

  • 文件docs/FINANCE_AGENT_PROJECT.md(1,799行,~30页架构文档)
  • 代码体量:嵌入Day 178(2,144行)的完整Python模块
  • 能力
    • 5个专业Agent(Macro/Equity/Crypto/Compliance/Coordinator)
    • 17个金融工具(财务API/链上RPC/新闻订阅/计算器/可视化等)
    • 完整RAG(hybrid + rerank + Voyage finance-2 + Qdrant)
    • 4层Memory(session/long-term via Mem0+Chroma)
    • Guardrails(pre-prompt + runtime + post-output)
    • Langfuse observability + 100条golden test
  • 架构总览:UI → API网关 → Orchestrator (LangGraph) → 5 agents → 17 tools → RAG/Memory/Guardrails → Eval
  • 简历呈现:"设计并实现金融研究AI Agent v1(5 agents + 17 tools),含完整RAG/Memory/Guardrails/Eval栈,Anthropic Claude 4.7 + LangGraph"

2. 《生产级AI系统工程方法论》白皮书 v1.0

  • 文件docs/AI_ENGINEERING_METHODOLOGY.md(1,406行,~22-25页)
  • 结构:14章 + 3附录
  • 核心章节
    • 第4章 RAG vs 长上下文 vs Fine-tuning 决策框架(含具体阈值)
    • 第5章 RAG架构5个层级(Naive→GraphRAG)
    • 第6章 Agent设计模式5种(含适用场景)
    • 第7章 Eval体系4层防线
    • 第8章 Cost优化8个杠杆
    • 第12章 Web3 × AI Agent特殊考量
  • 简历呈现:作为AI工程岗写作样本

3. 30道资深AI系统工程面试题集

  • 文件docs/daily/EXPERT-DAY180-INTERVIEW.md(1,805行)
  • 覆盖:LLM基础与Prompt(8) + RAG(8) + Agent(8) + LLMOps(6)
  • 难度分布:资深 18 / 高 8 / 中 4
  • ⭐ 高频核心题(6道)
    1. Q1: Self-attention数学(QKV/softmax/√d_k)
    2. Q2: Claude prompt caching机制
    3. Q9: hybrid search的RRF如何调参
    4. Q17: agent vs workflow何时各用
    5. Q18: 防止tool calling无限循环
    6. Q25: 为金融RAG设计eval体系

📚 深度笔记集(按主题)

A. LLM基础与Prompt工程(Day 121-134, 6,709行)

  • Day 121: Transformer深入(含QKV、KV-cache、RoPE/ALiBi)
  • Day 122: Scaling laws + Chinchilla
  • Day 123: Tokenization的中文/数字/code陷阱
  • Day 124: Sampling策略(Top-p/k/temperature/spec decoding)
  • Day 125-126: Prompt基础模式(CoT/ToT/Self-consistency)+ Structured output
  • Day 127: Week 19 — LLM必懂50点
  • Day 128: DSPy自动化prompt优化
  • Day 129: Multi-modal(Claude vision处理金融报表)
  • Day 130: 长上下文 + prompt caching实测
  • Day 131: Prompt安全(injection/jailbreak红队)
  • Day 132: Constitutional AI(Anthropic CAI论文)
  • Day 133: 4模型选型矩阵(Claude/GPT/Gemini/Llama)
  • Day 134: Week 20 — Prompt工程SOP

B. RAG高级模式(Day 135-148, 8,697行)

  • Day 135: 最简RAG(loading→embedding→Qdrant→Anthropic)
  • Day 136: 5个embedding model对比(OpenAI/Voyage/BGE/Cohere)
  • Day 137: 5个vector DB实战benchmark(Pinecone/Qdrant/Weaviate/pgvector/Chroma)
  • Day 138: Hybrid Search(BM25 + dense + RRF)
  • Day 139: Reranking(Cross-encoder + Cohere rerank-3)
  • Day 140: Query understanding(HyDE + Multi-query)
  • Day 141: Week 21 — rag_v2集成
  • Day 142: Hierarchical RAG(Parent-child + Auto-merging)
  • Day 143: GraphRAG(Microsoft GraphRAG + Neo4j)
  • Day 144: Agentic RAG(self-RAG + CRAG)
  • Day 145: 长上下文 vs RAG cost实测对比
  • Day 146: Multimodal RAG(ColPali + Vision RAG处理金融PDF)
  • Day 147: RAG Eval(Ragas忠实度/相关性)
  • Day 148: Week 22 — rag_v3 production

C. Agent架构与多Agent(Day 149-162, 6,013行)

  • Day 149: Anthropic "Building Effective Agents"分析
  • Day 150: 裸ReAct实现(不依赖框架)
  • Day 151: Plan-and-Execute模式
  • Day 152: 10个金融工具的schema设计(含错误处理+parallel calls)
  • Day 153: MCP server完整实现(@modelcontextprotocol/sdk Python版)
  • Day 154: A2A通信(agent间消息传递)
  • Day 155: Week 23 — Agent模式总结
  • Day 156: LangGraph深度(StateGraph + checkpoint + interrupt)
  • Day 157: 同任务三框架对比(CrewAI/AutoGen/LangGraph)
  • Day 158: 4层Memory(含Mem0 + Chroma长记忆)
  • Day 159: 多Agent协作(Hierarchical/Network/Sequential三种topology)
  • Day 160: Agent评估(Trajectory + AgentBench)
  • Day 161: Onchain Agent(x402支付 + ERC-7715 session keys)
  • Day 162: Week 24 — multi_agent v1集成

D. 生产基础设施与评估(Day 163-176, 6,500行)

  • Day 163: vLLM/SGLang部署 + PagedAttention
  • Day 164: Anthropic prompt caching完整代码(90% off cached tokens)
  • Day 165: Streaming + spec decoding + parallel tools
  • Day 166: 20条deterministic eval(pytest unit tests)
  • Day 167: LLM-as-judge(含position bias + Cohen's κ)
  • Day 168: 100条golden dataset(含adversarial cases)
  • Day 169: Week 25 — eval CLI + GitHub Actions CI
  • Day 170: Langfuse完整接入(tracing + scoring)
  • Day 171: PromptOps(git→Langfuse + canary)
  • Day 172: Prompt vs RAG vs FT决策框架
  • Day 173: LoRA实战(Unsloth + Llama-3.2-3B QLoRA)
  • Day 174: Guardrails三层防御(NeMo + Anthropic safety)
  • Day 175: Red teaming(200条对抗corpus + ASR测试)
  • Day 176: Week 26 — LLMOps全栈集成

E. 实战与综合产出(Day 177-180)

  • Day 177: 金融AI Agent设计(PRD + 架构 + 技术选型 + trade-off)
  • Day 178: 金融AI Agent实现(17 tools + 5 agents + 完整代码)
  • Day 179: Eval(100 golden cases)+ 优化(v1.0→v1.2,cost -53%)+ Demo + 方法论白皮书
  • Day 180: Phase 3总结 + 30道面试集

🎯 求职使用指南

简历亮点提炼

AI系统工程与金融AI Agent (自学项目,2026-08~10)
- 完成60天系统化AI工程研究(360h),覆盖LLM基础→RAG→Agent→LLMOps全栈
- 主笔《生产级AI系统工程方法论》白皮书(22页,14章),提出RAG/长上下文/FT三选一决策框架
- 设计并实现金融研究AI Agent v1(5 agents + 17 tools + 完整RAG/Memory/Eval栈)
- 100条golden test set上完成v1.0→v1.2迭代:score 0.683→0.821,cost降53%,latency降40%
- 实现MCP server / LangGraph多agent协调 / Anthropic prompt caching成本优化 / Onchain agent (x402+session keys)
- 主导LLMOps全栈集成(Langfuse + PromptOps + Red Team + 4层eval防线)
- 整理30道资深AI工程师面试题集

申请渠道优先级

  1. 顶级AI公司应用层:Anthropic应用团队 / OpenAI ChatGPT Apps team / Google AI Apps
  2. AI×Web3 PM岗:Virtuals Protocol / ai16z / ElizaOS / Olas / Bittensor
  3. AI×金融:BlackRock AI Lab / JPMorgan AI Research / Bloomberg AI / AlphaSense / Ramp AI
  4. AI Infra/Agent平台:Replit Agent / Cursor / Cognition (Devin) / E2B
  5. 垂直AI Agent公司:Bridge / Adept / Decagon / Mintlify / Letta (MemGPT)

面试样本组合

  • 架构样本:FINANCE_AGENT_PROJECT.md 第3-9章
  • 代码样本:Day 178 orchestrator.py(LangGraph state machine)+ Day 153 mcp_server.py
  • 方法论样本:AI_ENGINEERING_METHODOLOGY.md 第4-7章(决策框架+RAG层级+Agent模式+Eval)
  • Eval样本:Day 167 LLM-judge设计 + Day 168 golden set
  • Cost优化样本:Day 164 prompt caching实测(成本降90%)

📊 量化对比(与原Phase 3 KPI)

KPI项计划实际达成
完整RAG系统hybrid+rerank5级RAG(含graph+multimodal)✅ 130%
Multi-agent框架3种协作模式3种 + onchain agent✅ 130%
LLMOps工具链tracing+eval+CI全栈(含guardrails+red team)✅ 100%
金融AI Agent生产级5 agents + 17 tools + 完整eval✅ 100%
方法论白皮书单份22页14章✅ 100%
面试题数3030(含⭐6道核心)✅ 100%
总学习时长360h360h✅ 100%
笔记总行数(参考)~24,00034,344✅ 143%

⚠️ 已知限制与改进点

  1. 未在主网真实运行:Onchain agent (Day 161)在testnet/mock中演示
  2. Multimodal/Vision/Voice:覆盖较浅(白皮书第14.6标记为v2.0)
  3. 真实业务接入:未与真实金融数据源(Bloomberg/CapIQ)签约接入
  4. Fine-tuning实测:LoRA仅在小模型上跑通,未做大规模领域适配
  5. Eval scale:100 golden cases远不足生产规模(目标1000+)

🔗 引用关系

  • Phase 1+2+3协同:机构DeFi×量化×AI Agent的稀缺组合
    • 可瞄准岗位:机构AI研究Agent PM / DeFAI协议产品 / RWA智能投顾架构师 / 量化AI研究员
  • Phase 1作品集docs/PHASE1_PORTFOLIO.md(机构DeFi/RWA)
  • Phase 2作品集docs/PHASE2_PORTFOLIO.md(量化与微观结构)
  • 下一阶段:Phase 4 密码学工程(Day 181-270,90天)— ZK/FHE/MPC/TEE
  • 进度追踪docs/daily/EXPERT_PROGRESS.md
  • 完整270天计划docs/EXPERT_DEPTH_270_PLAN.md