AI Day 67: AI产品策略框架 — Build vs Buy、定价、PMF与增长
AI Day 67: AI产品策略框架 — Build vs Buy、定价、PMF与增长
日期: 2026-06-07 | 阶段: 第六阶段 · AI前沿补完 (Day 61-70) | 主题: AI Product Strategy Framework 标签: #AI产品策略 #定价 #PMF #BuildVsBuy #增长 #商业模式
学习路径 / Learning Path
AI/LLM 深度技术学习 70天计划
├── 第一阶段:模型基础 (Day 1-15) ✅
│ ├── Day 1: Transformer与LLM基础 ✅
│ ├── Day 2: 量化与本地部署 ✅
│ ├── Day 3: 训练全流程 ✅
│ ├── Day 4: Prompt Engineering ✅
│ ├── Day 5: RAG架构 ✅
│ ├── Day 6: 向量数据库与Embedding ✅
│ ├── Day 7: 微调技术 ✅
│ ├── Day 8: 推理优化 ✅
│ ├── Day 9: 长上下文技术 ✅
│ ├── Day 10: 多模态模型 ✅
│ ├── Day 11: 推理模型 ✅
│ ├── Day 12: Agent框架 ✅
│ ├── Day 13: MCP协议 ✅
│ ├── Day 14: 模型评估 ✅
│ └── Day 15: 阶段一总结 ✅
├── 第二阶段:工程实践 (Day 16-30) ✅
│ ├── Day 16: LLM应用架构 ✅
│ ├── Day 17: 安全与护栏 ✅
│ ├── Day 18: 可观测性 ✅
│ ├── Day 19: 生产RAG·解析与分块 ✅
│ ├── Day 20: 生产RAG·检索与重排 ✅
│ ├── Day 21: 生产RAG·评估与迭代 ✅
│ ├── Day 22: Agent状态与恢复 ✅
│ ├── Day 23: Agent成本优化 ✅
│ ├── Day 24: 多Agent系统 ✅
│ ├── Day 25: Agent测试部署 ✅
│ ├── Day 26: LLM成本工程 ✅
│ ├── Day 27: 多模型编排 ✅
│ ├── Day 28: LLM应用测试 ✅
│ ├── Day 29: 企业LLM平台 ✅
│ └── Day 30: 阶段二总结 ✅
├── 第三阶段:金融零售AI应用 (Day 31-42) ✅
│ ├── Day 31: 金融AI风控 ✅
│ ├── Day 32: 智能投顾与量化 ✅
│ ├── Day 33: 合规与RegTech ✅
│ ├── Day 34: 信贷AI全链路 ✅
│ ├── Day 35: 金融AI总结 ✅
│ ├── Day 36: 零售AI推荐 ✅
│ ├── Day 37: 智能客服 ✅
│ ├── Day 38: 供应链AI ✅
│ ├── Day 39: 智能营销 ✅
│ ├── Day 40: 零售AI总结 ✅
│ ├── Day 41: CeFi×DeFi×AI融合 ✅
│ └── Day 42: AI融合案例与职业 ✅
├── 第四阶段:面试冲刺 (Day 43-50) ✅
│ ├── Day 43: 系统设计·LLM平台 ✅
│ ├── Day 44: 系统设计·RAG系统 ✅
│ ├── Day 45: 系统设计·Agent系统 ✅
│ ├── Day 46: 系统设计·推荐系统 ✅
│ ├── Day 47: 面试·产品AI ✅
│ ├── Day 48: 面试·架构AI ✅
│ ├── Day 49: 面试·行为AI ✅
│ └── Day 50: 学习总结 ✅
├── 第五阶段:动手实战 (Day 51-60) ✅
│ ├── Day 51: 本地大模型部署全流程 ✅
│ ├── Day 52: RAG系统实战 ✅
│ ├── Day 53: RAG进阶优化 ✅
│ ├── Day 54: LoRA微调实战 ✅
│ ├── Day 55: Agent开发实战 ✅
│ ├── Day 56: MCP Server开发 ✅
│ ├── Day 57: 多模态应用 ✅
│ ├── Day 58: AI全栈开发 ✅
│ ├── Day 59: 性能调优与成本 ✅
│ └── Day 60: 60天总结 ✅
└── 第六阶段:AI前沿补完 (Day 61-70)
├── Day 61: Vibe Coding产品全景 ✅
├── Day 62: AI Coding深度产品分析 ✅
├── Day 63: Computer Use与GUI Agent ✅
├── Day 64: Enterprise Agentic AI ✅
├── Day 65: MCP 2026协议生态 ✅
├── Day 66: Voice AI与实时对话Agent ✅
├── Day 67: AI产品策略框架 ← 你在这里
├── Day 68: Physical AI与机器人
├── Day 69: AI产品分析文章
└── Day 70: AI功能MVP + 70天总结
核心概念 / Core Concepts
为什么AI产品需要不同的策略?/ Why AI Products Need Different Strategy
传统SaaS产品: AI产品:
┌──────────────────────┐ ┌──────────────────────┐
│ 确定性输出 │ │ 概率性输出 │
│ 边际成本趋近于零 │ │ 每次推理都有成本 │
│ 功能即护城河 │ │ 功能易被复制 │
│ 按座位收费天经地义 │ │ 座位≠价值,用量≠价值 │
│ Bug是明确的 │ │ 幻觉是模糊的 │
│ 用户预期稳定 │ │ 用户预期指数级增长 │
│ 竞争壁垒: 功能+网络效应 │ │ 竞争壁垒: ????? │
└──────────────────────┘ └──────────────────────┘
AI产品的根本悖论 / The AI Product Paradox:
容易构建,难以差异化。 任何人都可以调用GPT-5 API,用一个周末做出一个"AI写作助手"。 但让它成为一个可持续盈利的产品?这需要完全不同的思维方式。
2026年的现实是残酷的:
- 90%的AI创业公司 将在2年内失败(高于传统创业的70%)
- S&P Global数据: 42%的企业在2025年废弃了大部分AI项目(2024年仅17%)
- 仅5% 的企业AI计划产生了可衡量的收入影响
- 14,000+ AI创业公司在2024年创立,其中5,600+在2026年初已关闭
失败的核心原因并非技术不行,而是 产品策略 出了问题。
AI产品策略的四大支柱 / Four Pillars of AI Product Strategy
┌─────────────────────┐
│ AI产品策略框架 │
│ Product Strategy │
└─────────┬───────────┘
┌─────────┬──────┴──────┬──────────┐
▼ ▼ ▼ ▼
┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐
│Build vs │ │ 定价 │ │ PMF │ │ 增长 │
│ Buy │ │ Pricing │ │验证 │ │ Growth │
│ 决策 │ │ 策略 │ │Product │ │ 策略 │
│Decision │ │ Strategy │ │Market │ │Strategy │
│Framework │ │ │ │ Fit │ │ │
└──────────┘ └──────────┘ └──────────┘ └──────────┘
│ │ │ │
何时自建? 如何收费? 用户真的 如何规模化
何时购买? 成本结构? 需要吗? 增长?
何时微调? 价值捕获? 如何验证? 飞轮在哪?
Build vs Buy 决策框架 / Build vs Buy Decision Framework
2026年的三条路径 / Three Paths in 2026
传统的"Build vs Buy"二选一已经过时。2026年的正确问题是: Build vs Buy vs Fine-tune。
┌──────────────────────────────────────────────────────────────┐
│ AI能力获取决策树 │
│ AI Capability Acquisition │
└──────────────────────┬───────────────────────────────────────┘
│
你的AI需求是否是
核心差异化能力?
│
┌────────┴────────┐
│ │
YES NO
│ │
你有足够的 ┌───┴───┐
专有数据吗? 直接购买
│ SaaS/API
┌──────┴──────┐ (Path C)
│ │
YES NO
│ │
数据量是否 通用AI API
>10万条? 足够好吗?
│ │
┌────┴────┐ ┌────┴────┐
│ │ │ │
YES NO YES NO
│ │ │ │
自研模型 微调 使用 微调开源
(Path A) (Path B) API 模型+RAG
(Path C) (Path B)
三条路径详细对比 / Detailed Path Comparison
| 维度 | Path A: 自研 (Build) | Path B: 微调 (Fine-tune) | Path C: 购买/API (Buy) |
|---|---|---|---|
| 成本 | $500K-$1.5M+/年 | $50K-$200K/年 | $10K-$100K/年 |
| 时间 | 12-24个月 | 2-6个月 | 1-4周 |
| 控制力 | 完全控制 | 中等控制 | 最低控制 |
| 定制性 | 无限 | 中高 | 低-中 |
| 维护负担 | 极高 | 中等 | 极低 |
| 数据隐私 | 完全自主 | 取决于提供商 | 需评估 |
| 人才需求 | ML团队5-15人 | ML工程师2-3人 | 开发者1-2人 |
| 迭代速度 | 慢 | 中等 | 快 |
| 适合阶段 | 成熟期/大企业 | 增长期 | 探索期/MVP |
| 风险 | 高投入,失败代价大 | 中等 | 供应商依赖 |
2026年企业的实际选择 / Real Enterprise Choices in 2026
2026年最成功的企业采用 混合策略 (Hybrid Approach):
┌────────────────────────────────────────────────────┐
│ 2026 混合AI策略 │
│ │
│ 购买 (Buy): │
│ └── 系统级基础设施 (合规、审计、工作流) │
│ └── 非核心AI功能 (翻译、OCR、语音转文字) │
│ │
│ 微调 (Fine-tune): │
│ └── 行业专用模型 (金融风控、医疗诊断) │
│ └── 品牌语调和知识模型 │
│ │
│ 自建 (Build): │
│ └── 差异化体验层 (AI Copilot、Agent工作流) │
│ └── 专有数据处理管线 │
│ └── "用户与AI交互"的核心界面 │
│ │
│ 关键原则: 购买"记录系统",自建"差异化层" │
└────────────────────────────────────────────────────┘
成本深度分析 / Cost Deep Dive
2026年AI推理成本发生了巨大变化:
推理成本演变 (GPT-4级别模型):
2022年底: ~$20.00 / 百万token
2023年中: ~$6.00 / 百万token
2024年中: ~$2.00 / 百万token
2025年中: ~$0.80 / 百万token
2026年初: ~$0.40 / 百万token ← 3年下降 1000倍!
驱动因素:
硬件: 每代GPU提升2-3x推理吞吐量/美元 (H100→B200)
软件: vLLM/TensorRT-LLM将GPU利用率从30-40%提升到70-80%
架构: MoE模型、推测解码、注意力优化
竞争: 开源模型(Llama, Mistral, Qwen)压低价格
关键数据:
2026年,推理占所有AI计算需求的~2/3(2023年仅~1/3)
NVIDIA GB200 NVL72: 推理MoE模型成本降低10x(vs Hopper)
对产品策略的影响: 推理成本的持续下降意味着:
- API方案越来越经济 — 自建的成本优势在缩小
- 用量增长不再可怕 — 但仍需监控,OpenAI 2025年亏损$50亿(收入$37亿)
- 定价弹性增加 — 可以更激进地提供免费层
Build vs Buy 决策检查清单 / Decision Checklist
回答以下问题,根据得分决策:
┌─────────────────────────────────────────────────┐
│ Build vs Buy 评分卡 (每项 1-5 分) │
├─────────────────────────────────────────────────┤
│ │
│ 倾向自建 (Build) 的信号: │
│ □ AI是你的核心产品差异化点? ___/5 │
│ □ 你拥有大量独特的专有数据? ___/5 │
│ □ 对延迟/隐私有极端要求? ___/5 │
│ □ 你有足够的ML人才和预算? ___/5 │
│ □ 你的行业需要定制化程度极高? ___/5 │
│ │
│ 倾向购买 (Buy/API) 的信号: │
│ □ AI只是增强功能,不是核心? ___/5 │
│ □ 你需要快速上市? ___/5 │
│ □ 预算有限,团队不大? ___/5 │
│ □ 用例是通用的(翻译/摘要/分类)? ___/5 │
│ □ 供应商锁定风险可接受? ___/5 │
│ │
│ 评分指南: │
│ Build得分 > 20 且 Buy得分 < 15 → 自建 │
│ Buy得分 > 20 且 Build得分 < 15 → 购买 │
│ 两者都在 15-20 → 混合(微调+API) │
└─────────────────────────────────────────────────┘
AI产品定价策略 / AI Product Pricing Strategy
定价革命: 从座位到成果 / The Pricing Revolution
AI正在彻底重塑SaaS定价模型。2026年的核心趋势:
定价模型演变:
2015-2020: 按座位收费 (Per-Seat)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
"每个用户 $X/月"
代表: Salesforce ($25-$300/user), Slack, Notion
逻辑: 用户数=价值
2020-2023: 按用量收费 (Usage-Based)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
"用多少付多少"
代表: Snowflake, Twilio, AWS
逻辑: 消费量=价值
数据: 85%的SaaS公司在2024年采用了某种形式的用量计费
2024-2025: 混合模式 (Hybrid)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
"基础费+用量"
代表: OpenAI, Cursor, GitHub Copilot
逻辑: 平台费+增量价值
2025-2026: 按成果收费 (Outcome-Based)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
"按解决的问题收费"
代表: Salesforce Agentforce, AI客服Agent
逻辑: 成果=价值
预测: IDC预计2028年70%软件供应商将转向成果定价
2026年AI定价模型全景 / AI Pricing Models Landscape
| 定价模型 | 计费单位 | 代表产品 | 适用场景 | 优势 | 劣势 |
|---|---|---|---|---|---|
| 按Token | $/百万token | OpenAI API, Claude API | 开发者平台 | 透明、弹性 | 用户难预测账单 |
| 按请求 | $/次查询 | Perplexity Pro | 搜索/问答 | 简单易懂 | 质量差异大 |
| 按信用额 | 信用点数 | Cursor, Lovable | 开发工具 | 灵活、可预测 | 信用值不透明 |
| 按座位 | $/用户/月 | GitHub Copilot | 团队工具 | 可预测 | AI不按人头用 |
| 按成果 | $/解决问题 | Agentforce | Agent产品 | 价值对齐 | 归因困难 |
| 订阅制 | 固定月费 | ChatGPT Plus | 消费者 | 最可预测 | 重度用户亏钱 |
| 混合制 | 基础费+用量 | Claude Max | Prosumer | 平衡 | 复杂 |
真实定价案例研究 / Real Pricing Case Studies (2026)
Case 1: Cursor — 信用额模型的标杆
Cursor 定价演变:
2024: 按请求计费 (X次fast/slow请求)
2025.6: 转向信用额制 (Credit-based)
2026: 完全信用额制
当前定价:
┌─────────────┬──────────────┬──────────────────────┐
│ Plan │ 月费 │ 信用额 │
├─────────────┼──────────────┼──────────────────────┤
│ Hobby │ $0 │ 有限免费 │
│ Pro │ $20/月 │ $20等值信用额 │
│ Pro+ │ $60/月 │ $60等值信用额 │
│ Ultra │ $200/月 │ $200等值信用额 │
│ Teams │ $40/人/月 │ $40等值信用额/人 │
└─────────────┴──────────────┴──────────────────────┘
信用消耗规则:
- Auto模式(自动选模型): 无限使用
- 手动选Claude Sonnet/GPT-4: 消耗信用额
- Token定价: ~$0.25/M(缓存), $1.25/M(输入), $6.00/M(输出)
商业成果:
- 接近$10亿ARR (年化经常性收入)
- 数百万用户
- 2022年成立 → 2026年独角兽
策略洞察:
- 将定价与基础设施成本对齐(类似云计算模式)
- Auto模式降低用户决策负担,同时优化成本
- 信用额 = 月费金额 → 心理上"花多少得多少"
Case 2: Claude — 分层订阅 + API双轨
Anthropic Claude 2026定价:
消费者订阅:
┌─────────────┬──────────────┬──────────────────────┐
│ Plan │ 月费 │ 核心权益 │
├─────────────┼──────────────┼──────────────────────┤
│ Free │ $0 │ Sonnet 4.5基础访问 │
│ Pro │ $20/月 │ 全模型 + 标准用量 │
│ Max 5x │ $100/月 │ 5x用量 + 记忆 + 优先 │
│ Max 20x │ $200/月 │ 20x用量 + 全部特权 │
└─────────────┴──────────────┴──────────────────────┘
API定价 (每百万token):
┌─────────────┬──────────────┬──────────────────────┐
│ Model │ 输入 │ 输出 │
├─────────────┼──────────────┼──────────────────────┤
│ Haiku 4.5 │ $1 │ $5 │
│ Sonnet 4.6 │ $3 │ $15 │
│ Opus 4.6 │ $5 │ $25 │
└─────────────┴──────────────┴──────────────────────┘
策略洞察:
- 消费者: 固定月费,可预测
- 开发者: 按Token,弹性
- Batch API + 缓存: 可降低成本高达95%
- 1M上下文窗口无额外收费 → 降低门槛
Case 3: ChatGPT — 广覆盖分层
OpenAI ChatGPT 2026定价:
┌─────────────┬──────────────┬──────────────────────┐
│ Plan │ 月费 │ 定位 │
├─────────────┼──────────────┼──────────────────────┤
│ Free │ $0 │ GPT-5 mini, 有限 │
│ Go │ $8/月 │ 入门级付费, 更快 │
│ Plus │ $20/月 │ 主力, 全模型 │
│ Pro │ $200/月 │ 无限制, GPT-5 Pro │
│ Business │ $25-30/人/月 │ 团队协作 │
│ Enterprise │ 定制 │ 150+人, 定制化 │
└─────────────┴──────────────┴──────────────────────┘
策略洞察:
- 6个层级覆盖从个人到大企业的完整频谱
- Free → Go ($8) 的低门槛: 降低首次付费阻力
- Plus ($20) vs Pro ($200): 10x价格差 → 捕获不同价值感知
- OpenAI仍在亏损: 2025年收入$37亿,亏损$50亿
Case 4: Salesforce Agentforce — 开创性按成果收费
Salesforce Agentforce 2026定价:
定价演变:
V1: $2/对话 (按Conversation)
→ 被批评价格高、不可预测
V2: Flex Credits (推荐)
→ 标准操作20 credits ($0.10)
→ 语音操作30 credits ($0.15)
→ 10万credits = $500
企业版: $550/用户/月 (含100万Flex Credits/年)
不能混用: 一个组织只能选Conversation或Flex Credits
策略洞察:
- 按成果收费的先驱者
- 从$2/conversation到Flex Credits的转型说明:
纯成果定价在实践中很难 → 退回到信用额代理
- 验证了市场对"按工作量而非人头"定价的需求
- 但也暴露了: 定义"成果"本身就很困难
Case 5: GitHub Copilot — 座位制 + 用量溢出
GitHub Copilot 2026定价:
┌─────────────┬──────────────┬──────────────────────┐
│ Plan │ 月费 │ Premium Requests │
├─────────────┼──────────────┼──────────────────────┤
│ Free │ $0 │ 有限 │
│ Pro │ $10/月 │ 包含配额 │
│ Pro+ │ $39/月 │ 更高配额 │
│ Business │ $19/人/月 │ 团队管理 │
│ Enterprise │ $39/人/月 │ 1000+, 定制模型 │
└─────────────┴──────────────┴──────────────────────┘
超出配额: $0.04/次 premium request
策略洞察:
- 保留了开发者熟悉的按座位模型
- 但增加了用量维度(premium requests)
- 超额按次收费 → 混合模式的典型实践
- 说明: 纯座位制在AI时代不够用,但完全放弃也太激进
Case 6: Lovable — 面向Vibe Coding的信用额
Lovable 2026定价:
┌─────────────┬──────────────┬──────────────────────┐
│ Plan │ 月费 │ Credits │
├─────────────┼──────────────┼──────────────────────┤
│ Free │ $0 │ 5/天 │
│ Pro │ $25/月 │ 150/月 + 5/天 │
│ Business │ $50/月 │ 更多 │
│ Enterprise │ 定制 │ 按需 │
└─────────────┴──────────────┴──────────────────────┘
Credit消耗:
- 简单样式调整: ~0.5 credit
- 复杂功能(认证): ~1.2 credits
- Chat模式(无代码修改): 1 credit/消息
策略洞察:
- 基于任务复杂度的可变信用消耗
- 每天5个免费credit → 低门槛尝试
- 含$25/月免费云托管 → 降低总拥有成本
AI产品定价决策框架 / Pricing Decision Framework
选择定价模型的决策树:
你的AI产品类型是什么?
│
┌───┴────────────────────┬────────────────────┐
│ │ │
API/平台 消费者产品 Agent/自动化
│ │ │
按Token/请求 ┌──┴──┐ ┌──┴──┐
│ │ │ │ │
混合: 轻度 重度 可量化 不可量化
基础费+用量 用户 用户 成果 成果
│ │ │ │ │
例: Claude API 免费增值 订阅制 按成果 混合:
(Freemium) 收费 基础费+信用额
│ │ │ │
ChatGPT ChatGPT Agent Salesforce
Free Plus force Flex Credits
单位经济学 / Unit Economics
这是AI产品PM必须理解的核心:
AI产品单位经济学公式:
每用户收入 (Revenue/User)
─────────────────────── = 毛利率
每用户推理成本 (Cost/User)
示例 (2026年典型AI SaaS):
┌────────────────────────────────────────────┐
│ 月订阅收入: $20/用户 │
│ │
│ 成本构成: │
│ - 推理成本(API): $3-8/用户 (15-40%) │
│ - 基础设施: $1-2/用户 (5-10%) │
│ - 其他COGS: $1-2/用户 (5-10%) │
│ ───────────────────────────── │
│ 总COGS: $5-12/用户 │
│ │
│ 毛利率: 40-75% │
│ │
│ 对比传统SaaS毛利率: 80-90% │
│ │
│ ⚠️ AI产品毛利率显著低于传统SaaS! │
└────────────────────────────────────────────┘
关键杠杆:
1. 模型路由 → 简单任务用便宜模型(Haiku vs Opus)
2. 缓存 → 相似查询复用结果(节省50-90%)
3. 批处理 → 非实时任务用Batch API(节省50%)
4. 用量管控 → 设定合理的使用上限
5. 提示词优化 → 更短的prompt, 更少的token
⚠️ 警告: OpenAI 2025年收入$37亿,亏损$50亿
说明即使头部公司也在为单位经济学挣扎
AI产品PMF验证 / AI Product-Market Fit Validation
AI产品PMF的特殊挑战 / Special PMF Challenges for AI
传统产品PMF: AI产品PMF:
┌─────────────────────┐ ┌─────────────────────┐
│ │ │ │
│ "人们想要这个功能 │ │ "人们觉得很酷... │
│ 并愿意付费" │ │ 但不知道每天用 │
│ │ │ 它来做什么" │
│ 信号明确: │ │ │
│ - 用户增长 │ │ 信号模糊: │
│ - 留存率 │ │ - 新鲜感 ≠ 价值 │
│ - 付费转化 │ │ - Demo效果 ≠ 日常用 │
│ - NPS │ │ - "wow" ≠ "need" │
│ │ │ │
└─────────────────────┘ └─────────────────────┘
核心区分: 新鲜感采纳 vs 工作流采纳 (Novelty vs Workflow Adoption)
如果你的用户无法描述你的产品替代或改进了哪个 具体的、反复发生的任务, 你拥有的是新鲜感吸引力,而不是产品市场契合。
AI产品PMF验证框架 / PMF Validation Framework
AI产品PMF验证三环模型
┌─────────────────┐
┌────┤ Problem ├────┐
│ │ (真实痛点) │ │
│ └────────┬────────┘ │
│ │ │
┌────▼──────┐ │ ┌──────▼────┐
│ AI │ │ │ Defend- │
│ Advantage │◄─────┴─────►│ ability │
│(AI独特优势)│ │ (可防守性) │
└───────────┘ └───────────┘
三环必须同时满足:
环1 - Problem (真实痛点):
✓ 用户现在在用什么解决方案?(即使很糟)
✓ 他们每周花多少时间在这个任务上?
✓ 如果你的产品消失,他们会痛苦吗?
环2 - AI Advantage (AI独特优势):
✓ 非AI方案能解决80%的问题吗?
✓ AI在这里提供的是10x改善还是2x?
✓ AI的不确定性(幻觉)在这个场景下可接受吗?
环3 - Defensibility (可防守性):
✓ 竞争对手能在1个月内复制吗?
✓ 你的数据/工作流集成创造了切换成本吗?
✓ 用户使用越多,产品是否越好?(飞轮)
AI-specific PMF信号 vs 传统PMF信号
| 信号类型 | 传统产品 | AI产品 | 说明 |
|---|---|---|---|
| 正向信号 | |||
| 留存率 | DAU/MAU > 20% | DAU/MAU 10-20% (B2B AI) | AI工具使用频率天然低于通讯/社交 |
| 付费转化 | Free→Paid > 3% | Free→Paid > 5% | AI用户付费意愿更高(如果有价值) |
| 使用深度 | 功能覆盖率 | 任务完成率 > 75% | AI产品看的是"任务做完了吗" |
| 口碑 | NPS > 40 | "Second-bite"复用率 | 用户完成第一个项目后是否回来做第二个 |
| 信任度 | Bug报告率 | Override Rate(覆盖率)下降 | 用户越来越少修改AI输出 = 信任 |
| 危险信号 | |||
| 虚假增长 | 注册多但不活跃 | "Wow"多但不复用 | AI的Demo效果天然好,但日常价值未必 |
| 流失原因 | 功能不够 | 质量不稳定 | AI产品的#1流失原因是输出质量波动 |
| 反馈模式 | "需要X功能" | "有时候很好有时候很差" | 概率性输出导致体验不一致 |
2026年AI PMF验证的关键指标
PMF验证仪表盘 (AI Product):
┌─────────────────────────────────────────┐
│ 核心指标 │
│ │
│ 1. Time-to-Value (TTV) │
│ 目标: < 60秒获得第一个价值 │
│ 2026基准: 优秀AI产品TTV < 30秒 │
│ │
│ 2. Intent Resolution Rate (IRR) │
│ 用户意图被成功解决的比率 │
│ 目标: > 80% │
│ │
│ 3. Second-Bite Rate │
│ 完成第一个任务后回来做第二个的比率 │
│ 目标: > 40% │
│ │
│ 4. Override Rate │
│ 用户修改AI输出的比率 │
│ 目标: < 30% (越低=越信任) │
│ │
│ 5. 按用例的留存率 │
│ 不看整体留存,看具体用例留存 │
│ 找到留存最高的那个用例 = PMF起点 │
│ │
└─────────────────────────────────────────┘
2026关键洞察 (Mixpanel数据):
- AI产品用户设备增长26% YoY
- 但总AI事件(event)数量略有下降
- 含义: 更多人用AI,但每人操作更少
- 成熟部署中,成功 = 更少点击、更少提示、更快结果
常见反模式 / Common Anti-Patterns
AI产品PMF失败的5种模式:
❌ 模式1: "AI Wrapper综合症"
──────────────────────────
症状: 产品=漂亮UI + API调用,无差异化
结果: 模型提供商一更新,你就过时
数据: 38%的AI创业失败因为缺乏市场需求
❌ 模式2: "Demo-ware陷阱"
──────────────────────────
症状: Demo很酷,但日常使用场景不明
信号: 注册量高,7天留存 < 10%
本质: 新鲜感 ≠ 产品市场契合
❌ 模式3: "技术找问题"
──────────────────────────
症状: "我们用了最新的GPT-5!" 但用户不在乎
现实: 用户在乎结果,不在乎你用什么模型
解法: 从用户痛点出发,而非从技术能力出发
❌ 模式4: "过度承诺"
──────────────────────────
症状: 营销说"AI自动做一切",实际需要大量人工干预
结果: 期望落差 → 信任崩塌 → 流失
数据: 80%+的AI项目因数据质量问题失败
❌ 模式5: "成本失控"
──────────────────────────
症状: 用户越多越亏钱,重度用户侵蚀利润
根因: 固定订阅价+可变推理成本,无用量管控
教训: 必须设计成本上限和智能路由
AI产品护城河 / AI Product Moats
2026年的残酷现实 / The Brutal Reality of 2026
"如果你的整个业务是 'GPT-5 + 专门的提示词 + 漂亮的UI', 你距离被OpenAI的一次产品更新消灭只有一步之遥。"
传统的功能护城河 (Feature Moat) 在AI时代已经死亡。功能可以在数天内被复制。 那么,什么才是真正的护城河?
AI产品护城河矩阵 / Moat Matrix
防守强度
高 │
│ ┌──────────┐ ┌──────────┐
│ │ 网络效应 │ │ 数据飞轮 │
│ │ Network │ │ Data │
│ │ Effects │ │ Flywheel │
│ └──────────┘ └──────────┘
│
│ ┌──────────┐ ┌──────────┐
│ │ 工作流 │ │ 垂直行业 │
│ │ 深度集成 │ │ 专精 │
│ │Workflow │ │Vertical │
│ │Integration│ │Expertise │
│ └──────────┘ └──────────┘
│
│ ┌──────────┐ ┌──────────┐
│ │ 品牌信任 │ │ 切换成本 │
│ │ Brand │ │Switching │
│ │ Trust │ │ Cost │
│ └──────────┘ └──────────┘
│
低 │ ┌──────────┐ ┌──────────┐
│ │ 功能领先 │ │ 价格竞争 │
│ │ Feature │ │ Price │
│ │ Lead │ │ War │
│ └──────────┘ └──────────┘
└──────────────────────────────────
弱 强
持久性
六大AI护城河详解 / Six AI Moats Explained
护城河1: 数据飞轮 (Data Flywheel)
最强AI护城河:
用户使用产品
│
▼
产生专有数据
(行为、反馈、偏好)
│
▼
数据改善模型
(微调、RAG、排序)
│
▼
产品体验更好
│
▼
吸引更多用户 ──→ 循环加速
│
▼
竞争对手难以追赶
(因为没有你的数据积累)
案例:
- Cursor: 每个开发者的代码补全反馈→改善模型
- Tesla FSD: 行驶数据→改善自动驾驶
- Spotify: 听歌行为→改善推荐
关键: 数据必须是"专有"的
如果你的数据竞争对手也能获取,不算飞轮
护城河2: 工作流深度集成 (Workflow Integration)
切入用户工作流的核心位置:
表面集成 (弱): 深度集成 (强):
┌─────────────────┐ ┌─────────────────┐
│ "可以复制粘贴 │ │ "在我的IDE里 │
│ AI的输出" │ │ 直接修改代码" │
│ │ │ │
│ = 用户可以 │ │ = 离开这个工具 │
│ 随时切换 │ │ 我的效率降50% │
└─────────────────┘ └─────────────────┘
案例:
- Cursor: 直接在编辑器中修改代码 (vs ChatGPT复制粘贴)
- Notion AI: 在你的文档系统中工作 (理解你的笔记结构)
- GitHub Copilot: 在你的代码仓库上下文中补全
护城河3: 垂直行业专精 (Vertical Expertise)
通用AI (弱): 垂直AI (强):
"我能做任何事, "我是最懂医疗/法律/金融
但都做得一般" 的AI,比通用模型好10x"
2026年VC投资方向:
✗ 通用AI助手 → 已饱和
✓ 垂直AI → 医疗、法律、建筑、教育、金融
案例:
- Harvey AI: 法律垂直 (理解判例法、合同格式)
- Viz.ai: 医疗影像 (FDA认证的AI诊断)
- RoofScope: 建筑测量 (人工验证的屋顶数据)
为什么有效:
1. 行业术语和规则复杂 → 通用AI做不好
2. 合规要求高 → 需要行业认证
3. 专有数据 → 行业数据不在公开互联网上
4. 信任门槛高 → 用户更信任行业专家
护城河4: 网络效应 (Network Effects)
用户A使用 → 数据改善 → 用户B受益
案例:
- Waze: 更多司机→更准确的路况
- Stack Overflow + AI: 更多问答→AI回答更好
- Midjourney (社区): 更多创作→更多灵感→更多创作
AI网络效应的特殊性:
传统网络效应: 用户直接互动创造价值
AI网络效应: 用户间接通过数据/模型改善创造价值
护城河5: 品牌信任 (Brand Trust)
在AI时代,信任是稀缺资源:
"AI说的对吗?" → 这是每个用户的隐忧
建立信任的方式:
1. 可解释性: 展示AI决策的推理过程
2. 透明度: 明确告知AI的能力边界
3. 安全记录: 没有重大数据泄露或错误
4. 行业认证: FDA/SOC2/GDPR等合规认证
信任 → 留存 → 口碑 → 更多用户
案例:
- Anthropic: "负责任的AI"品牌定位
- OpenAI: 先发优势建立的品牌认知
护城河6: 切换成本 (Switching Costs)
让用户不想走:
低切换成本: 高切换成本:
- AI写作助手 - 企业知识库(接入了所有文档)
- AI翻译工具 - AI CRM(学习了所有客户偏好)
- 通用ChatBot - AI代码库(理解了整个codebase)
创造切换成本的方法:
1. 积累用户专有数据(对话历史、偏好、自定义规则)
2. 深度集成到现有工具链(API、插件、SSO)
3. 提供迁移出去很痛的数据格式(锁定,但要小心反噬)
4. 建立用户的学习投入(自定义模板、工作流配置)
"API Wrapper"能成功吗?/ Can API Wrappers Succeed?
答案: 短期可以,长期不行。除非你在Wrapper之上建立了真正的护城河。
┌─────────────────────────────────────────────┐
│ API Wrapper的生存策略 │
│ │
│ 注定失败: │
│ × 只有UI + Prompt的包装 │
│ × 没有专有数据 │
│ × 没有工作流集成 │
│ × 没有行业专精 │
│ │
│ 可以存活: │
│ ✓ UI是10x更好的体验 (Cursor vs ChatGPT) │
│ ✓ 深度集成到特定工作流 │
│ ✓ 积累了专有数据用于改善 │
│ ✓ 在特定垂直做到最好 │
│ ✓ 建立了社区和品牌信任 │
│ │
│ 本质: "Wrapper"只是起点,不是终点 │
│ 关键: 你在API之上建立了什么? │
└─────────────────────────────────────────────┘
AI产品增长策略 / AI Product Growth Strategy
PLG在AI时代的进化 / PLG Evolution in the AI Era
2020年 PLG: 2026年 PLG:
"让产品自己说话" "让AI自己证明价值"
核心变化:
┌────────────────────────────────────────────┐
│ │
│ 变化1: "用户"不再只是人类 │
│ 2026年: PLG的"用户"包含AI Agent │
│ Agent需要: API > UI, 文档 > 教程 │
│ │
│ 变化2: 价值时间极短 │
│ 2020: 注册→引导→第一次使用 (分钟级) │
│ 2026: 输入需求→AI设置→看到结果 (<60秒) │
│ │
│ 变化3: 定价必须配合 │
│ 从 per-seat → per-task (WaaS) │
│ 甚至 per-outcome (RaaS) │
│ │
│ 变化4: 混合运营是标配 │
│ Self-serve先让用户试用 │
│ → 企业销售层叠在自助之上 │
│ 2026赢家 = 混合产品驱动+销售驱动 │
│ │
└────────────────────────────────────────────┘
AI产品增长飞轮 / AI Growth Flywheel
┌───────────────┐
│ 更好的模型 │
│ Better Model │
└───────┬───────┘
│
┌──────────────▼──────────────┐
│ │
▼ │
┌──────────────┐ ┌──────┴───────┐
│ 更好的体验 │ │ 更多的数据 │
│ Better UX │ │ More Data │
└──────┬───────┘ └──────────────┘
│ ▲
▼ │
┌──────────────┐ ┌──────┴───────┐
│ 更多的用户 │──────────────▶│ 更多的反馈 │
│ More Users │ │ More Feedback │
└──────────────┘ └──────────────┘
这是AI产品独有的增长飞轮:
- 传统SaaS: 更多用户 → 更多收入 → 更好产品 (线性)
- AI产品: 更多用户 → 更多数据 → 更好模型 → 更好体验 (指数级)
前提: 你必须有数据闭环 (能从用户行为中学习)
增长策略矩阵 / Growth Strategy Matrix
| 策略 | 适用阶段 | 投入 | 效果 | 代表 |
|---|---|---|---|---|
| 免费增值 (Freemium) | 0→1 | 低 | 获客 | ChatGPT Free, Cursor Hobby |
| 病毒传播 (Viral) | 1→10 | 低 | 获客 | "Made with [产品名]" 水印 |
| 内容营销 (Content) | 0→1 | 中 | 品牌 | 技术博客、教程、YouTube |
| 开源策略 (Open Source) | 0→1 | 高 | 信任+社区 | Llama, vLLM, LangChain |
| 社区驱动 (Community) | 1→10 | 中 | 留存+口碑 | Discord社区、用户分享 |
| PLG+销售 (Hybrid) | 10→100 | 高 | 扩展 | 自助→企业销售 |
| API生态 (Platform) | 10→100 | 高 | 锁定 | 成为其他产品的基础设施 |
| Agent网络 (A2A) | 探索 | 中 | 新渠道 | AI Agent作为分发渠道 |
AI产品增长的关键战术 / Key Growth Tactics
战术1: 60秒TTV (Time-to-Value)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━
用户进来 → 输入需求 → AI理解 → 产出结果 → <60秒
不要让用户注册→设置→学习→再使用
让AI替用户完成设置
实践: Lovable → 描述你想要的App → 直接生成
Cursor → 打开项目 → AI已理解你的代码
战术2: 输出即营销 (Output as Marketing)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━
AI产出的内容本身就是传播载体
"Made with Lovable" / "Powered by Claude"
用户分享AI帮他做的东西 → 新用户看到 → 想试试
战术3: 使用越多越好 (Progressive Value)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━
第1天: AI给出通用回答
第30天: AI了解你的风格和偏好
第90天: AI已经像你的私人助理
→ 切换成本随时间指数增长
战术4: 社区+教育 (Community-Led Growth)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━
Discord/论坛/GitHub → 用户互相帮助
教程/模板/最佳实践 → 降低学习门槛
用户生成内容 → 自动化内容营销
战术5: Agent分发渠道 (Agent-Led Growth)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━
2026新趋势: AI Agent作为分发渠道
你的产品被Agent推荐/使用 → 间接获客
做好API/MCP → 让Agent可以调用你的服务
Gartner: 到2026年底, 40%企业应用将包含AI Agent
AI产品指标体系 / AI Product Metrics Framework
AI产品指标金字塔 / AI Metrics Pyramid
┌─────────┐
│ 商业 │ ← 最终看这个
│ 指标 │ (收入、利润)
├─────────┤
┌─┤ 产品 ├─┐
│ │ 指标 │ │ ← PM日常关注
│ ├─────────┤ │ (留存、转化)
┌─┤ │ AI质量 │ ├─┐
│ │ │ 指标 │ │ │ ← AI团队关注
│ │ ├─────────┤ │ │ (准确率、延迟)
┌─┤ │ │ 基础设施 │ │ ├─┐
│ │ │ │ 指标 │ │ │ │ ← 工程团队关注
│ │ │ ├─────────┤ │ │ │ (成本、可用性)
└─┴─┴─┴─────────┴─┴─┴─┘
完整指标清单 / Complete Metrics Checklist
层级1: 商业指标 (Business Metrics)
| 指标 | 计算方式 | 目标 | 说明 |
|---|---|---|---|
| ARR/MRR | 月/年经常性收入 | 持续增长 | 基本功 |
| 毛利率 | (收入-COGS)/收入 | > 60% | AI产品天然低于传统SaaS(80-90%) |
| CAC | 获客总成本/新客数 | 行业依赖 | AI的PLG可降低CAC |
| LTV | 用户生命周期价值 | LTV > 3x CAC | AI留存波动大,需关注 |
| Revenue/User | 单用户收入 | 持续提升 | 监控重度用户的边际成本 |
| Net Revenue Retention | 现有客户收入变化 | > 110% | 含增购/升级/流失 |
层级2: 产品指标 (Product Metrics)
| 指标 | 计算方式 | 目标 | 说明 |
|---|---|---|---|
| DAU/MAU | 日活/月活 | B2B: 10-20% | AI工具天然使用频率低 |
| 激活率 | 完成首次核心操作的比率 | > 50% | 关键: 定义什么是"激活" |
| Second-Bite Rate | 完成首次任务后回来的比率 | > 40% | AI产品的核心PMF指标 |
| Time-to-Value | 从注册到获得价值的时间 | < 60秒 | 2026年的基准线 |
| 付费转化率 | Free→Paid | > 5% | AI产品通常高于传统SaaS |
| 功能采纳率 | 使用AI功能的用户占比 | 持续提升 | 关注哪个功能粘性最高 |
层级3: AI质量指标 (AI Quality Metrics)
| 指标 | 计算方式 | 目标 | 说明 |
|---|---|---|---|
| 任务完成率 | 成功完成任务数/总任务数 | > 80% | 结构化任务可达85-95% |
| 幻觉率 | 含错误信息的输出占比 | < 5% | 客户端应用必须低于5% |
| Override Rate | 用户修改AI输出的比率 | < 30% | 越低=越信任 |
| 首次正确率 | AI第一次就给出正确答案的比率 | > 70% | 影响用户效率和信任 |
| 响应延迟 | 从请求到响应的时间 | < 3秒 | 超过5秒用户开始流失 |
| 满意度评分 | 用户对AI输出的评价 | > 4/5 | 需要收集显式反馈 |
层级4: 基础设施指标 (Infrastructure Metrics)
| 指标 | 计算方式 | 目标 | 说明 |
|---|---|---|---|
| Cost per Query | 每次推理的成本 | 持续下降 | 模型路由+缓存优化 |
| GPU利用率 | GPU使用率 | > 70% | 2026年优化后可达70-80% |
| 缓存命中率 | 缓存命中/总请求 | > 40% | 直接降低成本 |
| 可用性 | 正常运行时间 | > 99.9% | AI服务宕机 = 功能丧失 |
| Token效率 | 有效输出token/总token | 持续提升 | Prompt优化的核心 |
AI产品仪表盘设计 / Dashboard Design
┌─────────────────────────────────────────────────────┐
│ AI Product Health Dashboard │
├─────────────────────────────────────────────────────┤
│ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ MRR │ │ DAU/MAU │ │ Gross Margin│ │
│ │ $XXX,XXX │ │ XX% │ │ XX% │ │
│ │ ↑ 12% MoM │ │ ↑ 3% MoM │ │ ↑ 2% MoM │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
│ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ Task Compl. │ │ Override │ │ Cost/Query │ │
│ │ Rate: XX% │ │ Rate: XX% │ │ $0.XXX │ │
│ │ ↑ 5% MoM │ │ ↓ 3% MoM │ │ ↓ 8% MoM │ │
│ └─────────────┘ └─────────────┘ └─────────────┘ │
│ │
│ ┌─────────────────────────────────────────────┐ │
│ │ Retention by Use Case │ │
│ │ ┌────────────────────────────────┐ │ │
│ │ │ Code Gen ████████████████ 72% │ ← PMF! │ │
│ │ │ Summarize ██████████ 45% │ │ │
│ │ │ Chat ████████ 38% │ │ │
│ │ │ Translate ██████ 28% │ │ │
│ │ └────────────────────────────────┘ │ │
│ └─────────────────────────────────────────────┘ │
│ │
│ 关键洞察: 按用例看留存率,找到PMF最强的场景 │
│ 然后 Double Down 在那个场景上 │
└─────────────────────────────────────────────────────┘
AI产品失败模式 / AI Product Failure Patterns
2026年AI产品失败全景 / Failure Landscape
AI产品失败原因分布 (2026年数据):
缺乏市场需求 ████████████████████████ 38%
不可持续的经济模型 ██████████████████ 28%
数据质量问题 ████████████████ 25%
团队能力不足 ██████████████ 22%
竞争/被平台吞噬 ████████████ 18%
合规/监管问题 ████████ 13%
技术债务 ██████ 10%
(数据来源: 2026年多份行业报告综合)
注: 一个产品可能有多个失败原因,总和>100%
7种失败模式详解 / Seven Failure Patterns
失败模式1: 成本死亡螺旋 (Cost Death Spiral)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
发生过程:
产品获得用户 → 用户使用增加 → 推理成本飙升
→ 每用户利润变负 → 限制使用(用户体验变差)
→ 用户流失 → 收入下降 → 无法投入改善 → 死亡
预防:
1. 从Day 1就设计成本管控(用量上限、模型路由)
2. 定价包含用量维度(不要纯固定订阅)
3. 监控"重度用户占比"和"边际成本/用户"
案例教训: OpenAI 2025年亏损$50亿
失败模式2: 质量不一致 (Quality Inconsistency)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
发生过程:
用户体验1: "太棒了! 正是我要的!"
用户体验2: "什么垃圾? 完全不对!"
→ 用户无法信任产品 → 放弃使用
本质: AI的概率性输出 = 体验不一致
预防:
1. 为高风险场景添加护栏(guardrails)
2. 设计优雅的错误处理("我不确定"好于乱回答)
3. 用评估套件持续监控输出质量
4. 提供用户反馈渠道并实际响应
失败模式3: 过度承诺 (Over-Promising)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
营销说: "AI自动处理一切,解放你的双手"
现实: 需要大量Prompt调试、手工校验、人工介入
→ 期望落差 → 信任崩塌 → 退款/流失
预防:
1. 设定合理预期: "AI协助,人类决策"
2. 明确能力边界: 告诉用户AI不擅长什么
3. 逐步扩展: 先在小范围做好,再扩大
失败模式4: 平台风险 (Platform Risk)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
你的产品完全依赖OpenAI/Anthropic的API
→ 平台推出了竞品功能
→ 你的差异化消失
→ 或者API提价/限制
→ 你的经济模型崩溃
预防:
1. 多模型策略(不依赖单一提供商)
2. 在API之上建立真正的护城河
3. 核心逻辑要可以迁移
失败模式5: 规模失效 (Scaling Failure)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
Demo很好 → 小规模试点很好 → 大规模部署崩溃
原因: AI在长尾场景中的表现不可预测
预防:
1. 渐进式扩展,而非大爆炸式部署
2. 为每个场景建立评估基准
3. 允许人工回退(Human-in-the-loop)
失败模式6: 没有留存 (No Retention)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
注册曲线漂亮 → 7天留存悬崖 → 30天几乎归零
原因: 新鲜感驱动,而非工作流驱动
预防:
1. 从"解决一次性问题"转向"嵌入日常工作流"
2. 建立习惯循环(cue→routine→reward)
3. 提供progressive value(越用越好)
失败模式7: 合规雷区 (Compliance Minefield)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
特别是在金融、医疗、教育领域:
- 数据隐私(GDPR/CCPA)
- 算法偏见(EU AI Act)
- 行业监管(FDA/SEC/MiCA)
预防:
1. 从Day 1就考虑合规
2. 聘请合规顾问
3. 记录AI决策的可解释性
AI PM的日常工作框架 / AI PM Daily Workflow
2026年AI PM的角色定义 / AI PM Role in 2026
传统PM: AI PM:
需求分析 + 数据管线设计
PRD撰写 + 模型评估与选择
项目管理 + 提示词工程监督
用户研究 + AI输出质量监控
数据分析 + 成本与延迟优化
上市策略 + 伦理与合规审查
+ AI特有的用户体验设计
2026年数据:
- 70%+ PM每日使用AI工具
- AI PM岗位增长超过传统PM
- 核心技能: 技术理解 + 商业判断 + 伦理意识
AI PM工作流模板 / AI PM Workflow Template
┌─────────────────────────────────────────────────┐
│ AI PM 每周工作节奏 │
├─────────────────────────────────────────────────┤
│ │
│ 周一: 数据日 (Data Day) │
│ ├── 审查上周AI质量指标(幻觉率、完成率) │
│ ├── 分析成本趋势(cost/query变化) │
│ └── 识别异常模式(突然的质量下降?) │
│ │
│ 周二-三: 产品日 (Product Day) │
│ ├── 用户反馈分析(特别是AI输出的负面反馈) │
│ ├── Prompt/模型优化方案评审 │
│ └── 新AI功能的可行性评估 │
│ │
│ 周四: 策略日 (Strategy Day) │
│ ├── 竞品AI功能变化追踪 │
│ ├── 模型提供商更新评估(新模型、价格变化) │
│ └── 长期路线图更新 │
│ │
│ 周五: 复盘+规划 │
│ ├── 本周AI实验结果总结 │
│ ├── 下周优先级排序 │
│ └── 团队知识分享(新发现的AI模式/反模式) │
│ │
└─────────────────────────────────────────────────┘
AI PM决策框架: 要不要加AI功能? / Should We Add AI?
不是所有功能都需要AI!
决策清单:
□ 这个问题用规则/算法能解决吗?
如果能 → 用规则,更可靠
如果不能 → 继续
□ AI在这个场景下的错误可接受吗?
如果不可接受(金融交易、医疗诊断) → 人工审核
如果可接受(内容建议、搜索增强) → 继续
□ 用户能判断AI输出的对错吗?
如果能 → AI辅助模式(Human-in-the-loop)
如果不能 → 极高风险,谨慎评估
□ AI带来的改善是10x还是2x?
如果2x → 可能不值得(AI的维护成本高)
如果10x → 值得投入
□ 推理成本在商业模型中可承受吗?
计算: 预估用量 × 单次成本 ≤ 可接受的COGS占比
面试题 / Interview Questions
Q1: 如何为AI产品设计定价策略?
简短回答 (30秒): AI产品定价的核心挑战是推理成本与价值交付不对齐。2026年的最佳实践是混合模式:基础订阅费保证可预测收入,加上用量/信用额维度对齐边际成本。关键是避免纯固定订阅(重度用户会侵蚀利润)和纯用量计费(用户怕账单不可预测)。
详细回答 (2分钟):
AI产品定价需要考虑四个维度:
1. 成本结构: AI产品与传统SaaS最大的不同是边际成本不趋近于零。每次推理都消耗GPU资源,虽然成本在快速下降(3年降了1000倍),但仍然显著。毛利率通常在40-75%,低于传统SaaS的80-90%。
2. 价值度量: 选择什么作为定价单位。按Token对开发者平台有效(Claude API),按信用额对工具类产品有效(Cursor),按成果对Agent类产品有效(Salesforce Agentforce)。核心原则是定价单位应该与用户感知到的价值对齐。
3. 混合模型设计: 2026年主流做法是"基础费+用量"的混合模式。比如Cursor的信用额模式,月费=$20,同时获得$20等值的信用额,Auto模式无限使用但手选高级模型消耗信用。这平衡了可预测性和成本对齐。
4. 价格层级: 设计合理的层级覆盖不同用户群。ChatGPT的六层设计(Free/Go/Plus/Pro/Business/Enterprise)覆盖了从试用到大企业的完整频谱,其中Free→Go的$8低门槛降低首次付费阻力。
追问准备:
- Q: AI推理成本下降会不会让定价变得不重要?A: 成本下降让你有更多空间,但用量增长同样迅猛。关键是建立成本监控和动态调整机制。
- Q: 纯按成果定价可行吗?A: 理论上最理想,但实践中"成果"的定义和归因很困难。Salesforce从$2/conversation退到Flex Credits就说明了这一点。
Q2: AI产品的护城河在哪里?"API Wrapper"能成功吗?
简短回答 (30秒): 纯API Wrapper(只有UI+Prompt)不可持续,因为模型提供商的一次更新就能消灭你。真正的护城河来自数据飞轮(用户数据持续改善模型)、工作流深度集成(离开你效率降50%)、和垂直行业专精(比通用模型好10x)。
详细回答 (2分钟):
2026年AI产品的护城河不在功能层面,而在积累层面。
不可防守的:
- 漂亮的UI(可复制)
- 精心设计的Prompt(可逆向工程)
- 调用最新模型的API(谁都能调)
- 通用的AI功能(翻译、摘要、分类)
可防守的:
-
数据飞轮: Cursor的每次代码补全反馈都在改善模型。竞争对手即使有相同的基础模型,也没有这些积累的交互数据。
-
工作流集成: 当AI深入到用户的IDE、CRM、文档系统中,切换成本就变得很高。Cursor直接在编辑器中修改代码,而ChatGPT需要复制粘贴——这个体验差距就是护城河。
-
垂直专精: 通用AI在法律、医疗、金融等领域不够好。Harvey AI专注法律,理解判例法和合同格式,这种行业深度通用模型很难复制。
-
网络效应: 越多用户→越多数据→越好的模型→越多用户。但前提是你必须有数据闭环。
API Wrapper能否成功?可以,但只有当"Wrapper"这个词无法描述你的产品时。如果你的产品是API之上的10倍体验改善+工作流集成+数据积累,那就不是Wrapper了。
追问准备:
- Q: 小公司如何和OpenAI/Google竞争?A: 不在通用层面竞争。选一个垂直领域,用专有数据和行业理解打深。大公司做不了所有垂直。
- Q: 开源模型会不会摧毁所有护城河?A: 开源降低了模型层面的壁垒,但反而强化了数据、工作流、行业知识的护城河价值。
Q3: 如何衡量AI产品的PMF?
简短回答 (30秒): AI产品PMF最关键的信号不是注册量或"哇"的反应,而是"Second-bite Rate"——用户完成第一个任务后,是否回来做第二个。如果用户无法描述你的产品替代了哪个具体的、反复发生的任务,你拥有的是新鲜感,不是PMF。
详细回答 (2分钟):
AI产品PMF有三个层次的验证:
层次1 — 问题验证: 你解决的是真实存在的问题吗?检查方法:用户现在用什么方式解决这个问题(即使很笨的方式)?如果他们什么都没用——这可能不是真正的痛点。
层次2 — AI优势验证: AI在这个场景下的优势是10x还是2x?如果只是2x,用户不会为了2x改善去承担AI的不确定性(幻觉、不一致)。必须是显著的改善才能克服这些摩擦。
层次3 — 留存验证: 按用例分析留存率。不看整体留存——找到留存最高的那个用例,那就是PMF的起点。Mixpanel 2026年数据显示,成熟AI产品的成功标志是"更少点击、更少提示、更快结果"——用户做更多事但操作更少。
核心指标:
- Time-to-Value < 60秒
- Second-Bite Rate > 40%
- Override Rate < 30%(越低越好,表示信任)
- 按用例留存 > 某个用例有"非凡"的留存
反模式识别: 注册曲线好看但7天留存低于10%→新鲜感。使用量高但都是一次性任务→没有工作流嵌入。NPS高但付费转化低→"很好但不必要"。
追问准备:
- Q: AI产品的DAU/MAU应该是多少?A: B2B AI工具10-20%是健康的。AI工具天然使用频率低于社交/通讯。关注"成功使用"而非"打开次数"。
- Q: 怎么区分真PMF和AI的新鲜感效应?A: 看30天后的留存和Second-bite Rate。新鲜感在30天后会消失,真PMF不会。
Q4: Build vs Buy AI能力,如何决策?
简短回答 (30秒): 2026年不是二选一,而是三选一:Build、Buy、Fine-tune。核心原则:购买"记录系统"(合规、审计等),自建"差异化层"(AI体验、Agent工作流),微调介于两者之间。关键决策因素是:AI是否是你的核心差异化、你是否有专有数据、以及你的时间和人才约束。
详细回答 (2分钟):
S&P Global数据显示42%的企业在2025年废弃了AI项目,很大程度上是因为Build vs Buy决策失误。我建议用以下框架:
Step 1 — 战略定位判断: AI是你的核心差异化还是辅助功能?如果AI是你存在的原因(你就是一个AI产品),至少部分自建。如果AI只是增强功能(给CRM加AI摘要),优先购买。
Step 2 — 数据评估: 你有10万+条高质量的领域专有数据吗?有→微调或自建。没有→API+RAG可能就够了。
Step 3 — 约束条件: 时间约束(<3个月需要上线→Buy)、人才约束(没有ML团队→Buy/Fine-tune)、预算约束(<$100K/年→Buy)、隐私约束(数据不能离开公司→自建或on-prem微调)。
2026年最佳实践: 大多数企业采用混合策略——购买80%(基础能力),微调15%(行业适配),自建5%(核心差异化体验)。这不是一次性决策,而是持续评估的过程。每季度审视:模型提供商是否推出了我们自建的同类功能?我们的自建部分是否真的创造了差异化价值?
追问准备:
- Q: 微调和RAG怎么选?A: RAG适合知识更新频繁的场景(实时数据、不断变化的文档);微调适合行为/风格的改变(专业术语、特定格式、行业逻辑)。很多情况下两者结合使用。
- Q: 如何避免供应商锁定?A: 核心抽象层(模型调用接口)做到可切换,用LiteLLM等统一接口。同时评估2-3个模型提供商,避免单一依赖。
PM视角总结 / PM Takeaways
2026年AI PM的10条铁律 / 10 Rules for AI PMs
┌─────────────────────────────────────────────────────────┐
│ │
│ 1. 从问题出发,不从技术出发 │
│ "我们有GPT-5!" ✗ │
│ "客户每周花10小时做X,AI可以减少到1小时" ✓ │
│ │
│ 2. 用Learning Velocity代替Release Velocity │
│ 不是"发布了多少功能",而是"学到了多少关于用户的事" │
│ │
│ 3. 成本是产品设计的一部分,不是事后考虑 │
│ 从Day 1就把推理成本纳入产品设计 │
│ 模型路由、缓存、用量管控 = 产品功能 │
│ │
│ 4. 定价对齐价值,不对齐成本 │
│ 按用户感知到的价值收费 │
│ 不是按你的推理成本加价 │
│ │
│ 5. AI输出不确定性是feature,不是bug │
│ 设计产品时假设AI会犯错 │
│ 优雅的错误处理 > 追求100%准确 │
│ │
│ 6. 护城河在积累层,不在功能层 │
│ 数据飞轮 > 工作流集成 > 垂直专精 > 功能领先 │
│ │
│ 7. 信任是AI产品最稀缺的资源 │
│ 可解释性、透明度、安全记录 → 建立信任 │
│ 信任 → 留存 → 口碑 → 增长 │
│ │
│ 8. 按用例看留存,不看整体 │
│ 找到留存最高的那个用例 │
│ Double Down 在那个场景上 │
│ │
│ 9. 混合策略是正道 │
│ Build vs Buy: 混合 │
│ 定价: 混合(基础费+用量) │
│ 增长: 混合(PLG+Sales) │
│ 模型: 混合(多模型路由) │
│ │
│ 10. AI PM最重要的技能是判断力 │
│ 什么时候用AI,什么时候不用 │
│ 什么指标重要,什么是虚荣指标 │
│ 什么值得投入,什么该放弃 │
│ AI可以帮你收集信息,但决策仍然是人的工作 │
│ │
└─────────────────────────────────────────────────────────┘
AI PM求职加分项 / Job Search Differentiators
2026年AI PM面试中,以下能力让你脱颖而出:
必备 (Table Stakes):
├── 理解主流模型的能力和局限
├── 能讨论Prompt Engineering和RAG
├── 知道常见的AI产品定价模型
└── 理解幻觉率、任务完成率等指标
加分 (Differentiators):
├── 能设计完整的Build vs Buy决策框架
├── 能做AI产品的单位经济学分析
├── 有实际的AI产品/功能上线经验
├── 理解Agent系统和MCP生态
└── 能讨论AI伦理和合规考量
稀缺 (Rare & Valuable):
├── 金融/医疗/法律等垂直AI经验
├── 从0到1做过AI产品的PMF验证
├── 设计过AI产品的定价和商业模型
└── 有AI成本优化的实战经验
与金融零售的结合 / Intersection with Finance & Retail
对于有金融零售背景的AI PM:
金融 × AI 产品机会:
├── 智能风控Agent (按审核的案件数收费)
├── AI投研助理 (订阅+用量混合)
├── 合规自动化 (按文档/交易处理量收费)
├── RWA × AI (资产评估自动化)
└── DeFi × AI (AI交易策略Agent)
零售 × AI 产品机会:
├── AI客服Agent (按解决的工单数收费)
├── 智能推荐系统 (按转化收入分成)
├── 供应链预测 (按预测准确率的成果收费)
├── 个性化营销 (按触达+转化的混合计费)
└── 智能定价引擎 (按GMV提升的收入分成)
你的差异化: 10年金融零售经验 + AI产品策略
= 稀缺的垂直AI PM人才
延伸阅读 / Further Reading
推荐资源
| 资源 | 类型 | 说明 |
|---|---|---|
| Bessemer AI Pricing Playbook | 定价指南 | VC视角的AI定价最佳实践 |
| Bessemer AI PMF Playbook | PMF指南 | AI创始人的PMF验证手册 |
| Mind the Product: 2026 AI Strategy Guide | 策略指南 | 务实的AI产品策略 |
| Monetizely: 2026 SaaS/AI Pricing Guide | 定价模型 | Agent时代定价全景 |
| Chargebee: Pricing AI Agents Playbook | Agent定价 | Agent产品定价实战 |
| Mixpanel: 2026 AI Benchmarks | 数据报告 | AI产品使用数据基准 |
| ProductLed: PLG Predictions 2026 | 增长策略 | PLG在AI时代的演变 |
| Product School: AI PM Guide | 职业指南 | 2026年AI PM角色定义 |
总结 / Summary
Day 67 核心收获:
1. AI产品策略 ≠ 传统SaaS策略
概率性输出、非零边际成本、易被复制 → 需要新思维
2. Build vs Buy → Build + Buy + Fine-tune
2026年是混合时代,购买80%,微调15%,自建5%
3. 定价革命已经发生
座位制→用量制→成果制
混合模式是当前最优解
4. PMF验证要看工作流嵌入,不看新鲜感
Second-Bite Rate > 注册量
按用例留存 > 整体留存
5. 护城河在积累层: 数据飞轮 > 工作流集成 > 垂直专精
功能护城河已死,API Wrapper无法持续
6. 增长飞轮是AI独有优势
更多用户→更多数据→更好模型→更好体验→更多用户
7. AI PM的核心技能是判断力
什么时候用AI,什么时候不用
什么值得投入,什么该放弃
下一篇: Day 68 (待定) 上一篇: Day 66: Voice AI与实时对话Agent