AI 扩展计划 / Playbooks

AI Optimization / Operations Research Decision Playbook

这些来源作为术语、架构和治理锚点。本文把它们转成 AI 产品、金融零售运营和企业架构可执行的工作语言。

923 行AI_OPTIMIZATION_OPERATIONS_RESEARCH_DECISION_PLAYBOOK.md

AI Optimization / Operations Research Decision Playbook

适用对象: AI Product Architect、AI PM、Decision Intelligence Lead、Risk Product、Retail Operations Product、Platform Architect、Model Risk / Governance Partner。 核心问题: 当 AI 已经能预测需求、风险、意图和优先级时，如何把预测结果转成满足约束、可审计、可解释、可运行的最优业务决策。 一句话定位: 这是一份把 operations research、linear / integer programming、CP-SAT、routing、scheduling、AI decisioning 和金融零售运营场景连接起来的高级产品架构手册。 边界说明: 本文不是 BA 入门、数学教材、供应商选型报告、法律意见或模型验证报告；正式落地必须结合业务 owner、risk、legal、compliance、data、security、architecture review 和 model risk governance。

Source Anchors

这些来源作为术语、架构和治理锚点。本文把它们转成 AI 产品、金融零售运营和企业架构可执行的工作语言。

Anchor	Official / primary source	本文用法
Google OR-Tools	https://developers.google.com/optimization	用作开源 optimization suite 锚点，覆盖 linear optimization、integer optimization、constraint programming、routing 和 scheduling。
OR-Tools CP-SAT Solver	https://developers.google.com/optimization/cp/cp_solver	用于解释 CP-SAT 在离散变量、复杂约束、排班、资源分配和可行性搜索中的适用边界。
OR-Tools Routing	https://developers.google.com/optimization/routing	用于 routing、vehicle routing、time windows、capacity constraints 和服务路径优化的架构表达。
OR-Tools Scheduling Examples	https://developers.google.com/optimization/scheduling/employee_scheduling	用于 retail workforce、contact center、branch staffing 等排班建模参考。
SciPy `linprog`	https://docs.scipy.org/doc/scipy/reference/generated/scipy.optimize.linprog.html	用于连续线性规划、LP baseline、shadow-price 解释前的模型校验和轻量级实验。
Gurobi Optimizer Documentation	https://docs.gurobi.com/projects/optimizer/en/current/	用于生产级 LP / MILP / MIQP、multi-objective optimization、MIP gap、warm start、sensitivity 和 solver operations 语言。
Gurobi Multi-Objective Optimization	https://docs.gurobi.com/projects/optimizer/en/current/features/multiobjective.html	用于多目标权重、优先级、lexicographic optimization 和业务 tradeoff 设计。
PuLP	https://coin-or.github.io/pulp/	用于 Python 建模接口、LP / MILP 快速建模、开源求解器连接和作品集原型。
COIN-OR	https://www.coin-or.org/	用于开源 OR solver ecosystem、CBC、Clp 和企业内可解释原型的技术背景。
NIST AI RMF	https://www.nist.gov/itl/ai-risk-management-framework	用 Govern / Map / Measure / Manage 组织 AI + optimization 决策系统的风险、监控、证据和治理。

1. 一句话定位

AI 决策系统的成熟表达不是“模型给一个分数”，而是:

AI predicts.
Optimization allocates.
Policy constrains.
Workflow escalates.
Audit remembers.

中文表达:

AI 负责预测和生成候选方案，优化模型负责在约束下选择行动组合，策略层负责边界控制，工作流负责例外升级，审计层负责复盘证据。

这份 playbook 关注的不是“如何写一个算法题”，而是如何把优化问题产品化为可上线的 decision service:

输入来自预测模型、业务规则、库存、人员、渠道、风险、合同和 SLA。
输出是可执行的排班、分流、定价、库存、催收、审核、路由或资源分配方案。
中间有 objectives、constraints、scenario analysis、sensitivity、exception workflow、human override 和 audit trail。
结果必须在金融零售场景中满足客户公平性、合规边界、操作韧性和业务可解释性。

2. 为什么重要

很多 AI 产品到生产阶段会卡在同一个问题:

模型知道“可能发生什么”，但业务需要决定“现在该怎么分配有限资源”。

金融零售里，真实决策通常不是单点预测，而是受约束的组合优化:

场景	AI 常见输出	真正要决策的问题	缺少优化层的风险
零售门店 staffing	每小时客流、交易量、服务需求预测	每家店每个时段安排多少人、什么技能、什么班次	高峰期缺人、低峰期冗员、员工体验差、劳动法规风险
Fraud review queues	交易欺诈概率、损失金额、客户影响	有限审核员先看哪些 case，哪些自动放行、拦截或升级	高价值欺诈漏审，低风险 case 占用人工，客户摩擦扩大
Credit collections	还款概率、违约风险、客户响应倾向	哪些客户通过短信、电话、宽限、重组或人工跟进	催收成本失控、客户伤害、监管投诉、回款效率低
Inventory / pricing	需求预测、价格弹性、缺货概率	如何在库存、毛利、渠道、保质期和竞争约束下调价与补货	局部最优、缺货与滞销并存、促销侵蚀利润
Contact center scheduling	呼入量、AHT、渠道迁移、服务等级预测	如何安排班次、技能组、休息和溢出策略	SLA 失守、坐席过载、加班成本高、客户等待时间变长

如果没有 OR / optimization 层，AI 产品容易退化成三种低成熟形态:

低成熟形态	表面上看起来	实际问题
Scoreboard	dashboard 显示风险、需求、机会分数	没有告诉运营团队如何行动，也没有考虑容量约束
Rule pile	在模型分数上叠加越来越多 if / else	规则之间冲突，难以证明结果最优或可行
Manual allocation	AI 给建议，人手工排队、排班、调价、分配	操作负担转移给员工，结果不可复现，无法规模化

高级 AI 产品架构要把“预测”推进到“可执行决策”:

forecast / score / candidate
-> optimization model
-> feasible action plan
-> decision service
-> workflow execution
-> outcome feedback
-> model and constraint improvement

3. 优化决策服务架构

3.1 参考架构

flowchart TB
  E[Business events<br/>transactions, applications, cases, demand, inventory] --> F[Feature and state layer]
  F --> M[AI / forecasting services<br/>risk score, demand forecast, elasticity, response propensity]
  F --> C[Constraint registry<br/>capacity, policy, labor rules, SLA, risk appetite]
  M --> D[Decision request builder]
  C --> D
  D --> S[Solver decision service<br/>LP / MILP / CP-SAT / routing / scheduling]
  S --> P[Policy and guardrail check<br/>eligibility, fairness, compliance, authorization]
  P --> W[Workflow execution<br/>assign, schedule, price, route, queue, escalate]
  W --> A[Audit and evidence store]
  W --> O[Outcome feedback<br/>actual demand, handling time, fraud loss, recovery, SLA]
  O --> M
  O --> C
  S --> X[Scenario and sensitivity service]
  X --> B[Business review<br/>tradeoff, capacity, risk appetite]

关键设计原则:

原则	含义	架构动作
Forecast-to-optimization	AI 预测不是终点，必须变成优化模型参数	预测服务输出带置信区间、版本、适用范围和时间粒度
Solver as decision service	solver 不是离线 notebook，而是有 SLA、输入契约和审计日志的服务	建立 decision API、schema validation、time limit、fallback、trace id
Constraints outside prompt	约束不能藏在 prompt 或自然语言建议里	使用 constraint registry、policy engine、rule version 和 test suite
Agent proposes / solver decides	Agent 可以生成候选方案和解释，但不能绕过可行性与约束	Agent 输出结构化 proposal，solver 输出 feasible plan，policy 层做最终门禁
Optimization under governance	最优解必须能解释目标、约束、版本和取舍	记录 objective weights、constraint binding status、solver status、override reason

3.2 Solver Decision Service 的产品边界

一个生产级 solver decision service 至少包括:

能力	说明	金融零售例子
Decision API	接收业务上下文、预测、资源、约束和策略版本	`POST /staffing/optimize`、`POST /fraud-queue/prioritize`
Model builder	把输入转成变量、目标、约束、求解器格式	将门店、时段、技能、员工合同转成排班变量
Solver adapter	封装 OR-Tools、Gurobi、PuLP / CBC、SciPy 等求解器	同一业务模型可在开源和商业 solver 间切换
Runtime controls	time limit、MIP gap、solution pool、warm start、deterministic seed	高峰前 2 分钟内产出可用排班调整
Feasibility handling	infeasible diagnosis、constraint relaxation、soft penalty	找出是技能覆盖、工时上限还是休息规则造成不可行
Explanation layer	输出为什么这样分配、哪些约束绑定、目标如何取舍	“晚班少 1 名持证员工会导致高峰 SLA 风险上升”
Scenario runner	对需求、容量、风险偏好和成本参数做 what-if	节假日客流 +15%、审核人手 -20%、加班成本翻倍
Audit trail	记录输入、版本、求解状态、输出、人工 override	客户争议、监管检查、模型风险审查时可复盘

3.3 在线、准实时、离线三类运行模式

模式	适用决策	延迟目标	常用 solver 形态	设计重点
在线同步	支付授权是否升级人工、客服 Agent 是否可调用工具	毫秒到秒级	简化 LP、预计算策略、规则短路、top-k assignment	可用性、降级、确定性、极低延迟
准实时	fraud review queue 优先级、collections daily campaign、当日 workforce rebalancing	秒到分钟级	MILP、CP-SAT、heuristic + solver repair	容量、可解释、时间窗、滚动优化
离线批量	周排班、补货、价格计划、区域资源配置	分钟到小时级	MILP、CP-SAT、routing、scenario batch	多场景比较、审批、审计、业务 sign-off

4. 问题建模

4.1 优化问题的基本结构

一个可落地的 optimization decisioning problem 通常由 7 类对象组成:

对象	作用	例子
Sets / indexes	定义决策维度	门店、员工、时段、技能、case、客户、产品、路线
Parameters	已知输入或预测输入	需求预测、风险分数、单位成本、容量、价格弹性、处理时长
Decision variables	系统要选择的行动	是否安排员工 e 在时段 t；case c 是否分给 reviewer r；产品 p 是否降价
Objective function	优化目标	最小成本、最大回款、最大服务水平、最小风险损失、最大毛利
Constraints	必须满足或带惩罚的边界	劳动法规、工时、技能、预算、SLA、公平性、库存、风险承受度
Solver settings	求解策略	time limit、MIP gap、warm start、objective priority、solution pool
Output contract	可执行结果	班表、审核顺序、催收名单、补货量、价格动作、升级队列

4.2 线性规划、整数规划、CP-SAT 的区别

方法	核心表达	适用场景	产品架构提醒
Linear Programming, LP	连续变量 + 线性目标 + 线性约束	资源连续分配、预算分配、产能规划、初始 capacity analysis	适合 baseline、shadow price、敏感性分析，但不能直接表达“是否选择”这类离散动作
Integer / Mixed-Integer Programming, IP / MILP	变量包含 binary / integer，目标和约束通常线性	排班、分配、routing、portfolio selection、fraud case assignment	能表达离散决策，但要管理求解时间、MIP gap、可行解质量
CP-SAT	Constraint Programming + SAT + integer reasoning	员工排班、复杂业务规则、组合约束、可行性强于目标优化的场景	适合表达大量逻辑约束、时间窗、互斥、覆盖、软硬约束组合
Routing / VRP solvers	路径、车辆、容量、时间窗和服务点	现金运钞、上门服务、门店配送、现场维护	要把地理、时间窗、容量、优先级和服务时长一起建模
Heuristics + repair	先用启发式生成方案，再由 solver 修复约束	大规模实时分配、秒级 queue routing、动态重排	必须标明可行性保证边界，不把启发式当作最优证明

4.3 建模语言示例

以 fraud review queue 为例:

Sets
  C = fraud cases
  R = reviewers
  T = review time buckets

Parameters
  p_c = fraud probability predicted by AI
  loss_c = estimated loss if case is not reviewed
  friction_c = customer friction cost if case is held
  a_r,t = reviewer availability
  skill_r,k = reviewer skill coverage
  handle_c = estimated handling time
  sla_c = latest acceptable review time

Decision variables
  x_c,r,t = 1 if case c is assigned to reviewer r in time bucket t, else 0
  y_c = 1 if case c is auto-released or deferred, else 0

Objective
  maximize expected prevented loss
  minus customer friction
  minus operational cost
  minus SLA penalty

Constraints
  each case assigned at most once
  reviewer capacity per time bucket
  skill eligibility
  high-risk cases reviewed before SLA
  fairness and customer harm guardrails

这段建模语言比“AI 按风险排序”更成熟，因为它明确表达了容量、技能、SLA、摩擦和风险取舍。

5. 目标与约束

5.1 Objectives: 优化什么

高级 AI + OR 产品必须把 objective 从口号改成可计算函数。

Objective 类型	业务表达	数学表达方向	常见风险
Cost minimization	降低加班、人力、库存、审核成本	minimize cost	过度压缩资源导致 SLA 或客户体验下降
Profit / value maximization	最大化毛利、回款、挽损、转化	maximize expected value	忽视公平性、合规或长期关系
Service level maximization	提高接通率、按时审核、门店覆盖	maximize SLA attainment	成本可能激增
Risk minimization	降低欺诈、违约、投诉、操作风险	minimize expected loss / risk exposure	可能产生过度拦截或客户摩擦
Workload balancing	平衡员工负载、审核复杂度、班次偏好	minimize variance / imbalance	可能牺牲局部效率
Customer harm minimization	降低误拦截、过度催收、等待时间	minimize harm penalty	需要良好的 harm taxonomy 和权重治理

5.2 Constraints: 什么不能突破

约束不是“业务补充说明”，而是决策系统的控制面。

Constraint 类型	例子	建模方式
Capacity	审核员每天 6 小时有效审核时间；门店每时段最多 8 人	hard constraint 或 capacity penalty
Skill / eligibility	持证员工才能处理某类咨询；高级 reviewer 才能处理账户接管	binary eligibility matrix
Labor / contract	每周工时上限、休息间隔、夜班限制、加班规则	CP-SAT / MILP hard constraints
SLA / time window	高风险交易 30 分钟内审核；客户来电 80% 在 20 秒内接通	time window constraint + penalty
Budget	外包坐席、加班、折扣、补货预算上限	budget constraint
Inventory	货架容量、保质期、安全库存、渠道库存不可为负	flow / stock constraints
Fairness / customer protection	不同客户群体误拦截差异、催收联系频率、特殊保护人群	guardrail constraint + monitoring
Compliance / policy	不允许自动拒绝某类受监管决策；需人工确认	policy constraint outside solver
Explainability	客户影响决策必须输出 reason code 和证据	output contract constraint

5.3 Hard constraints 与 soft constraints

类型	含义	示例	设计建议
Hard constraint	不允许违反	员工没有资质不能处理投资建议；库存不能为负	放入 solver 或 policy gate，违反即不可执行
Soft constraint	可违反但有代价	员工班次偏好、低优先级 SLA、低风险 case 延迟	加 penalty，输出 violation summary
Guardrail metric	上线后持续监控	误拦截率、投诉率、人工 override 率	不一定进入目标函数，但进入 release gate 和 monitoring

不要把所有约束都设成 hard。生产系统如果过度硬化，会频繁 infeasible；如果过度软化，会把风险藏进 penalty 权重。成熟做法是:

不可违反的法律、资质、安全、授权边界 = hard constraint
可业务协商的体验、偏好、次级 SLA = soft constraint
需高层设定 appetite 的风险、成本、公平性 = governed tradeoff

5.4 Multi-objective tradeoffs

金融零售 AI 决策几乎都不是单目标问题。常见 tradeoff:

Fraud loss vs customer friction
Collections recovery vs customer harm
Contact center SLA vs staffing cost
Inventory availability vs markdown risk
Pricing margin vs market share
Workforce fairness vs operational efficiency

多目标处理方式:

方法	说明	适用场景	风险
Weighted sum	把多个目标加权成一个目标函数	权重可治理、指标单位可归一化时	权重争议大，容易把不可突破边界误当可交易
Lexicographic priority	先优化一级目标，再在可接受范围内优化二级目标	风险、合规、SLA 优先级明确时	低优目标可能被压缩过度
Epsilon constraint	把一个目标作为主目标，其他目标设最低门槛	“成本最低但 SLA 不低于 95%”	阈值需要业务和风险 owner 明确确认
Pareto scenario	输出多组非支配方案供业务比较	高层做 risk appetite / capacity 决策	需要清晰的可视化和解释
Goal programming	每个目标设目标值和偏离惩罚	多部门协商型资源分配	偏离惩罚设计复杂

成熟表达不是“我们优化综合得分”，而是:

主目标是什么。
哪些指标是不可突破 guardrail。
哪些指标可用权重交易。
权重由谁批准。
不同权重下的业务结果如何变化。
生产中如何监控 tradeoff 是否偏离预期。

5.5 Sensitivity 与 shadow prices

Sensitivity analysis 用来回答:

如果多 1 个审核员、多 1 小时门店工时、多 1 万预算、多 5% 库存容量，业务价值会增加多少。

Shadow price 在连续 LP 或 LP relaxation 中更有解释价值，它描述某个约束右侧资源增加一个单位时，目标函数的边际变化。对于 MILP / CP-SAT，整数性和逻辑约束会让 shadow price 不再直接等同真实边际价值，需要用 scenario analysis、relaxation、local re-solve 或 controlled experiment 来解释。

场景	可解释问题	产品动作
Fraud review capacity	增加 1 名高技能 reviewer 的预期挽损	用于 headcount business case
Contact center staffing	多 1 小时 bilingual capacity 对 SLA 的价值	用于技能招聘和班次设计
Inventory allocation	多 1 单位安全库存对缺货损失的缓解	用于补货和仓储容量决策
Collections campaign	增加 1 小时人工催收对回款的边际提升	用于渠道组合和外包预算
Retail staffing	高峰时段多 1 名员工对等待时间和转化的影响	用于门店排班和加班审批

6. AI + OR 协同

6.1 Forecast-to-optimization

Forecast-to-optimization 是把预测模型的输出转成优化模型参数的过程。

Demand forecast
-> demand distribution by time / location / segment
-> staffing or inventory optimization
-> schedule / replenishment plan
-> actual demand and service outcome
-> forecast calibration and constraint update

关键不是“预测越准越好”这么简单，而是预测误差如何影响最优决策:

AI 输出	优化参数	需要治理的误差
客流预测	每店每时段 minimum coverage	高峰低估会造成排队和转化损失
欺诈概率	case expected value 和 review priority	高风险低估会造成损失，低风险高估会造成误拦截
回款概率	collections channel allocation	过度联系低响应客户会造成客户伤害和投诉
价格弹性	pricing objective / demand response	弹性估计错会导致利润和销量双损
AHT 预测	contact center capacity consumption	处理时长低估会造成 SLA 失守

6.2 Agent proposes / solver decides

LLM Agent 在优化决策系统里有价值，但边界必须清楚。

角色	可以做	不应该做
Agent	读取政策、总结运营异常、提出候选约束、解释方案、生成 scenario narrative	直接绕过 solver 决定排班、定价、审核和催收动作
Solver	在结构化目标和约束下选择可行方案	理解自然语言政策的真实法律含义
Policy engine	授权、资格、合规边界、客户保护门禁	优化连续资源分配
Human owner	设置风险偏好、批准权重、处理例外、承担业务责任	手工修补所有 case-level 决策

推荐架构:

Agent reads context and proposes structured candidate:
  proposed objective changes
  proposed constraints
  proposed scenario
  explanation and assumptions

Validation layer checks:
  schema
  allowed fields
  policy compatibility
  data lineage
  owner approval requirement

Solver decides:
  feasible solution
  objective value
  binding constraints
  tradeoff summary

Policy and workflow decide execution:
  allowed action
  escalation
  audit event

6.3 AI + Optimization 的常见组合模式

模式	工作方式	示例
Predict then optimize	ML 先预测参数，solver 再优化	预测呼入量后做 contact center scheduling
Optimize with learned cost	ML 估计每个动作的收益或成本，solver 组合选择	预测每个催收渠道的回款概率和客户伤害
Generate candidates then solve	AI 生成候选动作集合，solver 从中选择可行组合	Agent 提出促销组合，MILP 选出预算内方案
Solve then explain	solver 产出方案，LLM 生成面向运营的解释	“为什么本周三需要 2 名会西语坐席”
Simulation then optimize	仿真生成压力场景，solver 比较韧性方案	节假日客流、系统故障、人员缺勤联合压力测试
Human-in-the-loop optimize	solver 给方案和取舍，人批准风险偏好或例外	催收策略、重大价格调整、门店关闭时段调整

7. 场景分析

7.1 Retail Workforce / Staffing Optimization

建模元素	内容
决策	每家门店、每个时段、每个技能组安排哪些员工和班次
AI 输入	客流预测、交易量预测、服务需求预测、促销影响、天气和节假日特征
变量	`x_employee_shift_store_time`，员工是否在某店某时段工作
目标	最小化人力成本、加班、缺口 penalty，同时最大化服务覆盖和员工偏好满足
约束	工时上限、休息间隔、技能覆盖、最低开店人数、劳动法规、预算、员工可用性
Solver	CP-SAT / MILP；复杂班次和逻辑规则偏 CP-SAT
输出	周班表、缺口报告、加班建议、跨店支援方案
指标	服务覆盖率、排队时间、销售转化、员工排班公平性、加班成本
例外	预测需求超过可用人力、关键技能缺口、员工突然缺勤

高级产品洞察:

staffing 不是简单的“按预测客流配人”，而是技能、合同、偏好、法规、成本和体验之间的组合优化。
最有价值的 PM 输出不是班表本身，而是 capacity business case: 哪些时段的 shadow value 最高，哪类技能的边际价值最大。
如果 AI 只预测客流，不连接 solver 和 workforce management 系统，业务仍然要手工排班，产品价值会被消耗在操作层。

7.2 Fraud Review Queues

建模元素	内容
决策	哪些交易、账户或申诉 case 进入人工审核；由谁审核；在什么时限前处理
AI 输入	欺诈概率、预期损失、客户价值、误拦截风险、case 复杂度、处理时长
变量	case-reviewer-time assignment、auto release、hold、escalate
目标	最大化预期挽损，最小化客户摩擦、审核成本、SLA breach 和投诉风险
约束	审核员容量、技能、时限、监管要求、高风险强制审核、客户保护规则
Solver	MILP / rolling horizon optimization；秒级队列可用 heuristic + solver repair
输出	审核优先级、分配方案、自动放行列表、升级列表、容量缺口
指标	prevented loss、false positive impact、review SLA、override rate、customer friction
例外	模型置信度低、数据缺失、case 类型超出授权、队列拥堵

高级产品洞察:

“按风险分从高到低审核”不是最优，因为它忽略了损失金额、处理时长、SLA、客户影响和 reviewer 技能。
如果两个 case 风险相同，预期损失更高、处理更快、SLA 更紧的 case 可能更优先。
误拦截成本必须进入 objective 或 guardrail，否则优化会倾向于过度保守。

7.3 Credit Collections Optimization

建模元素	内容
决策	哪些客户进入哪个催收渠道、联系频率、联系时间、是否给出重组或宽限方案
AI 输入	还款概率、渠道响应倾向、客户脆弱性信号、预期回款、投诉风险、收入波动
变量	customer-channel-time-treatment assignment
目标	最大化风险调整后回款，最小化客户伤害、投诉、合规风险和运营成本
约束	联系频率上限、禁止联系窗口、特殊客户保护、渠道容量、监管政策、客户偏好
Solver	MILP / multi-objective optimization；高风险策略需要 workflow approval
输出	日 campaign、渠道分配、人工跟进列表、暂停联系名单、重组 offer 队列
指标	recovery rate、promise-to-pay kept rate、complaint rate、hardship identification、cost per dollar recovered
例外	客户进入 hardship、争议账户、身份不确定、法律限制触发

高级产品洞察:

collections 的优化目标不能只看短期回款；客户保护和监管风险必须作为 hard constraint 或高优先级目标。
AI 可以预测响应倾向，但不应把“最容易被联系成功”误解为“最应该联系”。
优化系统应能说明为什么选择短信、电话、人工、宽限、暂停或升级。

7.4 Inventory / Pricing Optimization

建模元素	内容
决策	每个产品、门店、渠道、时间段的补货量、调拨量、价格和促销动作
AI 输入	需求预测、价格弹性、竞争价格、季节性、库存周转、缺货概率、滞销概率
变量	replenish_qty、transfer_qty、price_level、markdown_flag
目标	最大化毛利和可得性，最小化缺货、滞销、报废和价格摩擦
约束	库存容量、预算、最小毛利、价格变动频率、促销规则、供应提前期、渠道一致性
Solver	LP / MILP；价格档位和促销选择常用 binary variables
输出	补货计划、门店调拨、价格动作、markdown schedule、缺货风险清单
指标	gross margin、stockout rate、sell-through、waste、price override、inventory turns
例外	供应中断、价格弹性异常、监管价格限制、关键商品安全库存不足

高级产品洞察:

pricing 与 inventory 应联动优化。单独降价可能消化库存，却破坏毛利和品牌；单独补货可能增加滞销风险。
AI 价格弹性模型必须进入 scenario，而不是单一确定值。高不确定性商品应设置更保守的价格动作。
对金融零售交叉场景，例如信用卡权益、积分兑换、保险附加服务，也可用库存 / pricing 思路优化额度、权益成本和客户价值。

7.5 Contact Center Scheduling

建模元素	内容
决策	每个时间段安排多少坐席、什么技能、什么渠道、是否启用外包或 callback
AI 输入	呼入量预测、chat demand、AHT、客户意图、转人工率、渠道迁移概率
变量	agent-shift-skill-channel assignment、break schedule、overflow routing
目标	在成本约束下最大化 service level、first contact resolution 和客户体验
约束	技能组覆盖、休息规则、班次偏好、外包容量、SLA、语言能力、敏感业务授权
Solver	CP-SAT / MILP；队列仿真可与优化组合
输出	班表、技能组覆盖、overflow plan、callback threshold、加班建议
指标	ASA、service level、abandon rate、occupancy、schedule adherence、customer satisfaction
例外	突发事件呼入激增、系统故障、坐席缺勤、敏感业务队列拥堵

高级产品洞察:

contact center 不只是排班问题，还涉及技能路由、渠道迁移、callback 策略和客户风险分层。
AHT 预测误差会直接影响 capacity。需要把 AHT uncertainty 进入 scenario analysis。
AI Agent 上线后，如果降低 AHT 但增加 repeat contact，优化目标就必须引入 downstream quality guardrail。

7.6 Routing / Scheduling for Field and Branch Operations

建模元素	内容
决策	哪些任务由哪个团队按什么顺序完成，是否合并路线或调整服务窗口
AI 输入	服务时长预测、任务紧急度、失败概率、客户可用时间、交通或区域风险
变量	vehicle-route-stop assignment、task sequence、time window selection
目标	最小化路程、延迟、失败服务和加班，同时最大化准时率和高价值任务完成
约束	车辆容量、人员技能、服务窗口、区域权限、现金或贵重物品安全规则
Solver	OR-Tools routing / VRP / time windows；大规模动态场景可分区求解
输出	路线、服务顺序、预计到达时间、异常升级
指标	on-time rate、route cost、missed appointments、utilization、customer wait
例外	路线不可行、客户改约、任务超时、安全事件

8. 例外工作流

Optimization decision service 必须把例外当成一等产品对象。生产系统真正危险的不是“求不到完美最优解”，而是求解失败后系统沉默、误执行或让运营人员无证据地手工修补。

8.1 例外类型

例外类型	触发信号	系统动作	人工动作
Infeasible	solver 返回 infeasible	输出最小冲突集、约束放松建议、不可执行原因	owner 决定是否增加容量、调整需求或批准软化次级约束
Time limit	到达 time limit 但已有可行解	返回 best incumbent、gap、风险提示	按 SLA 决定执行当前可行解或升级
No solution	无可用方案或输入异常	执行 fallback policy，阻止高风险自动动作	运营主管进入手工决策工作流
Data quality failure	缺失关键参数、预测过期、schema 不匹配	拒绝请求或使用批准的 conservative default	data owner 修正，business owner 确认影响
Policy conflict	solver 方案违反策略层	policy gate 拦截并记录原因	policy owner 决定规则是否需变更
Human override	人工修改方案	记录 override reason、scope、approver	后续分析 override 是否暴露模型或约束问题
Customer harm signal	投诉、误拦截、过度催收、等待时间异常	降低自动化等级，触发监控告警	risk / compliance / operations 联合复盘

8.2 约束放松顺序

例外处理不能让一线人员临场猜测。应提前定义 relaxation hierarchy:

第一层: 可放松的体验偏好
  员工偏好、低优先级任务顺序、非关键渠道覆盖

第二层: 可批准放松的运营目标
  低风险 SLA、加班预算、外包使用量、低影响促销频率

第三层: 高层批准后才可调整的风险偏好
  fraud hold threshold、collections contact intensity、关键客户 service level

第四层: 不可放松的边界
  法规、授权、资质、客户保护、数据权限、资金安全

8.3 人工 override 不是失败，而是学习信号

每一次 override 都应该进入 analytics:

字段	用途
override actor / role	判断是否符合授权
original solution	复盘 solver 原始建议
changed decision	确认人工改动范围
reason code	区分业务例外、数据问题、模型问题、政策问题
customer / employee impact	判断是否造成体验或公平性影响
approval path	满足审计和责任追踪
outcome	衡量 override 是否改进结果

9. 治理与审计

9.1 NIST AI RMF 映射

NIST AI RMF function	在 AI + optimization 中的落地
Govern	明确 decision owner、risk owner、model owner、constraint owner、solver owner、policy owner；建立变更审批和证据要求
Map	识别决策影响对象、业务后果、客户风险、法律边界、数据来源、系统依赖和自动化等级
Measure	测量预测质量、优化质量、可行性、SLA、override、客户伤害、公平性、solver stability 和数据质量
Manage	上线门禁、rollback、scenario stress test、例外工作流、监控告警、周期性 review 和问题整改

9.2 Decision audit event

每一次优化决策至少要记录:

证据字段	说明
decision_id / trace_id	贯穿请求、求解、执行、反馈
business context	场景、区域、时间窗、客户或员工影响范围
input data version	特征、预测、库存、人员、策略、约束版本
model version	预测模型、校准模型、embedding 或 LLM 辅助组件版本
optimization model version	变量、目标、约束、权重、solver adapter 版本
solver configuration	solver 类型、time limit、MIP gap、seed、warm start、objective priority
solver status	optimal、feasible、infeasible、time limit、error
objective value	总目标值和分目标贡献
binding constraints	关键绑定约束和资源瓶颈
output decisions	排班、分配、价格、队列、路由等具体动作
policy check result	通过、拦截、升级、原因码
human override	修改人、原因、审批、影响范围
outcome feedback	实际业务结果、客户影响、投诉、SLA、损失或收益

9.3 Model risk 不只在预测模型

AI + OR 系统至少有四类风险:

风险层	风险	控制
Prediction risk	需求、风险、弹性、AHT 预测偏差	eval、calibration、drift monitoring、backtesting
Optimization risk	目标函数错误、约束遗漏、权重不当、solver 不稳定	model review、scenario analysis、unit tests、sensitivity
Execution risk	输出无法被 WFM、case system、pricing engine 正确执行	integration tests、idempotency、workflow reconciliation
Governance risk	无 owner、无证据、人工 override 无记录、policy 被绕过	decision inventory、approval matrix、audit event、access control

9.4 Release gate

上线前至少回答:

决策是否被分类为 customer-impacting、employee-impacting、financial-impacting 或 regulated。
每个 objective 和 constraint 是否有 owner。
权重、优先级和 guardrail 是否被批准。
是否有 baseline、challenger、scenario 和 stress test。
infeasible、time limit、data failure 是否有明确 fallback。
是否能复现任意一次决策的输入、版本、输出和人工改动。
是否能监控客户伤害、公平性、SLA、成本、override 和 business value。
是否定义了 rollback 条件和责任人。

10. 模板

10.1 Optimization Problem Canvas

模块	写法	示例
Decision name	用业务动作命名，不用算法命名	Fraud review queue prioritization
Business owner	对结果负责的业务角色	Fraud operations director
Decision cadence	决策频率和时间窗	每 15 分钟滚动优化未来 2 小时队列
Decision unit	最小可行动对象	case、employee shift、product-store-day、customer-channel
AI inputs	预测或生成式组件输出	fraud probability、estimated loss、handle time
Decision variables	系统要选择的动作	assign case to reviewer, defer, release, escalate
Objective	主目标和次目标	maximize expected prevented loss under friction guardrail
Hard constraints	不可突破边界	reviewer capacity、skill eligibility、regulatory holds
Soft constraints	可用 penalty 处理	reviewer workload balance、low-risk SLA
Multi-objective method	tradeoff 方法	lexicographic: compliance first, then loss, then cost
Solver choice	LP / MILP / CP-SAT / routing / heuristic	MILP for assignment with binary variables
Runtime target	延迟、可用性、降级	60 seconds, return feasible incumbent on time limit
Exception path	不可行或数据失败时流程	escalate capacity shortage to operations lead
Audit evidence	必须记录的证据	input versions, constraints, solver status, binding constraints

10.2 Objective / Constraint Table

类型	名称	数学方向	Owner	生产控制
Objective	Expected prevented fraud loss	maximize `sum(p_c * loss_c * reviewed_c)`	Fraud product	value dashboard and backtest
Objective	Customer friction	minimize hold time and false positive penalty	Customer experience	complaint and release monitoring
Hard constraint	Reviewer capacity	`sum(handle_c * x_c,r,t) <= capacity_r,t`	Operations	workforce feed quality gate
Hard constraint	Skill eligibility	`x_c,r,t <= skill_match_c,r`	Risk operations	skill registry version
Soft constraint	Workload balance	penalty for reviewer load variance	Operations	weekly fairness review
Guardrail	VIP false positive rate	segment metric below approved threshold	Risk / CX	release gate and monitoring

10.3 Solver Architecture Template

Decision API
  receives business context, entity ids, time horizon, requested objective profile

Input assembler
  loads features, forecasts, resource state, policy version, constraint version

Validation layer
  checks schema, data freshness, permissions, missing values, scenario id

Model builder
  creates sets, parameters, variables, objective, hard constraints, soft penalties

Solver adapter
  calls OR-Tools / SciPy / PuLP-CBC / Gurobi with approved configuration

Result validator
  checks feasibility, policy compatibility, output completeness, reason codes

Explanation layer
  summarizes objective value, binding constraints, tradeoffs, scenario deltas

Workflow publisher
  sends executable actions to WFM, CRM, case management, pricing or queue system

Audit publisher
  writes trace id, versions, solver status, input hash, output, override hooks

Monitoring
  tracks latency, infeasible rate, solution quality, business KPI, guardrails

10.4 Scenario Analysis Template

Scenario	Parameter change	Expected business question	Output to compare
Base	Current forecast and capacity	当前方案是否可行	objective value、SLA、cost、risk
Demand shock	Demand +15% in peak windows	高峰冲击下哪里先失守	binding constraints、capacity gap
Capacity loss	Reviewer / agent availability -20%	缺勤或外包中断时如何降级	unmet SLA、high-risk queue aging
Risk appetite tighter	Fraud friction guardrail stricter	更少误拦截会牺牲多少挽损	prevented loss vs friction
Budget pressure	Overtime budget -30%	成本压缩后哪些服务水平下降	SLA delta、customer impact
Model uncertainty	Use upper / lower forecast bands	预测误差对决策是否敏感	solution stability、reroute count

10.5 Sensitivity / Shadow Price Template

Resource constraint	Analysis method	Interpretation	Decision use
Fraud reviewer hours	LP relaxation shadow price + scenario re-solve	多 1 小时审核能力的边际挽损	支持 headcount 或外包审批
Bilingual agent capacity	Scenario delta	多 1 名双语坐席对 SLA 和 abandon rate 的影响	招聘、培训和班次设计
Inventory capacity	LP / MILP scenario	多 1 单位容量对缺货和毛利的影响	仓储、补货和调拨策略
Overtime budget	Parametric re-solve	加班预算变化对服务水平的影响	预算谈判和节假日计划
Collections contact limit	Guardrail stress test	联系强度上限对回款和投诉的影响	风险偏好和客户保护治理

使用原则:

LP shadow price 可作为边际价值语言。
MILP / CP-SAT 场景要用 re-solve、relaxation 和离散增量解释。
不把 shadow price 单独作为预算审批结论，必须结合实际可雇佣性、服务质量、客户影响和执行约束。

10.6 Exception Workflow Template

State	Trigger	Automated response	Human role	Evidence
Feasible	Solver returns valid plan	Publish plan after policy check	Review only for high-impact changes	trace id, objective, constraints
Feasible with warning	Time limit with acceptable incumbent	Publish with warning or request approval	Operations lead approves	gap, risk summary, affected units
Infeasible	Hard constraints conflict	Produce conflict summary and relaxation options	Business owner selects response	violated constraints, scenario
Data failure	Stale forecast or missing capacity	Use approved fallback or stop automation	Data owner and operations owner	data quality event
Policy blocked	Output violates policy gate	Stop action and escalate	Policy owner reviews	policy id, blocked action
Override	Human changes output	Record reason and approval	Authorized manager	original and changed decision

10.7 30-Day / Interview Output Template

Day range	Output	Interview proof
Days 1-5	One optimization problem canvas for a金融零售场景	能把业务决策拆成变量、目标、约束和执行结果
Days 6-10	LP / MILP / CP-SAT comparison memo	能解释为什么某场景用 CP-SAT 而不是简单排序
Days 11-15	Solver decision service architecture	能画出 forecast-to-optimization-to-workflow 架构
Days 16-20	Scenario and sensitivity pack	能讲清 shadow price、capacity business case 和风险偏好
Days 21-25	Governance and audit evidence binder	能说明 NIST AI RMF 如何落到优化决策系统
Days 26-30	Interview story and portfolio case	能用 staffing、fraud、collections、inventory/pricing 或 contact center 做完整案例

11. 30 天训练计划

Week 1: OR for AI Decisioning 基础到建模

Day	训练主题	输出
1	选择一个金融零售决策场景，写 decision inventory	决策名称、owner、频率、影响对象、自动化等级
2	把场景拆成 sets、parameters、decision variables	变量清单和数据来源
3	写 objective function 的业务解释和数学方向	objective memo
4	分类 hard / soft / guardrail constraints	constraint registry v1
5	画 forecast-to-optimization 流程	从预测到执行的 sequence

Week 2: LP / MILP / CP-SAT / Routing 方法选择

Day	训练主题	输出
6	用 LP 表达连续资源分配 baseline	LP problem note
7	用 binary variables 表达是否选择、是否分配	MILP modeling note
8	用 CP-SAT 思路表达排班、互斥、覆盖和偏好	CP-SAT modeling note
9	用 routing / scheduling 语言描述时间窗和路径	routing scenario note
10	写 solver selection ADR	为什么选 LP、MILP、CP-SAT 或 routing

Week 3: AI + Optimization 产品架构

Day	训练主题	输出
11	定义 AI 输入及其误差如何影响决策	forecast risk matrix
12	设计 decision service API 和 schema	API contract sketch
13	设计 solver runtime controls	time limit、fallback、gap、status handling
14	设计 Agent proposes / solver decides 交互	agent boundary and validation memo
15	画端到端架构图	solver decision service architecture

Week 4: Scenario、Sensitivity、Governance、Interview

Day	训练主题	输出
16	设计 base、demand shock、capacity loss 场景	scenario pack
17	做 sensitivity / shadow price 解释	capacity business case
18	写 exception workflow	infeasible、time limit、data failure 流程
19	写 audit event schema	decision evidence fields
20	用 NIST AI RMF 做治理映射	Govern / Map / Measure / Manage table
21	Retail workforce case 深挖	staffing optimization story
22	Fraud review queue case 深挖	fraud queue optimization story
23	Credit collections case 深挖	collections optimization story
24	Inventory / pricing case 深挖	pricing-inventory optimization story
25	Contact center scheduling case 深挖	scheduling optimization story
26	准备 30 秒 pitch	short answer
27	准备 2 分钟架构说明	architecture answer
28	准备 tradeoff 追问	multi-objective answer
29	准备治理追问	audit and risk answer
30	组合作品集 narrative	one-page portfolio case

12. 面试答案

12.1 为什么 AI 决策系统需要 operations research / optimization

30 秒回答

AI 负责预测风险、需求、响应概率和候选动作，但金融零售的真实决策通常受容量、SLA、合规、预算、技能和客户保护约束。Operations research 把这些约束和目标转成可求解、可审计、可执行的优化问题，让 AI 从“给分数”升级为“在约束下做最优行动组合”。

2 分钟回答

如果 fraud 模型给每个交易一个风险分，按分数排序只能解决优先级的一小部分。实际运营还要考虑审核员容量、技能、预计处理时长、客户误拦截成本、SLA 和监管要求。优化层可以把这些因素放进 objective 和 constraints，输出可执行的审核队列和分配方案。

架构上，我会把它设计成 forecast-to-optimization decision service: 模型输出预测参数，constraint registry 提供容量和政策，solver service 求解 LP / MILP / CP-SAT 或 routing 问题，policy gate 做最终控制，workflow 执行动作，audit store 记录版本、输入、约束、求解状态和人工 override。这样 AI 决策系统不仅更有效，也更可治理。

12.2 LP、MILP 和 CP-SAT 怎么选

30 秒回答

如果变量连续、目标和约束线性，用 LP；如果有是否选择、是否分配、整数数量，用 MILP；如果是复杂排班、互斥、覆盖、时间窗和逻辑约束很多，CP-SAT 往往更合适。选择不是看算法名，而是看决策变量、约束结构、求解时间和生产解释需求。

2 分钟回答

比如预算在渠道间连续分配，可以用 LP 做 baseline，也方便做 shadow price 和 sensitivity。Fraud case 分配给 reviewer 是 binary assignment，更适合 MILP。Retail workforce 和 contact center scheduling 有大量班次、休息、技能、互斥、偏好和覆盖规则，CP-SAT 的表达力会更好。Routing 则要考虑路径、容量和时间窗，通常用专门的 routing solver。

产品上还要考虑 SLA。如果在线同步只能给 200 毫秒，就不适合每次求大规模 MILP；可以用预计算策略、heuristic、缓存或分层求解。离线周排班可以给更长时间，追求更高质量方案和 scenario analysis。

12.3 如何处理 multi-objective tradeoffs

30 秒回答

我会先区分不可交易的 hard constraints、可交易的 business objectives 和上线后监控的 guardrails。多目标可以用 weighted sum、lexicographic priority、epsilon constraints 或 Pareto scenarios。关键不是把所有东西揉成一个分数，而是让权重、优先级、风险偏好和业务影响被 owner 明确批准并可审计。

2 分钟回答

以 fraud review 为例，目标至少包括预期挽损、客户摩擦、审核成本和 SLA。客户保护、授权和监管要求是 hard constraints；挽损和成本可以进入 objective；误拦截率、投诉率和 segment impact 是 guardrail。

如果风险团队要求先守住客户摩擦上限，我会用 epsilon constraint: 在 false positive impact 不超过阈值的前提下最大化挽损。如果高层要比较不同风险偏好，我会输出 Pareto scenario，让他们看到每降低一点摩擦会损失多少挽损。这样 tradeoff 是透明的，而不是藏在模型分数里。

12.4 怎么解释 forecast-to-optimization

30 秒回答

Forecast-to-optimization 是把 AI 预测结果作为优化模型参数，再由 solver 在约束下选择行动。比如预测每半小时呼入量和 AHT，然后优化坐席排班、技能覆盖和休息安排。预测告诉我们可能发生什么，优化决定我们该如何配置资源。

2 分钟回答

关键是预测输出必须带时间粒度、实体粒度、置信区间和版本。Contact center 里，呼入量预测、AHT 预测、转人工率预测会转成每个时段的 capacity demand。优化模型再考虑坐席技能、班次、休息、SLA、外包容量和成本，生成班表和溢出策略。

如果预测不确定性高，我不会只用一个点预测，而会做 base、upper band、lower band 和 stress scenario，观察方案是否稳定。生产上还要把实际呼入、等待时间、abandon rate、repeat contact 回流给预测模型和 constraint registry。

12.5 Agent proposes / solver decides 为什么重要

30 秒回答

Agent 擅长理解上下文、生成候选方案和解释，但不应该直接决定受约束的高影响行动。成熟架构应该让 Agent 提出结构化 proposal，solver 检查目标和约束并选择可行方案，policy gate 决定能否执行，workflow 和 audit 负责落地与留证。

2 分钟回答

例如门店运营 Agent 发现周五下午客流异常，提出“增加两名兼职并延长营业支持”。这个建议必须转成结构化输入: 哪些门店、哪些时段、哪些技能、成本上限和服务目标。Solver 再检查员工可用性、劳动规则、预算和最低覆盖，输出可行排班。Policy gate 再确认是否符合授权和审批要求。

这样可以保留 Agent 的解释能力和运营洞察，同时避免 prompt 直接覆盖劳动法规、预算、资质或客户保护约束。

12.6 Solver 找不到可行解怎么办

30 秒回答

不可行不是简单报错，而是产品工作流。系统应输出冲突约束、影响范围和可批准的 relaxation options，并按预设层级处理: 先放松体验偏好，再调整运营目标，高风险偏好需要批准，法规和授权边界不可放松。

2 分钟回答

以 contact center scheduling 为例，如果某天高峰双语技能不足，solver 可能 infeasible。系统需要说明是哪几个时段、哪类技能、哪些 SLA 约束冲突。可选动作包括启用 callback、调整休息、使用外包、批准加班、降低非关键队列 SLA，或将部分咨询引导到异步渠道。

但是不能放松敏感业务授权或合规边界。所有 relaxation 都要有 owner、审批和审计记录。长期看，不可行率本身是 capacity planning 的信号。

12.7 Shadow price 在业务里怎么讲

30 秒回答

Shadow price 可以解释一个资源约束多增加一单位时目标值的边际变化，适合 LP 或 LP relaxation。业务上可以说“多 1 小时高技能审核能力大约带来多少预期挽损”。但对 MILP 和 CP-SAT，不能机械套用，要用场景重求解和离散增量解释。

2 分钟回答

我会把 shadow price 用作 capacity business case 的起点，而不是最终结论。比如 fraud queue 的 LP relaxation 显示高技能 reviewer 小时的边际价值很高，说明这个约束是瓶颈。然后我会做 scenario re-solve: 增加 1 人、2 人、不同班次和不同技能组合，观察实际挽损、SLA、误拦截和成本变化。

这比只说“我们缺人”更有说服力，因为它把 headcount 或外包预算和可量化业务价值连接起来。

12.8 如何把优化决策系统做成可审计架构

30 秒回答

每次决策都要记录 trace id、输入数据版本、预测模型版本、约束版本、目标权重、solver 配置、求解状态、输出、policy check、人工 override 和最终结果。治理上按 NIST AI RMF 做 Govern、Map、Measure、Manage，确保 owner、风险、监控和整改闭环清楚。

2 分钟回答

金融零售里，优化决策可能影响客户权益、员工排班、信贷催收、欺诈拦截和定价。因此不能只保存最终结果。我们要能复现“当时为什么这么决定”。

我会建立 decision audit event，并在 release gate 检查: objective 和 constraint 是否有 owner，权重是否批准，scenario 是否覆盖压力情况，infeasible 和 data failure 是否有 fallback，客户伤害和公平性是否监控，人工 override 是否有原因和审批。这样 solver 才不是黑箱，而是可治理的 decision service。

13. 高级作品集表达

如果把本 playbook 转成作品集，可以用一个金融零售案例贯穿:

Case: AI-assisted fraud review queue optimization

Business problem
  Fraud model can score cases, but reviewer capacity is limited and customer friction is high.

Product architecture
  Feature service + risk model + constraint registry + MILP solver service + policy gate + case workflow + audit store.

Optimization model
  Variables: assign / release / hold / escalate.
  Objective: maximize expected prevented loss minus friction and SLA penalty.
  Constraints: reviewer capacity, skill, SLA, high-risk mandatory review, customer protection.

AI + OR collaboration
  AI predicts fraud probability, loss, handling time and friction.
  Solver chooses feasible action mix.
  Agent explains bottlenecks and proposes scenario narratives.

Governance
  NIST AI RMF mapping, audit event schema, override review, scenario stress test, rollback criteria.

Business value
  Higher prevented loss per reviewer hour, lower false positive friction, clearer capacity investment case.

面试中最强的表达不是“我懂 OR-Tools”，而是:

我能把 AI 预测、业务约束、风险偏好、solver 服务、工作流执行和治理审计连接成一个可上线的决策系统。