返回 Papers
AI 扩展计划 / Playbooks

AI Optimization / Operations Research Decision Playbook

这些来源作为术语、架构和治理锚点。本文把它们转成 AI 产品、金融零售运营和企业架构可执行的工作语言。

923AI_OPTIMIZATION_OPERATIONS_RESEARCH_DECISION_PLAYBOOK.md

AI Optimization / Operations Research Decision Playbook

适用对象: AI Product Architect、AI PM、Decision Intelligence Lead、Risk Product、Retail Operations Product、Platform Architect、Model Risk / Governance Partner。 核心问题: 当 AI 已经能预测需求、风险、意图和优先级时,如何把预测结果转成满足约束、可审计、可解释、可运行的最优业务决策。 一句话定位: 这是一份把 operations research、linear / integer programming、CP-SAT、routing、scheduling、AI decisioning 和金融零售运营场景连接起来的高级产品架构手册。 边界说明: 本文不是 BA 入门、数学教材、供应商选型报告、法律意见或模型验证报告;正式落地必须结合业务 owner、risk、legal、compliance、data、security、architecture review 和 model risk governance。


Source Anchors

这些来源作为术语、架构和治理锚点。本文把它们转成 AI 产品、金融零售运营和企业架构可执行的工作语言。

AnchorOfficial / primary source本文用法
Google OR-Toolshttps://developers.google.com/optimization用作开源 optimization suite 锚点,覆盖 linear optimization、integer optimization、constraint programming、routing 和 scheduling。
OR-Tools CP-SAT Solverhttps://developers.google.com/optimization/cp/cp_solver用于解释 CP-SAT 在离散变量、复杂约束、排班、资源分配和可行性搜索中的适用边界。
OR-Tools Routinghttps://developers.google.com/optimization/routing用于 routing、vehicle routing、time windows、capacity constraints 和服务路径优化的架构表达。
OR-Tools Scheduling Exampleshttps://developers.google.com/optimization/scheduling/employee_scheduling用于 retail workforce、contact center、branch staffing 等排班建模参考。
SciPy linproghttps://docs.scipy.org/doc/scipy/reference/generated/scipy.optimize.linprog.html用于连续线性规划、LP baseline、shadow-price 解释前的模型校验和轻量级实验。
Gurobi Optimizer Documentationhttps://docs.gurobi.com/projects/optimizer/en/current/用于生产级 LP / MILP / MIQP、multi-objective optimization、MIP gap、warm start、sensitivity 和 solver operations 语言。
Gurobi Multi-Objective Optimizationhttps://docs.gurobi.com/projects/optimizer/en/current/features/multiobjective.html用于多目标权重、优先级、lexicographic optimization 和业务 tradeoff 设计。
PuLPhttps://coin-or.github.io/pulp/用于 Python 建模接口、LP / MILP 快速建模、开源求解器连接和作品集原型。
COIN-ORhttps://www.coin-or.org/用于开源 OR solver ecosystem、CBC、Clp 和企业内可解释原型的技术背景。
NIST AI RMFhttps://www.nist.gov/itl/ai-risk-management-framework用 Govern / Map / Measure / Manage 组织 AI + optimization 决策系统的风险、监控、证据和治理。

1. 一句话定位

AI 决策系统的成熟表达不是“模型给一个分数”,而是:

AI predicts.
Optimization allocates.
Policy constrains.
Workflow escalates.
Audit remembers.

中文表达:

AI 负责预测和生成候选方案,优化模型负责在约束下选择行动组合,策略层负责边界控制,工作流负责例外升级,审计层负责复盘证据。

这份 playbook 关注的不是“如何写一个算法题”,而是如何把优化问题产品化为可上线的 decision service:

  • 输入来自预测模型、业务规则、库存、人员、渠道、风险、合同和 SLA。
  • 输出是可执行的排班、分流、定价、库存、催收、审核、路由或资源分配方案。
  • 中间有 objectives、constraints、scenario analysis、sensitivity、exception workflow、human override 和 audit trail。
  • 结果必须在金融零售场景中满足客户公平性、合规边界、操作韧性和业务可解释性。

2. 为什么重要

很多 AI 产品到生产阶段会卡在同一个问题:

模型知道“可能发生什么”,但业务需要决定“现在该怎么分配有限资源”。

金融零售里,真实决策通常不是单点预测,而是受约束的组合优化:

场景AI 常见输出真正要决策的问题缺少优化层的风险
零售门店 staffing每小时客流、交易量、服务需求预测每家店每个时段安排多少人、什么技能、什么班次高峰期缺人、低峰期冗员、员工体验差、劳动法规风险
Fraud review queues交易欺诈概率、损失金额、客户影响有限审核员先看哪些 case,哪些自动放行、拦截或升级高价值欺诈漏审,低风险 case 占用人工,客户摩擦扩大
Credit collections还款概率、违约风险、客户响应倾向哪些客户通过短信、电话、宽限、重组或人工跟进催收成本失控、客户伤害、监管投诉、回款效率低
Inventory / pricing需求预测、价格弹性、缺货概率如何在库存、毛利、渠道、保质期和竞争约束下调价与补货局部最优、缺货与滞销并存、促销侵蚀利润
Contact center scheduling呼入量、AHT、渠道迁移、服务等级预测如何安排班次、技能组、休息和溢出策略SLA 失守、坐席过载、加班成本高、客户等待时间变长

如果没有 OR / optimization 层,AI 产品容易退化成三种低成熟形态:

低成熟形态表面上看起来实际问题
Scoreboarddashboard 显示风险、需求、机会分数没有告诉运营团队如何行动,也没有考虑容量约束
Rule pile在模型分数上叠加越来越多 if / else规则之间冲突,难以证明结果最优或可行
Manual allocationAI 给建议,人手工排队、排班、调价、分配操作负担转移给员工,结果不可复现,无法规模化

高级 AI 产品架构要把“预测”推进到“可执行决策”:

forecast / score / candidate
-> optimization model
-> feasible action plan
-> decision service
-> workflow execution
-> outcome feedback
-> model and constraint improvement

3. 优化决策服务架构

3.1 参考架构

flowchart TB
  E[Business events<br/>transactions, applications, cases, demand, inventory] --> F[Feature and state layer]
  F --> M[AI / forecasting services<br/>risk score, demand forecast, elasticity, response propensity]
  F --> C[Constraint registry<br/>capacity, policy, labor rules, SLA, risk appetite]
  M --> D[Decision request builder]
  C --> D
  D --> S[Solver decision service<br/>LP / MILP / CP-SAT / routing / scheduling]
  S --> P[Policy and guardrail check<br/>eligibility, fairness, compliance, authorization]
  P --> W[Workflow execution<br/>assign, schedule, price, route, queue, escalate]
  W --> A[Audit and evidence store]
  W --> O[Outcome feedback<br/>actual demand, handling time, fraud loss, recovery, SLA]
  O --> M
  O --> C
  S --> X[Scenario and sensitivity service]
  X --> B[Business review<br/>tradeoff, capacity, risk appetite]

关键设计原则:

原则含义架构动作
Forecast-to-optimizationAI 预测不是终点,必须变成优化模型参数预测服务输出带置信区间、版本、适用范围和时间粒度
Solver as decision servicesolver 不是离线 notebook,而是有 SLA、输入契约和审计日志的服务建立 decision API、schema validation、time limit、fallback、trace id
Constraints outside prompt约束不能藏在 prompt 或自然语言建议里使用 constraint registry、policy engine、rule version 和 test suite
Agent proposes / solver decidesAgent 可以生成候选方案和解释,但不能绕过可行性与约束Agent 输出结构化 proposal,solver 输出 feasible plan,policy 层做最终门禁
Optimization under governance最优解必须能解释目标、约束、版本和取舍记录 objective weights、constraint binding status、solver status、override reason

3.2 Solver Decision Service 的产品边界

一个生产级 solver decision service 至少包括:

能力说明金融零售例子
Decision API接收业务上下文、预测、资源、约束和策略版本POST /staffing/optimizePOST /fraud-queue/prioritize
Model builder把输入转成变量、目标、约束、求解器格式将门店、时段、技能、员工合同转成排班变量
Solver adapter封装 OR-Tools、Gurobi、PuLP / CBC、SciPy 等求解器同一业务模型可在开源和商业 solver 间切换
Runtime controlstime limit、MIP gap、solution pool、warm start、deterministic seed高峰前 2 分钟内产出可用排班调整
Feasibility handlinginfeasible diagnosis、constraint relaxation、soft penalty找出是技能覆盖、工时上限还是休息规则造成不可行
Explanation layer输出为什么这样分配、哪些约束绑定、目标如何取舍“晚班少 1 名持证员工会导致高峰 SLA 风险上升”
Scenario runner对需求、容量、风险偏好和成本参数做 what-if节假日客流 +15%、审核人手 -20%、加班成本翻倍
Audit trail记录输入、版本、求解状态、输出、人工 override客户争议、监管检查、模型风险审查时可复盘

3.3 在线、准实时、离线三类运行模式

模式适用决策延迟目标常用 solver 形态设计重点
在线同步支付授权是否升级人工、客服 Agent 是否可调用工具毫秒到秒级简化 LP、预计算策略、规则短路、top-k assignment可用性、降级、确定性、极低延迟
准实时fraud review queue 优先级、collections daily campaign、当日 workforce rebalancing秒到分钟级MILP、CP-SAT、heuristic + solver repair容量、可解释、时间窗、滚动优化
离线批量周排班、补货、价格计划、区域资源配置分钟到小时级MILP、CP-SAT、routing、scenario batch多场景比较、审批、审计、业务 sign-off

4. 问题建模

4.1 优化问题的基本结构

一个可落地的 optimization decisioning problem 通常由 7 类对象组成:

对象作用例子
Sets / indexes定义决策维度门店、员工、时段、技能、case、客户、产品、路线
Parameters已知输入或预测输入需求预测、风险分数、单位成本、容量、价格弹性、处理时长
Decision variables系统要选择的行动是否安排员工 e 在时段 t;case c 是否分给 reviewer r;产品 p 是否降价
Objective function优化目标最小成本、最大回款、最大服务水平、最小风险损失、最大毛利
Constraints必须满足或带惩罚的边界劳动法规、工时、技能、预算、SLA、公平性、库存、风险承受度
Solver settings求解策略time limit、MIP gap、warm start、objective priority、solution pool
Output contract可执行结果班表、审核顺序、催收名单、补货量、价格动作、升级队列

4.2 线性规划、整数规划、CP-SAT 的区别

方法核心表达适用场景产品架构提醒
Linear Programming, LP连续变量 + 线性目标 + 线性约束资源连续分配、预算分配、产能规划、初始 capacity analysis适合 baseline、shadow price、敏感性分析,但不能直接表达“是否选择”这类离散动作
Integer / Mixed-Integer Programming, IP / MILP变量包含 binary / integer,目标和约束通常线性排班、分配、routing、portfolio selection、fraud case assignment能表达离散决策,但要管理求解时间、MIP gap、可行解质量
CP-SATConstraint Programming + SAT + integer reasoning员工排班、复杂业务规则、组合约束、可行性强于目标优化的场景适合表达大量逻辑约束、时间窗、互斥、覆盖、软硬约束组合
Routing / VRP solvers路径、车辆、容量、时间窗和服务点现金运钞、上门服务、门店配送、现场维护要把地理、时间窗、容量、优先级和服务时长一起建模
Heuristics + repair先用启发式生成方案,再由 solver 修复约束大规模实时分配、秒级 queue routing、动态重排必须标明可行性保证边界,不把启发式当作最优证明

4.3 建模语言示例

以 fraud review queue 为例:

Sets
  C = fraud cases
  R = reviewers
  T = review time buckets

Parameters
  p_c = fraud probability predicted by AI
  loss_c = estimated loss if case is not reviewed
  friction_c = customer friction cost if case is held
  a_r,t = reviewer availability
  skill_r,k = reviewer skill coverage
  handle_c = estimated handling time
  sla_c = latest acceptable review time

Decision variables
  x_c,r,t = 1 if case c is assigned to reviewer r in time bucket t, else 0
  y_c = 1 if case c is auto-released or deferred, else 0

Objective
  maximize expected prevented loss
  minus customer friction
  minus operational cost
  minus SLA penalty

Constraints
  each case assigned at most once
  reviewer capacity per time bucket
  skill eligibility
  high-risk cases reviewed before SLA
  fairness and customer harm guardrails

这段建模语言比“AI 按风险排序”更成熟,因为它明确表达了容量、技能、SLA、摩擦和风险取舍。


5. 目标与约束

5.1 Objectives: 优化什么

高级 AI + OR 产品必须把 objective 从口号改成可计算函数。

Objective 类型业务表达数学表达方向常见风险
Cost minimization降低加班、人力、库存、审核成本minimize cost过度压缩资源导致 SLA 或客户体验下降
Profit / value maximization最大化毛利、回款、挽损、转化maximize expected value忽视公平性、合规或长期关系
Service level maximization提高接通率、按时审核、门店覆盖maximize SLA attainment成本可能激增
Risk minimization降低欺诈、违约、投诉、操作风险minimize expected loss / risk exposure可能产生过度拦截或客户摩擦
Workload balancing平衡员工负载、审核复杂度、班次偏好minimize variance / imbalance可能牺牲局部效率
Customer harm minimization降低误拦截、过度催收、等待时间minimize harm penalty需要良好的 harm taxonomy 和权重治理

5.2 Constraints: 什么不能突破

约束不是“业务补充说明”,而是决策系统的控制面。

Constraint 类型例子建模方式
Capacity审核员每天 6 小时有效审核时间;门店每时段最多 8 人hard constraint 或 capacity penalty
Skill / eligibility持证员工才能处理某类咨询;高级 reviewer 才能处理账户接管binary eligibility matrix
Labor / contract每周工时上限、休息间隔、夜班限制、加班规则CP-SAT / MILP hard constraints
SLA / time window高风险交易 30 分钟内审核;客户来电 80% 在 20 秒内接通time window constraint + penalty
Budget外包坐席、加班、折扣、补货预算上限budget constraint
Inventory货架容量、保质期、安全库存、渠道库存不可为负flow / stock constraints
Fairness / customer protection不同客户群体误拦截差异、催收联系频率、特殊保护人群guardrail constraint + monitoring
Compliance / policy不允许自动拒绝某类受监管决策;需人工确认policy constraint outside solver
Explainability客户影响决策必须输出 reason code 和证据output contract constraint

5.3 Hard constraints 与 soft constraints

类型含义示例设计建议
Hard constraint不允许违反员工没有资质不能处理投资建议;库存不能为负放入 solver 或 policy gate,违反即不可执行
Soft constraint可违反但有代价员工班次偏好、低优先级 SLA、低风险 case 延迟加 penalty,输出 violation summary
Guardrail metric上线后持续监控误拦截率、投诉率、人工 override 率不一定进入目标函数,但进入 release gate 和 monitoring

不要把所有约束都设成 hard。生产系统如果过度硬化,会频繁 infeasible;如果过度软化,会把风险藏进 penalty 权重。成熟做法是:

不可违反的法律、资质、安全、授权边界 = hard constraint
可业务协商的体验、偏好、次级 SLA = soft constraint
需高层设定 appetite 的风险、成本、公平性 = governed tradeoff

5.4 Multi-objective tradeoffs

金融零售 AI 决策几乎都不是单目标问题。常见 tradeoff:

  • Fraud loss vs customer friction
  • Collections recovery vs customer harm
  • Contact center SLA vs staffing cost
  • Inventory availability vs markdown risk
  • Pricing margin vs market share
  • Workforce fairness vs operational efficiency

多目标处理方式:

方法说明适用场景风险
Weighted sum把多个目标加权成一个目标函数权重可治理、指标单位可归一化时权重争议大,容易把不可突破边界误当可交易
Lexicographic priority先优化一级目标,再在可接受范围内优化二级目标风险、合规、SLA 优先级明确时低优目标可能被压缩过度
Epsilon constraint把一个目标作为主目标,其他目标设最低门槛“成本最低但 SLA 不低于 95%”阈值需要业务和风险 owner 明确确认
Pareto scenario输出多组非支配方案供业务比较高层做 risk appetite / capacity 决策需要清晰的可视化和解释
Goal programming每个目标设目标值和偏离惩罚多部门协商型资源分配偏离惩罚设计复杂

成熟表达不是“我们优化综合得分”,而是:

主目标是什么。
哪些指标是不可突破 guardrail。
哪些指标可用权重交易。
权重由谁批准。
不同权重下的业务结果如何变化。
生产中如何监控 tradeoff 是否偏离预期。

5.5 Sensitivity 与 shadow prices

Sensitivity analysis 用来回答:

如果多 1 个审核员、多 1 小时门店工时、多 1 万预算、多 5% 库存容量,业务价值会增加多少。

Shadow price 在连续 LP 或 LP relaxation 中更有解释价值,它描述某个约束右侧资源增加一个单位时,目标函数的边际变化。对于 MILP / CP-SAT,整数性和逻辑约束会让 shadow price 不再直接等同真实边际价值,需要用 scenario analysis、relaxation、local re-solve 或 controlled experiment 来解释。

场景可解释问题产品动作
Fraud review capacity增加 1 名高技能 reviewer 的预期挽损用于 headcount business case
Contact center staffing多 1 小时 bilingual capacity 对 SLA 的价值用于技能招聘和班次设计
Inventory allocation多 1 单位安全库存对缺货损失的缓解用于补货和仓储容量决策
Collections campaign增加 1 小时人工催收对回款的边际提升用于渠道组合和外包预算
Retail staffing高峰时段多 1 名员工对等待时间和转化的影响用于门店排班和加班审批

6. AI + OR 协同

6.1 Forecast-to-optimization

Forecast-to-optimization 是把预测模型的输出转成优化模型参数的过程。

Demand forecast
-> demand distribution by time / location / segment
-> staffing or inventory optimization
-> schedule / replenishment plan
-> actual demand and service outcome
-> forecast calibration and constraint update

关键不是“预测越准越好”这么简单,而是预测误差如何影响最优决策:

AI 输出优化参数需要治理的误差
客流预测每店每时段 minimum coverage高峰低估会造成排队和转化损失
欺诈概率case expected value 和 review priority高风险低估会造成损失,低风险高估会造成误拦截
回款概率collections channel allocation过度联系低响应客户会造成客户伤害和投诉
价格弹性pricing objective / demand response弹性估计错会导致利润和销量双损
AHT 预测contact center capacity consumption处理时长低估会造成 SLA 失守

6.2 Agent proposes / solver decides

LLM Agent 在优化决策系统里有价值,但边界必须清楚。

角色可以做不应该做
Agent读取政策、总结运营异常、提出候选约束、解释方案、生成 scenario narrative直接绕过 solver 决定排班、定价、审核和催收动作
Solver在结构化目标和约束下选择可行方案理解自然语言政策的真实法律含义
Policy engine授权、资格、合规边界、客户保护门禁优化连续资源分配
Human owner设置风险偏好、批准权重、处理例外、承担业务责任手工修补所有 case-level 决策

推荐架构:

Agent reads context and proposes structured candidate:
  proposed objective changes
  proposed constraints
  proposed scenario
  explanation and assumptions

Validation layer checks:
  schema
  allowed fields
  policy compatibility
  data lineage
  owner approval requirement

Solver decides:
  feasible solution
  objective value
  binding constraints
  tradeoff summary

Policy and workflow decide execution:
  allowed action
  escalation
  audit event

6.3 AI + Optimization 的常见组合模式

模式工作方式示例
Predict then optimizeML 先预测参数,solver 再优化预测呼入量后做 contact center scheduling
Optimize with learned costML 估计每个动作的收益或成本,solver 组合选择预测每个催收渠道的回款概率和客户伤害
Generate candidates then solveAI 生成候选动作集合,solver 从中选择可行组合Agent 提出促销组合,MILP 选出预算内方案
Solve then explainsolver 产出方案,LLM 生成面向运营的解释“为什么本周三需要 2 名会西语坐席”
Simulation then optimize仿真生成压力场景,solver 比较韧性方案节假日客流、系统故障、人员缺勤联合压力测试
Human-in-the-loop optimizesolver 给方案和取舍,人批准风险偏好或例外催收策略、重大价格调整、门店关闭时段调整

7. 场景分析

7.1 Retail Workforce / Staffing Optimization

建模元素内容
决策每家门店、每个时段、每个技能组安排哪些员工和班次
AI 输入客流预测、交易量预测、服务需求预测、促销影响、天气和节假日特征
变量x_employee_shift_store_time,员工是否在某店某时段工作
目标最小化人力成本、加班、缺口 penalty,同时最大化服务覆盖和员工偏好满足
约束工时上限、休息间隔、技能覆盖、最低开店人数、劳动法规、预算、员工可用性
SolverCP-SAT / MILP;复杂班次和逻辑规则偏 CP-SAT
输出周班表、缺口报告、加班建议、跨店支援方案
指标服务覆盖率、排队时间、销售转化、员工排班公平性、加班成本
例外预测需求超过可用人力、关键技能缺口、员工突然缺勤

高级产品洞察:

  • staffing 不是简单的“按预测客流配人”,而是技能、合同、偏好、法规、成本和体验之间的组合优化。
  • 最有价值的 PM 输出不是班表本身,而是 capacity business case: 哪些时段的 shadow value 最高,哪类技能的边际价值最大。
  • 如果 AI 只预测客流,不连接 solver 和 workforce management 系统,业务仍然要手工排班,产品价值会被消耗在操作层。

7.2 Fraud Review Queues

建模元素内容
决策哪些交易、账户或申诉 case 进入人工审核;由谁审核;在什么时限前处理
AI 输入欺诈概率、预期损失、客户价值、误拦截风险、case 复杂度、处理时长
变量case-reviewer-time assignment、auto release、hold、escalate
目标最大化预期挽损,最小化客户摩擦、审核成本、SLA breach 和投诉风险
约束审核员容量、技能、时限、监管要求、高风险强制审核、客户保护规则
SolverMILP / rolling horizon optimization;秒级队列可用 heuristic + solver repair
输出审核优先级、分配方案、自动放行列表、升级列表、容量缺口
指标prevented loss、false positive impact、review SLA、override rate、customer friction
例外模型置信度低、数据缺失、case 类型超出授权、队列拥堵

高级产品洞察:

  • “按风险分从高到低审核”不是最优,因为它忽略了损失金额、处理时长、SLA、客户影响和 reviewer 技能。
  • 如果两个 case 风险相同,预期损失更高、处理更快、SLA 更紧的 case 可能更优先。
  • 误拦截成本必须进入 objective 或 guardrail,否则优化会倾向于过度保守。

7.3 Credit Collections Optimization

建模元素内容
决策哪些客户进入哪个催收渠道、联系频率、联系时间、是否给出重组或宽限方案
AI 输入还款概率、渠道响应倾向、客户脆弱性信号、预期回款、投诉风险、收入波动
变量customer-channel-time-treatment assignment
目标最大化风险调整后回款,最小化客户伤害、投诉、合规风险和运营成本
约束联系频率上限、禁止联系窗口、特殊客户保护、渠道容量、监管政策、客户偏好
SolverMILP / multi-objective optimization;高风险策略需要 workflow approval
输出日 campaign、渠道分配、人工跟进列表、暂停联系名单、重组 offer 队列
指标recovery rate、promise-to-pay kept rate、complaint rate、hardship identification、cost per dollar recovered
例外客户进入 hardship、争议账户、身份不确定、法律限制触发

高级产品洞察:

  • collections 的优化目标不能只看短期回款;客户保护和监管风险必须作为 hard constraint 或高优先级目标。
  • AI 可以预测响应倾向,但不应把“最容易被联系成功”误解为“最应该联系”。
  • 优化系统应能说明为什么选择短信、电话、人工、宽限、暂停或升级。

7.4 Inventory / Pricing Optimization

建模元素内容
决策每个产品、门店、渠道、时间段的补货量、调拨量、价格和促销动作
AI 输入需求预测、价格弹性、竞争价格、季节性、库存周转、缺货概率、滞销概率
变量replenish_qty、transfer_qty、price_level、markdown_flag
目标最大化毛利和可得性,最小化缺货、滞销、报废和价格摩擦
约束库存容量、预算、最小毛利、价格变动频率、促销规则、供应提前期、渠道一致性
SolverLP / MILP;价格档位和促销选择常用 binary variables
输出补货计划、门店调拨、价格动作、markdown schedule、缺货风险清单
指标gross margin、stockout rate、sell-through、waste、price override、inventory turns
例外供应中断、价格弹性异常、监管价格限制、关键商品安全库存不足

高级产品洞察:

  • pricing 与 inventory 应联动优化。单独降价可能消化库存,却破坏毛利和品牌;单独补货可能增加滞销风险。
  • AI 价格弹性模型必须进入 scenario,而不是单一确定值。高不确定性商品应设置更保守的价格动作。
  • 对金融零售交叉场景,例如信用卡权益、积分兑换、保险附加服务,也可用库存 / pricing 思路优化额度、权益成本和客户价值。

7.5 Contact Center Scheduling

建模元素内容
决策每个时间段安排多少坐席、什么技能、什么渠道、是否启用外包或 callback
AI 输入呼入量预测、chat demand、AHT、客户意图、转人工率、渠道迁移概率
变量agent-shift-skill-channel assignment、break schedule、overflow routing
目标在成本约束下最大化 service level、first contact resolution 和客户体验
约束技能组覆盖、休息规则、班次偏好、外包容量、SLA、语言能力、敏感业务授权
SolverCP-SAT / MILP;队列仿真可与优化组合
输出班表、技能组覆盖、overflow plan、callback threshold、加班建议
指标ASA、service level、abandon rate、occupancy、schedule adherence、customer satisfaction
例外突发事件呼入激增、系统故障、坐席缺勤、敏感业务队列拥堵

高级产品洞察:

  • contact center 不只是排班问题,还涉及技能路由、渠道迁移、callback 策略和客户风险分层。
  • AHT 预测误差会直接影响 capacity。需要把 AHT uncertainty 进入 scenario analysis。
  • AI Agent 上线后,如果降低 AHT 但增加 repeat contact,优化目标就必须引入 downstream quality guardrail。

7.6 Routing / Scheduling for Field and Branch Operations

建模元素内容
决策哪些任务由哪个团队按什么顺序完成,是否合并路线或调整服务窗口
AI 输入服务时长预测、任务紧急度、失败概率、客户可用时间、交通或区域风险
变量vehicle-route-stop assignment、task sequence、time window selection
目标最小化路程、延迟、失败服务和加班,同时最大化准时率和高价值任务完成
约束车辆容量、人员技能、服务窗口、区域权限、现金或贵重物品安全规则
SolverOR-Tools routing / VRP / time windows;大规模动态场景可分区求解
输出路线、服务顺序、预计到达时间、异常升级
指标on-time rate、route cost、missed appointments、utilization、customer wait
例外路线不可行、客户改约、任务超时、安全事件

8. 例外工作流

Optimization decision service 必须把例外当成一等产品对象。生产系统真正危险的不是“求不到完美最优解”,而是求解失败后系统沉默、误执行或让运营人员无证据地手工修补。

8.1 例外类型

例外类型触发信号系统动作人工动作
Infeasiblesolver 返回 infeasible输出最小冲突集、约束放松建议、不可执行原因owner 决定是否增加容量、调整需求或批准软化次级约束
Time limit到达 time limit 但已有可行解返回 best incumbent、gap、风险提示按 SLA 决定执行当前可行解或升级
No solution无可用方案或输入异常执行 fallback policy,阻止高风险自动动作运营主管进入手工决策工作流
Data quality failure缺失关键参数、预测过期、schema 不匹配拒绝请求或使用批准的 conservative defaultdata owner 修正,business owner 确认影响
Policy conflictsolver 方案违反策略层policy gate 拦截并记录原因policy owner 决定规则是否需变更
Human override人工修改方案记录 override reason、scope、approver后续分析 override 是否暴露模型或约束问题
Customer harm signal投诉、误拦截、过度催收、等待时间异常降低自动化等级,触发监控告警risk / compliance / operations 联合复盘

8.2 约束放松顺序

例外处理不能让一线人员临场猜测。应提前定义 relaxation hierarchy:

第一层: 可放松的体验偏好
  员工偏好、低优先级任务顺序、非关键渠道覆盖

第二层: 可批准放松的运营目标
  低风险 SLA、加班预算、外包使用量、低影响促销频率

第三层: 高层批准后才可调整的风险偏好
  fraud hold threshold、collections contact intensity、关键客户 service level

第四层: 不可放松的边界
  法规、授权、资质、客户保护、数据权限、资金安全

8.3 人工 override 不是失败,而是学习信号

每一次 override 都应该进入 analytics:

字段用途
override actor / role判断是否符合授权
original solution复盘 solver 原始建议
changed decision确认人工改动范围
reason code区分业务例外、数据问题、模型问题、政策问题
customer / employee impact判断是否造成体验或公平性影响
approval path满足审计和责任追踪
outcome衡量 override 是否改进结果

9. 治理与审计

9.1 NIST AI RMF 映射

NIST AI RMF function在 AI + optimization 中的落地
Govern明确 decision owner、risk owner、model owner、constraint owner、solver owner、policy owner;建立变更审批和证据要求
Map识别决策影响对象、业务后果、客户风险、法律边界、数据来源、系统依赖和自动化等级
Measure测量预测质量、优化质量、可行性、SLA、override、客户伤害、公平性、solver stability 和数据质量
Manage上线门禁、rollback、scenario stress test、例外工作流、监控告警、周期性 review 和问题整改

9.2 Decision audit event

每一次优化决策至少要记录:

证据字段说明
decision_id / trace_id贯穿请求、求解、执行、反馈
business context场景、区域、时间窗、客户或员工影响范围
input data version特征、预测、库存、人员、策略、约束版本
model version预测模型、校准模型、embedding 或 LLM 辅助组件版本
optimization model version变量、目标、约束、权重、solver adapter 版本
solver configurationsolver 类型、time limit、MIP gap、seed、warm start、objective priority
solver statusoptimal、feasible、infeasible、time limit、error
objective value总目标值和分目标贡献
binding constraints关键绑定约束和资源瓶颈
output decisions排班、分配、价格、队列、路由等具体动作
policy check result通过、拦截、升级、原因码
human override修改人、原因、审批、影响范围
outcome feedback实际业务结果、客户影响、投诉、SLA、损失或收益

9.3 Model risk 不只在预测模型

AI + OR 系统至少有四类风险:

风险层风险控制
Prediction risk需求、风险、弹性、AHT 预测偏差eval、calibration、drift monitoring、backtesting
Optimization risk目标函数错误、约束遗漏、权重不当、solver 不稳定model review、scenario analysis、unit tests、sensitivity
Execution risk输出无法被 WFM、case system、pricing engine 正确执行integration tests、idempotency、workflow reconciliation
Governance risk无 owner、无证据、人工 override 无记录、policy 被绕过decision inventory、approval matrix、audit event、access control

9.4 Release gate

上线前至少回答:

  • 决策是否被分类为 customer-impacting、employee-impacting、financial-impacting 或 regulated。
  • 每个 objective 和 constraint 是否有 owner。
  • 权重、优先级和 guardrail 是否被批准。
  • 是否有 baseline、challenger、scenario 和 stress test。
  • infeasible、time limit、data failure 是否有明确 fallback。
  • 是否能复现任意一次决策的输入、版本、输出和人工改动。
  • 是否能监控客户伤害、公平性、SLA、成本、override 和 business value。
  • 是否定义了 rollback 条件和责任人。

10. 模板

10.1 Optimization Problem Canvas

模块写法示例
Decision name用业务动作命名,不用算法命名Fraud review queue prioritization
Business owner对结果负责的业务角色Fraud operations director
Decision cadence决策频率和时间窗每 15 分钟滚动优化未来 2 小时队列
Decision unit最小可行动对象case、employee shift、product-store-day、customer-channel
AI inputs预测或生成式组件输出fraud probability、estimated loss、handle time
Decision variables系统要选择的动作assign case to reviewer, defer, release, escalate
Objective主目标和次目标maximize expected prevented loss under friction guardrail
Hard constraints不可突破边界reviewer capacity、skill eligibility、regulatory holds
Soft constraints可用 penalty 处理reviewer workload balance、low-risk SLA
Multi-objective methodtradeoff 方法lexicographic: compliance first, then loss, then cost
Solver choiceLP / MILP / CP-SAT / routing / heuristicMILP for assignment with binary variables
Runtime target延迟、可用性、降级60 seconds, return feasible incumbent on time limit
Exception path不可行或数据失败时流程escalate capacity shortage to operations lead
Audit evidence必须记录的证据input versions, constraints, solver status, binding constraints

10.2 Objective / Constraint Table

类型名称数学方向Owner生产控制
ObjectiveExpected prevented fraud lossmaximize sum(p_c * loss_c * reviewed_c)Fraud productvalue dashboard and backtest
ObjectiveCustomer frictionminimize hold time and false positive penaltyCustomer experiencecomplaint and release monitoring
Hard constraintReviewer capacitysum(handle_c * x_c,r,t) <= capacity_r,tOperationsworkforce feed quality gate
Hard constraintSkill eligibilityx_c,r,t <= skill_match_c,rRisk operationsskill registry version
Soft constraintWorkload balancepenalty for reviewer load varianceOperationsweekly fairness review
GuardrailVIP false positive ratesegment metric below approved thresholdRisk / CXrelease gate and monitoring

10.3 Solver Architecture Template

Decision API
  receives business context, entity ids, time horizon, requested objective profile

Input assembler
  loads features, forecasts, resource state, policy version, constraint version

Validation layer
  checks schema, data freshness, permissions, missing values, scenario id

Model builder
  creates sets, parameters, variables, objective, hard constraints, soft penalties

Solver adapter
  calls OR-Tools / SciPy / PuLP-CBC / Gurobi with approved configuration

Result validator
  checks feasibility, policy compatibility, output completeness, reason codes

Explanation layer
  summarizes objective value, binding constraints, tradeoffs, scenario deltas

Workflow publisher
  sends executable actions to WFM, CRM, case management, pricing or queue system

Audit publisher
  writes trace id, versions, solver status, input hash, output, override hooks

Monitoring
  tracks latency, infeasible rate, solution quality, business KPI, guardrails

10.4 Scenario Analysis Template

ScenarioParameter changeExpected business questionOutput to compare
BaseCurrent forecast and capacity当前方案是否可行objective value、SLA、cost、risk
Demand shockDemand +15% in peak windows高峰冲击下哪里先失守binding constraints、capacity gap
Capacity lossReviewer / agent availability -20%缺勤或外包中断时如何降级unmet SLA、high-risk queue aging
Risk appetite tighterFraud friction guardrail stricter更少误拦截会牺牲多少挽损prevented loss vs friction
Budget pressureOvertime budget -30%成本压缩后哪些服务水平下降SLA delta、customer impact
Model uncertaintyUse upper / lower forecast bands预测误差对决策是否敏感solution stability、reroute count

10.5 Sensitivity / Shadow Price Template

Resource constraintAnalysis methodInterpretationDecision use
Fraud reviewer hoursLP relaxation shadow price + scenario re-solve多 1 小时审核能力的边际挽损支持 headcount 或外包审批
Bilingual agent capacityScenario delta多 1 名双语坐席对 SLA 和 abandon rate 的影响招聘、培训和班次设计
Inventory capacityLP / MILP scenario多 1 单位容量对缺货和毛利的影响仓储、补货和调拨策略
Overtime budgetParametric re-solve加班预算变化对服务水平的影响预算谈判和节假日计划
Collections contact limitGuardrail stress test联系强度上限对回款和投诉的影响风险偏好和客户保护治理

使用原则:

  • LP shadow price 可作为边际价值语言。
  • MILP / CP-SAT 场景要用 re-solve、relaxation 和离散增量解释。
  • 不把 shadow price 单独作为预算审批结论,必须结合实际可雇佣性、服务质量、客户影响和执行约束。

10.6 Exception Workflow Template

StateTriggerAutomated responseHuman roleEvidence
FeasibleSolver returns valid planPublish plan after policy checkReview only for high-impact changestrace id, objective, constraints
Feasible with warningTime limit with acceptable incumbentPublish with warning or request approvalOperations lead approvesgap, risk summary, affected units
InfeasibleHard constraints conflictProduce conflict summary and relaxation optionsBusiness owner selects responseviolated constraints, scenario
Data failureStale forecast or missing capacityUse approved fallback or stop automationData owner and operations ownerdata quality event
Policy blockedOutput violates policy gateStop action and escalatePolicy owner reviewspolicy id, blocked action
OverrideHuman changes outputRecord reason and approvalAuthorized manageroriginal and changed decision

10.7 30-Day / Interview Output Template

Day rangeOutputInterview proof
Days 1-5One optimization problem canvas for a金融零售场景能把业务决策拆成变量、目标、约束和执行结果
Days 6-10LP / MILP / CP-SAT comparison memo能解释为什么某场景用 CP-SAT 而不是简单排序
Days 11-15Solver decision service architecture能画出 forecast-to-optimization-to-workflow 架构
Days 16-20Scenario and sensitivity pack能讲清 shadow price、capacity business case 和风险偏好
Days 21-25Governance and audit evidence binder能说明 NIST AI RMF 如何落到优化决策系统
Days 26-30Interview story and portfolio case能用 staffing、fraud、collections、inventory/pricing 或 contact center 做完整案例

11. 30 天训练计划

Week 1: OR for AI Decisioning 基础到建模

Day训练主题输出
1选择一个金融零售决策场景,写 decision inventory决策名称、owner、频率、影响对象、自动化等级
2把场景拆成 sets、parameters、decision variables变量清单和数据来源
3写 objective function 的业务解释和数学方向objective memo
4分类 hard / soft / guardrail constraintsconstraint registry v1
5画 forecast-to-optimization 流程从预测到执行的 sequence

Week 2: LP / MILP / CP-SAT / Routing 方法选择

Day训练主题输出
6用 LP 表达连续资源分配 baselineLP problem note
7用 binary variables 表达是否选择、是否分配MILP modeling note
8用 CP-SAT 思路表达排班、互斥、覆盖和偏好CP-SAT modeling note
9用 routing / scheduling 语言描述时间窗和路径routing scenario note
10写 solver selection ADR为什么选 LP、MILP、CP-SAT 或 routing

Week 3: AI + Optimization 产品架构

Day训练主题输出
11定义 AI 输入及其误差如何影响决策forecast risk matrix
12设计 decision service API 和 schemaAPI contract sketch
13设计 solver runtime controlstime limit、fallback、gap、status handling
14设计 Agent proposes / solver decides 交互agent boundary and validation memo
15画端到端架构图solver decision service architecture

Week 4: Scenario、Sensitivity、Governance、Interview

Day训练主题输出
16设计 base、demand shock、capacity loss 场景scenario pack
17做 sensitivity / shadow price 解释capacity business case
18写 exception workflowinfeasible、time limit、data failure 流程
19写 audit event schemadecision evidence fields
20用 NIST AI RMF 做治理映射Govern / Map / Measure / Manage table
21Retail workforce case 深挖staffing optimization story
22Fraud review queue case 深挖fraud queue optimization story
23Credit collections case 深挖collections optimization story
24Inventory / pricing case 深挖pricing-inventory optimization story
25Contact center scheduling case 深挖scheduling optimization story
26准备 30 秒 pitchshort answer
27准备 2 分钟架构说明architecture answer
28准备 tradeoff 追问multi-objective answer
29准备治理追问audit and risk answer
30组合作品集 narrativeone-page portfolio case

12. 面试答案

12.1 为什么 AI 决策系统需要 operations research / optimization

30 秒回答

AI 负责预测风险、需求、响应概率和候选动作,但金融零售的真实决策通常受容量、SLA、合规、预算、技能和客户保护约束。Operations research 把这些约束和目标转成可求解、可审计、可执行的优化问题,让 AI 从“给分数”升级为“在约束下做最优行动组合”。

2 分钟回答

如果 fraud 模型给每个交易一个风险分,按分数排序只能解决优先级的一小部分。实际运营还要考虑审核员容量、技能、预计处理时长、客户误拦截成本、SLA 和监管要求。优化层可以把这些因素放进 objective 和 constraints,输出可执行的审核队列和分配方案。

架构上,我会把它设计成 forecast-to-optimization decision service: 模型输出预测参数,constraint registry 提供容量和政策,solver service 求解 LP / MILP / CP-SAT 或 routing 问题,policy gate 做最终控制,workflow 执行动作,audit store 记录版本、输入、约束、求解状态和人工 override。这样 AI 决策系统不仅更有效,也更可治理。

12.2 LP、MILP 和 CP-SAT 怎么选

30 秒回答

如果变量连续、目标和约束线性,用 LP;如果有是否选择、是否分配、整数数量,用 MILP;如果是复杂排班、互斥、覆盖、时间窗和逻辑约束很多,CP-SAT 往往更合适。选择不是看算法名,而是看决策变量、约束结构、求解时间和生产解释需求。

2 分钟回答

比如预算在渠道间连续分配,可以用 LP 做 baseline,也方便做 shadow price 和 sensitivity。Fraud case 分配给 reviewer 是 binary assignment,更适合 MILP。Retail workforce 和 contact center scheduling 有大量班次、休息、技能、互斥、偏好和覆盖规则,CP-SAT 的表达力会更好。Routing 则要考虑路径、容量和时间窗,通常用专门的 routing solver。

产品上还要考虑 SLA。如果在线同步只能给 200 毫秒,就不适合每次求大规模 MILP;可以用预计算策略、heuristic、缓存或分层求解。离线周排班可以给更长时间,追求更高质量方案和 scenario analysis。

12.3 如何处理 multi-objective tradeoffs

30 秒回答

我会先区分不可交易的 hard constraints、可交易的 business objectives 和上线后监控的 guardrails。多目标可以用 weighted sum、lexicographic priority、epsilon constraints 或 Pareto scenarios。关键不是把所有东西揉成一个分数,而是让权重、优先级、风险偏好和业务影响被 owner 明确批准并可审计。

2 分钟回答

以 fraud review 为例,目标至少包括预期挽损、客户摩擦、审核成本和 SLA。客户保护、授权和监管要求是 hard constraints;挽损和成本可以进入 objective;误拦截率、投诉率和 segment impact 是 guardrail。

如果风险团队要求先守住客户摩擦上限,我会用 epsilon constraint: 在 false positive impact 不超过阈值的前提下最大化挽损。如果高层要比较不同风险偏好,我会输出 Pareto scenario,让他们看到每降低一点摩擦会损失多少挽损。这样 tradeoff 是透明的,而不是藏在模型分数里。

12.4 怎么解释 forecast-to-optimization

30 秒回答

Forecast-to-optimization 是把 AI 预测结果作为优化模型参数,再由 solver 在约束下选择行动。比如预测每半小时呼入量和 AHT,然后优化坐席排班、技能覆盖和休息安排。预测告诉我们可能发生什么,优化决定我们该如何配置资源。

2 分钟回答

关键是预测输出必须带时间粒度、实体粒度、置信区间和版本。Contact center 里,呼入量预测、AHT 预测、转人工率预测会转成每个时段的 capacity demand。优化模型再考虑坐席技能、班次、休息、SLA、外包容量和成本,生成班表和溢出策略。

如果预测不确定性高,我不会只用一个点预测,而会做 base、upper band、lower band 和 stress scenario,观察方案是否稳定。生产上还要把实际呼入、等待时间、abandon rate、repeat contact 回流给预测模型和 constraint registry。

12.5 Agent proposes / solver decides 为什么重要

30 秒回答

Agent 擅长理解上下文、生成候选方案和解释,但不应该直接决定受约束的高影响行动。成熟架构应该让 Agent 提出结构化 proposal,solver 检查目标和约束并选择可行方案,policy gate 决定能否执行,workflow 和 audit 负责落地与留证。

2 分钟回答

例如门店运营 Agent 发现周五下午客流异常,提出“增加两名兼职并延长营业支持”。这个建议必须转成结构化输入: 哪些门店、哪些时段、哪些技能、成本上限和服务目标。Solver 再检查员工可用性、劳动规则、预算和最低覆盖,输出可行排班。Policy gate 再确认是否符合授权和审批要求。

这样可以保留 Agent 的解释能力和运营洞察,同时避免 prompt 直接覆盖劳动法规、预算、资质或客户保护约束。

12.6 Solver 找不到可行解怎么办

30 秒回答

不可行不是简单报错,而是产品工作流。系统应输出冲突约束、影响范围和可批准的 relaxation options,并按预设层级处理: 先放松体验偏好,再调整运营目标,高风险偏好需要批准,法规和授权边界不可放松。

2 分钟回答

以 contact center scheduling 为例,如果某天高峰双语技能不足,solver 可能 infeasible。系统需要说明是哪几个时段、哪类技能、哪些 SLA 约束冲突。可选动作包括启用 callback、调整休息、使用外包、批准加班、降低非关键队列 SLA,或将部分咨询引导到异步渠道。

但是不能放松敏感业务授权或合规边界。所有 relaxation 都要有 owner、审批和审计记录。长期看,不可行率本身是 capacity planning 的信号。

12.7 Shadow price 在业务里怎么讲

30 秒回答

Shadow price 可以解释一个资源约束多增加一单位时目标值的边际变化,适合 LP 或 LP relaxation。业务上可以说“多 1 小时高技能审核能力大约带来多少预期挽损”。但对 MILP 和 CP-SAT,不能机械套用,要用场景重求解和离散增量解释。

2 分钟回答

我会把 shadow price 用作 capacity business case 的起点,而不是最终结论。比如 fraud queue 的 LP relaxation 显示高技能 reviewer 小时的边际价值很高,说明这个约束是瓶颈。然后我会做 scenario re-solve: 增加 1 人、2 人、不同班次和不同技能组合,观察实际挽损、SLA、误拦截和成本变化。

这比只说“我们缺人”更有说服力,因为它把 headcount 或外包预算和可量化业务价值连接起来。

12.8 如何把优化决策系统做成可审计架构

30 秒回答

每次决策都要记录 trace id、输入数据版本、预测模型版本、约束版本、目标权重、solver 配置、求解状态、输出、policy check、人工 override 和最终结果。治理上按 NIST AI RMF 做 Govern、Map、Measure、Manage,确保 owner、风险、监控和整改闭环清楚。

2 分钟回答

金融零售里,优化决策可能影响客户权益、员工排班、信贷催收、欺诈拦截和定价。因此不能只保存最终结果。我们要能复现“当时为什么这么决定”。

我会建立 decision audit event,并在 release gate 检查: objective 和 constraint 是否有 owner,权重是否批准,scenario 是否覆盖压力情况,infeasible 和 data failure 是否有 fallback,客户伤害和公平性是否监控,人工 override 是否有原因和审批。这样 solver 才不是黑箱,而是可治理的 decision service。


13. 高级作品集表达

如果把本 playbook 转成作品集,可以用一个金融零售案例贯穿:

Case: AI-assisted fraud review queue optimization

Business problem
  Fraud model can score cases, but reviewer capacity is limited and customer friction is high.

Product architecture
  Feature service + risk model + constraint registry + MILP solver service + policy gate + case workflow + audit store.

Optimization model
  Variables: assign / release / hold / escalate.
  Objective: maximize expected prevented loss minus friction and SLA penalty.
  Constraints: reviewer capacity, skill, SLA, high-risk mandatory review, customer protection.

AI + OR collaboration
  AI predicts fraud probability, loss, handling time and friction.
  Solver chooses feasible action mix.
  Agent explains bottlenecks and proposes scenario narratives.

Governance
  NIST AI RMF mapping, audit event schema, override review, scenario stress test, rollback criteria.

Business value
  Higher prevented loss per reviewer hour, lower false positive friction, clearer capacity investment case.

面试中最强的表达不是“我懂 OR-Tools”,而是:

我能把 AI 预测、业务约束、风险偏好、solver 服务、工作流执行和治理审计连接成一个可上线的决策系统。