AI Optimization / Operations Research Decision Playbook
这些来源作为术语、架构和治理锚点。本文把它们转成 AI 产品、金融零售运营和企业架构可执行的工作语言。
AI Optimization / Operations Research Decision Playbook
适用对象: AI Product Architect、AI PM、Decision Intelligence Lead、Risk Product、Retail Operations Product、Platform Architect、Model Risk / Governance Partner。 核心问题: 当 AI 已经能预测需求、风险、意图和优先级时,如何把预测结果转成满足约束、可审计、可解释、可运行的最优业务决策。 一句话定位: 这是一份把 operations research、linear / integer programming、CP-SAT、routing、scheduling、AI decisioning 和金融零售运营场景连接起来的高级产品架构手册。 边界说明: 本文不是 BA 入门、数学教材、供应商选型报告、法律意见或模型验证报告;正式落地必须结合业务 owner、risk、legal、compliance、data、security、architecture review 和 model risk governance。
Source Anchors
这些来源作为术语、架构和治理锚点。本文把它们转成 AI 产品、金融零售运营和企业架构可执行的工作语言。
| Anchor | Official / primary source | 本文用法 |
|---|---|---|
| Google OR-Tools | https://developers.google.com/optimization | 用作开源 optimization suite 锚点,覆盖 linear optimization、integer optimization、constraint programming、routing 和 scheduling。 |
| OR-Tools CP-SAT Solver | https://developers.google.com/optimization/cp/cp_solver | 用于解释 CP-SAT 在离散变量、复杂约束、排班、资源分配和可行性搜索中的适用边界。 |
| OR-Tools Routing | https://developers.google.com/optimization/routing | 用于 routing、vehicle routing、time windows、capacity constraints 和服务路径优化的架构表达。 |
| OR-Tools Scheduling Examples | https://developers.google.com/optimization/scheduling/employee_scheduling | 用于 retail workforce、contact center、branch staffing 等排班建模参考。 |
SciPy linprog | https://docs.scipy.org/doc/scipy/reference/generated/scipy.optimize.linprog.html | 用于连续线性规划、LP baseline、shadow-price 解释前的模型校验和轻量级实验。 |
| Gurobi Optimizer Documentation | https://docs.gurobi.com/projects/optimizer/en/current/ | 用于生产级 LP / MILP / MIQP、multi-objective optimization、MIP gap、warm start、sensitivity 和 solver operations 语言。 |
| Gurobi Multi-Objective Optimization | https://docs.gurobi.com/projects/optimizer/en/current/features/multiobjective.html | 用于多目标权重、优先级、lexicographic optimization 和业务 tradeoff 设计。 |
| PuLP | https://coin-or.github.io/pulp/ | 用于 Python 建模接口、LP / MILP 快速建模、开源求解器连接和作品集原型。 |
| COIN-OR | https://www.coin-or.org/ | 用于开源 OR solver ecosystem、CBC、Clp 和企业内可解释原型的技术背景。 |
| NIST AI RMF | https://www.nist.gov/itl/ai-risk-management-framework | 用 Govern / Map / Measure / Manage 组织 AI + optimization 决策系统的风险、监控、证据和治理。 |
1. 一句话定位
AI 决策系统的成熟表达不是“模型给一个分数”,而是:
AI predicts.
Optimization allocates.
Policy constrains.
Workflow escalates.
Audit remembers.
中文表达:
AI 负责预测和生成候选方案,优化模型负责在约束下选择行动组合,策略层负责边界控制,工作流负责例外升级,审计层负责复盘证据。
这份 playbook 关注的不是“如何写一个算法题”,而是如何把优化问题产品化为可上线的 decision service:
- 输入来自预测模型、业务规则、库存、人员、渠道、风险、合同和 SLA。
- 输出是可执行的排班、分流、定价、库存、催收、审核、路由或资源分配方案。
- 中间有 objectives、constraints、scenario analysis、sensitivity、exception workflow、human override 和 audit trail。
- 结果必须在金融零售场景中满足客户公平性、合规边界、操作韧性和业务可解释性。
2. 为什么重要
很多 AI 产品到生产阶段会卡在同一个问题:
模型知道“可能发生什么”,但业务需要决定“现在该怎么分配有限资源”。
金融零售里,真实决策通常不是单点预测,而是受约束的组合优化:
| 场景 | AI 常见输出 | 真正要决策的问题 | 缺少优化层的风险 |
|---|---|---|---|
| 零售门店 staffing | 每小时客流、交易量、服务需求预测 | 每家店每个时段安排多少人、什么技能、什么班次 | 高峰期缺人、低峰期冗员、员工体验差、劳动法规风险 |
| Fraud review queues | 交易欺诈概率、损失金额、客户影响 | 有限审核员先看哪些 case,哪些自动放行、拦截或升级 | 高价值欺诈漏审,低风险 case 占用人工,客户摩擦扩大 |
| Credit collections | 还款概率、违约风险、客户响应倾向 | 哪些客户通过短信、电话、宽限、重组或人工跟进 | 催收成本失控、客户伤害、监管投诉、回款效率低 |
| Inventory / pricing | 需求预测、价格弹性、缺货概率 | 如何在库存、毛利、渠道、保质期和竞争约束下调价与补货 | 局部最优、缺货与滞销并存、促销侵蚀利润 |
| Contact center scheduling | 呼入量、AHT、渠道迁移、服务等级预测 | 如何安排班次、技能组、休息和溢出策略 | SLA 失守、坐席过载、加班成本高、客户等待时间变长 |
如果没有 OR / optimization 层,AI 产品容易退化成三种低成熟形态:
| 低成熟形态 | 表面上看起来 | 实际问题 |
|---|---|---|
| Scoreboard | dashboard 显示风险、需求、机会分数 | 没有告诉运营团队如何行动,也没有考虑容量约束 |
| Rule pile | 在模型分数上叠加越来越多 if / else | 规则之间冲突,难以证明结果最优或可行 |
| Manual allocation | AI 给建议,人手工排队、排班、调价、分配 | 操作负担转移给员工,结果不可复现,无法规模化 |
高级 AI 产品架构要把“预测”推进到“可执行决策”:
forecast / score / candidate
-> optimization model
-> feasible action plan
-> decision service
-> workflow execution
-> outcome feedback
-> model and constraint improvement
3. 优化决策服务架构
3.1 参考架构
flowchart TB
E[Business events<br/>transactions, applications, cases, demand, inventory] --> F[Feature and state layer]
F --> M[AI / forecasting services<br/>risk score, demand forecast, elasticity, response propensity]
F --> C[Constraint registry<br/>capacity, policy, labor rules, SLA, risk appetite]
M --> D[Decision request builder]
C --> D
D --> S[Solver decision service<br/>LP / MILP / CP-SAT / routing / scheduling]
S --> P[Policy and guardrail check<br/>eligibility, fairness, compliance, authorization]
P --> W[Workflow execution<br/>assign, schedule, price, route, queue, escalate]
W --> A[Audit and evidence store]
W --> O[Outcome feedback<br/>actual demand, handling time, fraud loss, recovery, SLA]
O --> M
O --> C
S --> X[Scenario and sensitivity service]
X --> B[Business review<br/>tradeoff, capacity, risk appetite]
关键设计原则:
| 原则 | 含义 | 架构动作 |
|---|---|---|
| Forecast-to-optimization | AI 预测不是终点,必须变成优化模型参数 | 预测服务输出带置信区间、版本、适用范围和时间粒度 |
| Solver as decision service | solver 不是离线 notebook,而是有 SLA、输入契约和审计日志的服务 | 建立 decision API、schema validation、time limit、fallback、trace id |
| Constraints outside prompt | 约束不能藏在 prompt 或自然语言建议里 | 使用 constraint registry、policy engine、rule version 和 test suite |
| Agent proposes / solver decides | Agent 可以生成候选方案和解释,但不能绕过可行性与约束 | Agent 输出结构化 proposal,solver 输出 feasible plan,policy 层做最终门禁 |
| Optimization under governance | 最优解必须能解释目标、约束、版本和取舍 | 记录 objective weights、constraint binding status、solver status、override reason |
3.2 Solver Decision Service 的产品边界
一个生产级 solver decision service 至少包括:
| 能力 | 说明 | 金融零售例子 |
|---|---|---|
| Decision API | 接收业务上下文、预测、资源、约束和策略版本 | POST /staffing/optimize、POST /fraud-queue/prioritize |
| Model builder | 把输入转成变量、目标、约束、求解器格式 | 将门店、时段、技能、员工合同转成排班变量 |
| Solver adapter | 封装 OR-Tools、Gurobi、PuLP / CBC、SciPy 等求解器 | 同一业务模型可在开源和商业 solver 间切换 |
| Runtime controls | time limit、MIP gap、solution pool、warm start、deterministic seed | 高峰前 2 分钟内产出可用排班调整 |
| Feasibility handling | infeasible diagnosis、constraint relaxation、soft penalty | 找出是技能覆盖、工时上限还是休息规则造成不可行 |
| Explanation layer | 输出为什么这样分配、哪些约束绑定、目标如何取舍 | “晚班少 1 名持证员工会导致高峰 SLA 风险上升” |
| Scenario runner | 对需求、容量、风险偏好和成本参数做 what-if | 节假日客流 +15%、审核人手 -20%、加班成本翻倍 |
| Audit trail | 记录输入、版本、求解状态、输出、人工 override | 客户争议、监管检查、模型风险审查时可复盘 |
3.3 在线、准实时、离线三类运行模式
| 模式 | 适用决策 | 延迟目标 | 常用 solver 形态 | 设计重点 |
|---|---|---|---|---|
| 在线同步 | 支付授权是否升级人工、客服 Agent 是否可调用工具 | 毫秒到秒级 | 简化 LP、预计算策略、规则短路、top-k assignment | 可用性、降级、确定性、极低延迟 |
| 准实时 | fraud review queue 优先级、collections daily campaign、当日 workforce rebalancing | 秒到分钟级 | MILP、CP-SAT、heuristic + solver repair | 容量、可解释、时间窗、滚动优化 |
| 离线批量 | 周排班、补货、价格计划、区域资源配置 | 分钟到小时级 | MILP、CP-SAT、routing、scenario batch | 多场景比较、审批、审计、业务 sign-off |
4. 问题建模
4.1 优化问题的基本结构
一个可落地的 optimization decisioning problem 通常由 7 类对象组成:
| 对象 | 作用 | 例子 |
|---|---|---|
| Sets / indexes | 定义决策维度 | 门店、员工、时段、技能、case、客户、产品、路线 |
| Parameters | 已知输入或预测输入 | 需求预测、风险分数、单位成本、容量、价格弹性、处理时长 |
| Decision variables | 系统要选择的行动 | 是否安排员工 e 在时段 t;case c 是否分给 reviewer r;产品 p 是否降价 |
| Objective function | 优化目标 | 最小成本、最大回款、最大服务水平、最小风险损失、最大毛利 |
| Constraints | 必须满足或带惩罚的边界 | 劳动法规、工时、技能、预算、SLA、公平性、库存、风险承受度 |
| Solver settings | 求解策略 | time limit、MIP gap、warm start、objective priority、solution pool |
| Output contract | 可执行结果 | 班表、审核顺序、催收名单、补货量、价格动作、升级队列 |
4.2 线性规划、整数规划、CP-SAT 的区别
| 方法 | 核心表达 | 适用场景 | 产品架构提醒 |
|---|---|---|---|
| Linear Programming, LP | 连续变量 + 线性目标 + 线性约束 | 资源连续分配、预算分配、产能规划、初始 capacity analysis | 适合 baseline、shadow price、敏感性分析,但不能直接表达“是否选择”这类离散动作 |
| Integer / Mixed-Integer Programming, IP / MILP | 变量包含 binary / integer,目标和约束通常线性 | 排班、分配、routing、portfolio selection、fraud case assignment | 能表达离散决策,但要管理求解时间、MIP gap、可行解质量 |
| CP-SAT | Constraint Programming + SAT + integer reasoning | 员工排班、复杂业务规则、组合约束、可行性强于目标优化的场景 | 适合表达大量逻辑约束、时间窗、互斥、覆盖、软硬约束组合 |
| Routing / VRP solvers | 路径、车辆、容量、时间窗和服务点 | 现金运钞、上门服务、门店配送、现场维护 | 要把地理、时间窗、容量、优先级和服务时长一起建模 |
| Heuristics + repair | 先用启发式生成方案,再由 solver 修复约束 | 大规模实时分配、秒级 queue routing、动态重排 | 必须标明可行性保证边界,不把启发式当作最优证明 |
4.3 建模语言示例
以 fraud review queue 为例:
Sets
C = fraud cases
R = reviewers
T = review time buckets
Parameters
p_c = fraud probability predicted by AI
loss_c = estimated loss if case is not reviewed
friction_c = customer friction cost if case is held
a_r,t = reviewer availability
skill_r,k = reviewer skill coverage
handle_c = estimated handling time
sla_c = latest acceptable review time
Decision variables
x_c,r,t = 1 if case c is assigned to reviewer r in time bucket t, else 0
y_c = 1 if case c is auto-released or deferred, else 0
Objective
maximize expected prevented loss
minus customer friction
minus operational cost
minus SLA penalty
Constraints
each case assigned at most once
reviewer capacity per time bucket
skill eligibility
high-risk cases reviewed before SLA
fairness and customer harm guardrails
这段建模语言比“AI 按风险排序”更成熟,因为它明确表达了容量、技能、SLA、摩擦和风险取舍。
5. 目标与约束
5.1 Objectives: 优化什么
高级 AI + OR 产品必须把 objective 从口号改成可计算函数。
| Objective 类型 | 业务表达 | 数学表达方向 | 常见风险 |
|---|---|---|---|
| Cost minimization | 降低加班、人力、库存、审核成本 | minimize cost | 过度压缩资源导致 SLA 或客户体验下降 |
| Profit / value maximization | 最大化毛利、回款、挽损、转化 | maximize expected value | 忽视公平性、合规或长期关系 |
| Service level maximization | 提高接通率、按时审核、门店覆盖 | maximize SLA attainment | 成本可能激增 |
| Risk minimization | 降低欺诈、违约、投诉、操作风险 | minimize expected loss / risk exposure | 可能产生过度拦截或客户摩擦 |
| Workload balancing | 平衡员工负载、审核复杂度、班次偏好 | minimize variance / imbalance | 可能牺牲局部效率 |
| Customer harm minimization | 降低误拦截、过度催收、等待时间 | minimize harm penalty | 需要良好的 harm taxonomy 和权重治理 |
5.2 Constraints: 什么不能突破
约束不是“业务补充说明”,而是决策系统的控制面。
| Constraint 类型 | 例子 | 建模方式 |
|---|---|---|
| Capacity | 审核员每天 6 小时有效审核时间;门店每时段最多 8 人 | hard constraint 或 capacity penalty |
| Skill / eligibility | 持证员工才能处理某类咨询;高级 reviewer 才能处理账户接管 | binary eligibility matrix |
| Labor / contract | 每周工时上限、休息间隔、夜班限制、加班规则 | CP-SAT / MILP hard constraints |
| SLA / time window | 高风险交易 30 分钟内审核;客户来电 80% 在 20 秒内接通 | time window constraint + penalty |
| Budget | 外包坐席、加班、折扣、补货预算上限 | budget constraint |
| Inventory | 货架容量、保质期、安全库存、渠道库存不可为负 | flow / stock constraints |
| Fairness / customer protection | 不同客户群体误拦截差异、催收联系频率、特殊保护人群 | guardrail constraint + monitoring |
| Compliance / policy | 不允许自动拒绝某类受监管决策;需人工确认 | policy constraint outside solver |
| Explainability | 客户影响决策必须输出 reason code 和证据 | output contract constraint |
5.3 Hard constraints 与 soft constraints
| 类型 | 含义 | 示例 | 设计建议 |
|---|---|---|---|
| Hard constraint | 不允许违反 | 员工没有资质不能处理投资建议;库存不能为负 | 放入 solver 或 policy gate,违反即不可执行 |
| Soft constraint | 可违反但有代价 | 员工班次偏好、低优先级 SLA、低风险 case 延迟 | 加 penalty,输出 violation summary |
| Guardrail metric | 上线后持续监控 | 误拦截率、投诉率、人工 override 率 | 不一定进入目标函数,但进入 release gate 和 monitoring |
不要把所有约束都设成 hard。生产系统如果过度硬化,会频繁 infeasible;如果过度软化,会把风险藏进 penalty 权重。成熟做法是:
不可违反的法律、资质、安全、授权边界 = hard constraint
可业务协商的体验、偏好、次级 SLA = soft constraint
需高层设定 appetite 的风险、成本、公平性 = governed tradeoff
5.4 Multi-objective tradeoffs
金融零售 AI 决策几乎都不是单目标问题。常见 tradeoff:
- Fraud loss vs customer friction
- Collections recovery vs customer harm
- Contact center SLA vs staffing cost
- Inventory availability vs markdown risk
- Pricing margin vs market share
- Workforce fairness vs operational efficiency
多目标处理方式:
| 方法 | 说明 | 适用场景 | 风险 |
|---|---|---|---|
| Weighted sum | 把多个目标加权成一个目标函数 | 权重可治理、指标单位可归一化时 | 权重争议大,容易把不可突破边界误当可交易 |
| Lexicographic priority | 先优化一级目标,再在可接受范围内优化二级目标 | 风险、合规、SLA 优先级明确时 | 低优目标可能被压缩过度 |
| Epsilon constraint | 把一个目标作为主目标,其他目标设最低门槛 | “成本最低但 SLA 不低于 95%” | 阈值需要业务和风险 owner 明确确认 |
| Pareto scenario | 输出多组非支配方案供业务比较 | 高层做 risk appetite / capacity 决策 | 需要清晰的可视化和解释 |
| Goal programming | 每个目标设目标值和偏离惩罚 | 多部门协商型资源分配 | 偏离惩罚设计复杂 |
成熟表达不是“我们优化综合得分”,而是:
主目标是什么。
哪些指标是不可突破 guardrail。
哪些指标可用权重交易。
权重由谁批准。
不同权重下的业务结果如何变化。
生产中如何监控 tradeoff 是否偏离预期。
5.5 Sensitivity 与 shadow prices
Sensitivity analysis 用来回答:
如果多 1 个审核员、多 1 小时门店工时、多 1 万预算、多 5% 库存容量,业务价值会增加多少。
Shadow price 在连续 LP 或 LP relaxation 中更有解释价值,它描述某个约束右侧资源增加一个单位时,目标函数的边际变化。对于 MILP / CP-SAT,整数性和逻辑约束会让 shadow price 不再直接等同真实边际价值,需要用 scenario analysis、relaxation、local re-solve 或 controlled experiment 来解释。
| 场景 | 可解释问题 | 产品动作 |
|---|---|---|
| Fraud review capacity | 增加 1 名高技能 reviewer 的预期挽损 | 用于 headcount business case |
| Contact center staffing | 多 1 小时 bilingual capacity 对 SLA 的价值 | 用于技能招聘和班次设计 |
| Inventory allocation | 多 1 单位安全库存对缺货损失的缓解 | 用于补货和仓储容量决策 |
| Collections campaign | 增加 1 小时人工催收对回款的边际提升 | 用于渠道组合和外包预算 |
| Retail staffing | 高峰时段多 1 名员工对等待时间和转化的影响 | 用于门店排班和加班审批 |
6. AI + OR 协同
6.1 Forecast-to-optimization
Forecast-to-optimization 是把预测模型的输出转成优化模型参数的过程。
Demand forecast
-> demand distribution by time / location / segment
-> staffing or inventory optimization
-> schedule / replenishment plan
-> actual demand and service outcome
-> forecast calibration and constraint update
关键不是“预测越准越好”这么简单,而是预测误差如何影响最优决策:
| AI 输出 | 优化参数 | 需要治理的误差 |
|---|---|---|
| 客流预测 | 每店每时段 minimum coverage | 高峰低估会造成排队和转化损失 |
| 欺诈概率 | case expected value 和 review priority | 高风险低估会造成损失,低风险高估会造成误拦截 |
| 回款概率 | collections channel allocation | 过度联系低响应客户会造成客户伤害和投诉 |
| 价格弹性 | pricing objective / demand response | 弹性估计错会导致利润和销量双损 |
| AHT 预测 | contact center capacity consumption | 处理时长低估会造成 SLA 失守 |
6.2 Agent proposes / solver decides
LLM Agent 在优化决策系统里有价值,但边界必须清楚。
| 角色 | 可以做 | 不应该做 |
|---|---|---|
| Agent | 读取政策、总结运营异常、提出候选约束、解释方案、生成 scenario narrative | 直接绕过 solver 决定排班、定价、审核和催收动作 |
| Solver | 在结构化目标和约束下选择可行方案 | 理解自然语言政策的真实法律含义 |
| Policy engine | 授权、资格、合规边界、客户保护门禁 | 优化连续资源分配 |
| Human owner | 设置风险偏好、批准权重、处理例外、承担业务责任 | 手工修补所有 case-level 决策 |
推荐架构:
Agent reads context and proposes structured candidate:
proposed objective changes
proposed constraints
proposed scenario
explanation and assumptions
Validation layer checks:
schema
allowed fields
policy compatibility
data lineage
owner approval requirement
Solver decides:
feasible solution
objective value
binding constraints
tradeoff summary
Policy and workflow decide execution:
allowed action
escalation
audit event
6.3 AI + Optimization 的常见组合模式
| 模式 | 工作方式 | 示例 |
|---|---|---|
| Predict then optimize | ML 先预测参数,solver 再优化 | 预测呼入量后做 contact center scheduling |
| Optimize with learned cost | ML 估计每个动作的收益或成本,solver 组合选择 | 预测每个催收渠道的回款概率和客户伤害 |
| Generate candidates then solve | AI 生成候选动作集合,solver 从中选择可行组合 | Agent 提出促销组合,MILP 选出预算内方案 |
| Solve then explain | solver 产出方案,LLM 生成面向运营的解释 | “为什么本周三需要 2 名会西语坐席” |
| Simulation then optimize | 仿真生成压力场景,solver 比较韧性方案 | 节假日客流、系统故障、人员缺勤联合压力测试 |
| Human-in-the-loop optimize | solver 给方案和取舍,人批准风险偏好或例外 | 催收策略、重大价格调整、门店关闭时段调整 |
7. 场景分析
7.1 Retail Workforce / Staffing Optimization
| 建模元素 | 内容 |
|---|---|
| 决策 | 每家门店、每个时段、每个技能组安排哪些员工和班次 |
| AI 输入 | 客流预测、交易量预测、服务需求预测、促销影响、天气和节假日特征 |
| 变量 | x_employee_shift_store_time,员工是否在某店某时段工作 |
| 目标 | 最小化人力成本、加班、缺口 penalty,同时最大化服务覆盖和员工偏好满足 |
| 约束 | 工时上限、休息间隔、技能覆盖、最低开店人数、劳动法规、预算、员工可用性 |
| Solver | CP-SAT / MILP;复杂班次和逻辑规则偏 CP-SAT |
| 输出 | 周班表、缺口报告、加班建议、跨店支援方案 |
| 指标 | 服务覆盖率、排队时间、销售转化、员工排班公平性、加班成本 |
| 例外 | 预测需求超过可用人力、关键技能缺口、员工突然缺勤 |
高级产品洞察:
- staffing 不是简单的“按预测客流配人”,而是技能、合同、偏好、法规、成本和体验之间的组合优化。
- 最有价值的 PM 输出不是班表本身,而是 capacity business case: 哪些时段的 shadow value 最高,哪类技能的边际价值最大。
- 如果 AI 只预测客流,不连接 solver 和 workforce management 系统,业务仍然要手工排班,产品价值会被消耗在操作层。
7.2 Fraud Review Queues
| 建模元素 | 内容 |
|---|---|
| 决策 | 哪些交易、账户或申诉 case 进入人工审核;由谁审核;在什么时限前处理 |
| AI 输入 | 欺诈概率、预期损失、客户价值、误拦截风险、case 复杂度、处理时长 |
| 变量 | case-reviewer-time assignment、auto release、hold、escalate |
| 目标 | 最大化预期挽损,最小化客户摩擦、审核成本、SLA breach 和投诉风险 |
| 约束 | 审核员容量、技能、时限、监管要求、高风险强制审核、客户保护规则 |
| Solver | MILP / rolling horizon optimization;秒级队列可用 heuristic + solver repair |
| 输出 | 审核优先级、分配方案、自动放行列表、升级列表、容量缺口 |
| 指标 | prevented loss、false positive impact、review SLA、override rate、customer friction |
| 例外 | 模型置信度低、数据缺失、case 类型超出授权、队列拥堵 |
高级产品洞察:
- “按风险分从高到低审核”不是最优,因为它忽略了损失金额、处理时长、SLA、客户影响和 reviewer 技能。
- 如果两个 case 风险相同,预期损失更高、处理更快、SLA 更紧的 case 可能更优先。
- 误拦截成本必须进入 objective 或 guardrail,否则优化会倾向于过度保守。
7.3 Credit Collections Optimization
| 建模元素 | 内容 |
|---|---|
| 决策 | 哪些客户进入哪个催收渠道、联系频率、联系时间、是否给出重组或宽限方案 |
| AI 输入 | 还款概率、渠道响应倾向、客户脆弱性信号、预期回款、投诉风险、收入波动 |
| 变量 | customer-channel-time-treatment assignment |
| 目标 | 最大化风险调整后回款,最小化客户伤害、投诉、合规风险和运营成本 |
| 约束 | 联系频率上限、禁止联系窗口、特殊客户保护、渠道容量、监管政策、客户偏好 |
| Solver | MILP / multi-objective optimization;高风险策略需要 workflow approval |
| 输出 | 日 campaign、渠道分配、人工跟进列表、暂停联系名单、重组 offer 队列 |
| 指标 | recovery rate、promise-to-pay kept rate、complaint rate、hardship identification、cost per dollar recovered |
| 例外 | 客户进入 hardship、争议账户、身份不确定、法律限制触发 |
高级产品洞察:
- collections 的优化目标不能只看短期回款;客户保护和监管风险必须作为 hard constraint 或高优先级目标。
- AI 可以预测响应倾向,但不应把“最容易被联系成功”误解为“最应该联系”。
- 优化系统应能说明为什么选择短信、电话、人工、宽限、暂停或升级。
7.4 Inventory / Pricing Optimization
| 建模元素 | 内容 |
|---|---|
| 决策 | 每个产品、门店、渠道、时间段的补货量、调拨量、价格和促销动作 |
| AI 输入 | 需求预测、价格弹性、竞争价格、季节性、库存周转、缺货概率、滞销概率 |
| 变量 | replenish_qty、transfer_qty、price_level、markdown_flag |
| 目标 | 最大化毛利和可得性,最小化缺货、滞销、报废和价格摩擦 |
| 约束 | 库存容量、预算、最小毛利、价格变动频率、促销规则、供应提前期、渠道一致性 |
| Solver | LP / MILP;价格档位和促销选择常用 binary variables |
| 输出 | 补货计划、门店调拨、价格动作、markdown schedule、缺货风险清单 |
| 指标 | gross margin、stockout rate、sell-through、waste、price override、inventory turns |
| 例外 | 供应中断、价格弹性异常、监管价格限制、关键商品安全库存不足 |
高级产品洞察:
- pricing 与 inventory 应联动优化。单独降价可能消化库存,却破坏毛利和品牌;单独补货可能增加滞销风险。
- AI 价格弹性模型必须进入 scenario,而不是单一确定值。高不确定性商品应设置更保守的价格动作。
- 对金融零售交叉场景,例如信用卡权益、积分兑换、保险附加服务,也可用库存 / pricing 思路优化额度、权益成本和客户价值。
7.5 Contact Center Scheduling
| 建模元素 | 内容 |
|---|---|
| 决策 | 每个时间段安排多少坐席、什么技能、什么渠道、是否启用外包或 callback |
| AI 输入 | 呼入量预测、chat demand、AHT、客户意图、转人工率、渠道迁移概率 |
| 变量 | agent-shift-skill-channel assignment、break schedule、overflow routing |
| 目标 | 在成本约束下最大化 service level、first contact resolution 和客户体验 |
| 约束 | 技能组覆盖、休息规则、班次偏好、外包容量、SLA、语言能力、敏感业务授权 |
| Solver | CP-SAT / MILP;队列仿真可与优化组合 |
| 输出 | 班表、技能组覆盖、overflow plan、callback threshold、加班建议 |
| 指标 | ASA、service level、abandon rate、occupancy、schedule adherence、customer satisfaction |
| 例外 | 突发事件呼入激增、系统故障、坐席缺勤、敏感业务队列拥堵 |
高级产品洞察:
- contact center 不只是排班问题,还涉及技能路由、渠道迁移、callback 策略和客户风险分层。
- AHT 预测误差会直接影响 capacity。需要把 AHT uncertainty 进入 scenario analysis。
- AI Agent 上线后,如果降低 AHT 但增加 repeat contact,优化目标就必须引入 downstream quality guardrail。
7.6 Routing / Scheduling for Field and Branch Operations
| 建模元素 | 内容 |
|---|---|
| 决策 | 哪些任务由哪个团队按什么顺序完成,是否合并路线或调整服务窗口 |
| AI 输入 | 服务时长预测、任务紧急度、失败概率、客户可用时间、交通或区域风险 |
| 变量 | vehicle-route-stop assignment、task sequence、time window selection |
| 目标 | 最小化路程、延迟、失败服务和加班,同时最大化准时率和高价值任务完成 |
| 约束 | 车辆容量、人员技能、服务窗口、区域权限、现金或贵重物品安全规则 |
| Solver | OR-Tools routing / VRP / time windows;大规模动态场景可分区求解 |
| 输出 | 路线、服务顺序、预计到达时间、异常升级 |
| 指标 | on-time rate、route cost、missed appointments、utilization、customer wait |
| 例外 | 路线不可行、客户改约、任务超时、安全事件 |
8. 例外工作流
Optimization decision service 必须把例外当成一等产品对象。生产系统真正危险的不是“求不到完美最优解”,而是求解失败后系统沉默、误执行或让运营人员无证据地手工修补。
8.1 例外类型
| 例外类型 | 触发信号 | 系统动作 | 人工动作 |
|---|---|---|---|
| Infeasible | solver 返回 infeasible | 输出最小冲突集、约束放松建议、不可执行原因 | owner 决定是否增加容量、调整需求或批准软化次级约束 |
| Time limit | 到达 time limit 但已有可行解 | 返回 best incumbent、gap、风险提示 | 按 SLA 决定执行当前可行解或升级 |
| No solution | 无可用方案或输入异常 | 执行 fallback policy,阻止高风险自动动作 | 运营主管进入手工决策工作流 |
| Data quality failure | 缺失关键参数、预测过期、schema 不匹配 | 拒绝请求或使用批准的 conservative default | data owner 修正,business owner 确认影响 |
| Policy conflict | solver 方案违反策略层 | policy gate 拦截并记录原因 | policy owner 决定规则是否需变更 |
| Human override | 人工修改方案 | 记录 override reason、scope、approver | 后续分析 override 是否暴露模型或约束问题 |
| Customer harm signal | 投诉、误拦截、过度催收、等待时间异常 | 降低自动化等级,触发监控告警 | risk / compliance / operations 联合复盘 |
8.2 约束放松顺序
例外处理不能让一线人员临场猜测。应提前定义 relaxation hierarchy:
第一层: 可放松的体验偏好
员工偏好、低优先级任务顺序、非关键渠道覆盖
第二层: 可批准放松的运营目标
低风险 SLA、加班预算、外包使用量、低影响促销频率
第三层: 高层批准后才可调整的风险偏好
fraud hold threshold、collections contact intensity、关键客户 service level
第四层: 不可放松的边界
法规、授权、资质、客户保护、数据权限、资金安全
8.3 人工 override 不是失败,而是学习信号
每一次 override 都应该进入 analytics:
| 字段 | 用途 |
|---|---|
| override actor / role | 判断是否符合授权 |
| original solution | 复盘 solver 原始建议 |
| changed decision | 确认人工改动范围 |
| reason code | 区分业务例外、数据问题、模型问题、政策问题 |
| customer / employee impact | 判断是否造成体验或公平性影响 |
| approval path | 满足审计和责任追踪 |
| outcome | 衡量 override 是否改进结果 |
9. 治理与审计
9.1 NIST AI RMF 映射
| NIST AI RMF function | 在 AI + optimization 中的落地 |
|---|---|
| Govern | 明确 decision owner、risk owner、model owner、constraint owner、solver owner、policy owner;建立变更审批和证据要求 |
| Map | 识别决策影响对象、业务后果、客户风险、法律边界、数据来源、系统依赖和自动化等级 |
| Measure | 测量预测质量、优化质量、可行性、SLA、override、客户伤害、公平性、solver stability 和数据质量 |
| Manage | 上线门禁、rollback、scenario stress test、例外工作流、监控告警、周期性 review 和问题整改 |
9.2 Decision audit event
每一次优化决策至少要记录:
| 证据字段 | 说明 |
|---|---|
| decision_id / trace_id | 贯穿请求、求解、执行、反馈 |
| business context | 场景、区域、时间窗、客户或员工影响范围 |
| input data version | 特征、预测、库存、人员、策略、约束版本 |
| model version | 预测模型、校准模型、embedding 或 LLM 辅助组件版本 |
| optimization model version | 变量、目标、约束、权重、solver adapter 版本 |
| solver configuration | solver 类型、time limit、MIP gap、seed、warm start、objective priority |
| solver status | optimal、feasible、infeasible、time limit、error |
| objective value | 总目标值和分目标贡献 |
| binding constraints | 关键绑定约束和资源瓶颈 |
| output decisions | 排班、分配、价格、队列、路由等具体动作 |
| policy check result | 通过、拦截、升级、原因码 |
| human override | 修改人、原因、审批、影响范围 |
| outcome feedback | 实际业务结果、客户影响、投诉、SLA、损失或收益 |
9.3 Model risk 不只在预测模型
AI + OR 系统至少有四类风险:
| 风险层 | 风险 | 控制 |
|---|---|---|
| Prediction risk | 需求、风险、弹性、AHT 预测偏差 | eval、calibration、drift monitoring、backtesting |
| Optimization risk | 目标函数错误、约束遗漏、权重不当、solver 不稳定 | model review、scenario analysis、unit tests、sensitivity |
| Execution risk | 输出无法被 WFM、case system、pricing engine 正确执行 | integration tests、idempotency、workflow reconciliation |
| Governance risk | 无 owner、无证据、人工 override 无记录、policy 被绕过 | decision inventory、approval matrix、audit event、access control |
9.4 Release gate
上线前至少回答:
- 决策是否被分类为 customer-impacting、employee-impacting、financial-impacting 或 regulated。
- 每个 objective 和 constraint 是否有 owner。
- 权重、优先级和 guardrail 是否被批准。
- 是否有 baseline、challenger、scenario 和 stress test。
- infeasible、time limit、data failure 是否有明确 fallback。
- 是否能复现任意一次决策的输入、版本、输出和人工改动。
- 是否能监控客户伤害、公平性、SLA、成本、override 和 business value。
- 是否定义了 rollback 条件和责任人。
10. 模板
10.1 Optimization Problem Canvas
| 模块 | 写法 | 示例 |
|---|---|---|
| Decision name | 用业务动作命名,不用算法命名 | Fraud review queue prioritization |
| Business owner | 对结果负责的业务角色 | Fraud operations director |
| Decision cadence | 决策频率和时间窗 | 每 15 分钟滚动优化未来 2 小时队列 |
| Decision unit | 最小可行动对象 | case、employee shift、product-store-day、customer-channel |
| AI inputs | 预测或生成式组件输出 | fraud probability、estimated loss、handle time |
| Decision variables | 系统要选择的动作 | assign case to reviewer, defer, release, escalate |
| Objective | 主目标和次目标 | maximize expected prevented loss under friction guardrail |
| Hard constraints | 不可突破边界 | reviewer capacity、skill eligibility、regulatory holds |
| Soft constraints | 可用 penalty 处理 | reviewer workload balance、low-risk SLA |
| Multi-objective method | tradeoff 方法 | lexicographic: compliance first, then loss, then cost |
| Solver choice | LP / MILP / CP-SAT / routing / heuristic | MILP for assignment with binary variables |
| Runtime target | 延迟、可用性、降级 | 60 seconds, return feasible incumbent on time limit |
| Exception path | 不可行或数据失败时流程 | escalate capacity shortage to operations lead |
| Audit evidence | 必须记录的证据 | input versions, constraints, solver status, binding constraints |
10.2 Objective / Constraint Table
| 类型 | 名称 | 数学方向 | Owner | 生产控制 |
|---|---|---|---|---|
| Objective | Expected prevented fraud loss | maximize sum(p_c * loss_c * reviewed_c) | Fraud product | value dashboard and backtest |
| Objective | Customer friction | minimize hold time and false positive penalty | Customer experience | complaint and release monitoring |
| Hard constraint | Reviewer capacity | sum(handle_c * x_c,r,t) <= capacity_r,t | Operations | workforce feed quality gate |
| Hard constraint | Skill eligibility | x_c,r,t <= skill_match_c,r | Risk operations | skill registry version |
| Soft constraint | Workload balance | penalty for reviewer load variance | Operations | weekly fairness review |
| Guardrail | VIP false positive rate | segment metric below approved threshold | Risk / CX | release gate and monitoring |
10.3 Solver Architecture Template
Decision API
receives business context, entity ids, time horizon, requested objective profile
Input assembler
loads features, forecasts, resource state, policy version, constraint version
Validation layer
checks schema, data freshness, permissions, missing values, scenario id
Model builder
creates sets, parameters, variables, objective, hard constraints, soft penalties
Solver adapter
calls OR-Tools / SciPy / PuLP-CBC / Gurobi with approved configuration
Result validator
checks feasibility, policy compatibility, output completeness, reason codes
Explanation layer
summarizes objective value, binding constraints, tradeoffs, scenario deltas
Workflow publisher
sends executable actions to WFM, CRM, case management, pricing or queue system
Audit publisher
writes trace id, versions, solver status, input hash, output, override hooks
Monitoring
tracks latency, infeasible rate, solution quality, business KPI, guardrails
10.4 Scenario Analysis Template
| Scenario | Parameter change | Expected business question | Output to compare |
|---|---|---|---|
| Base | Current forecast and capacity | 当前方案是否可行 | objective value、SLA、cost、risk |
| Demand shock | Demand +15% in peak windows | 高峰冲击下哪里先失守 | binding constraints、capacity gap |
| Capacity loss | Reviewer / agent availability -20% | 缺勤或外包中断时如何降级 | unmet SLA、high-risk queue aging |
| Risk appetite tighter | Fraud friction guardrail stricter | 更少误拦截会牺牲多少挽损 | prevented loss vs friction |
| Budget pressure | Overtime budget -30% | 成本压缩后哪些服务水平下降 | SLA delta、customer impact |
| Model uncertainty | Use upper / lower forecast bands | 预测误差对决策是否敏感 | solution stability、reroute count |
10.5 Sensitivity / Shadow Price Template
| Resource constraint | Analysis method | Interpretation | Decision use |
|---|---|---|---|
| Fraud reviewer hours | LP relaxation shadow price + scenario re-solve | 多 1 小时审核能力的边际挽损 | 支持 headcount 或外包审批 |
| Bilingual agent capacity | Scenario delta | 多 1 名双语坐席对 SLA 和 abandon rate 的影响 | 招聘、培训和班次设计 |
| Inventory capacity | LP / MILP scenario | 多 1 单位容量对缺货和毛利的影响 | 仓储、补货和调拨策略 |
| Overtime budget | Parametric re-solve | 加班预算变化对服务水平的影响 | 预算谈判和节假日计划 |
| Collections contact limit | Guardrail stress test | 联系强度上限对回款和投诉的影响 | 风险偏好和客户保护治理 |
使用原则:
- LP shadow price 可作为边际价值语言。
- MILP / CP-SAT 场景要用 re-solve、relaxation 和离散增量解释。
- 不把 shadow price 单独作为预算审批结论,必须结合实际可雇佣性、服务质量、客户影响和执行约束。
10.6 Exception Workflow Template
| State | Trigger | Automated response | Human role | Evidence |
|---|---|---|---|---|
| Feasible | Solver returns valid plan | Publish plan after policy check | Review only for high-impact changes | trace id, objective, constraints |
| Feasible with warning | Time limit with acceptable incumbent | Publish with warning or request approval | Operations lead approves | gap, risk summary, affected units |
| Infeasible | Hard constraints conflict | Produce conflict summary and relaxation options | Business owner selects response | violated constraints, scenario |
| Data failure | Stale forecast or missing capacity | Use approved fallback or stop automation | Data owner and operations owner | data quality event |
| Policy blocked | Output violates policy gate | Stop action and escalate | Policy owner reviews | policy id, blocked action |
| Override | Human changes output | Record reason and approval | Authorized manager | original and changed decision |
10.7 30-Day / Interview Output Template
| Day range | Output | Interview proof |
|---|---|---|
| Days 1-5 | One optimization problem canvas for a金融零售场景 | 能把业务决策拆成变量、目标、约束和执行结果 |
| Days 6-10 | LP / MILP / CP-SAT comparison memo | 能解释为什么某场景用 CP-SAT 而不是简单排序 |
| Days 11-15 | Solver decision service architecture | 能画出 forecast-to-optimization-to-workflow 架构 |
| Days 16-20 | Scenario and sensitivity pack | 能讲清 shadow price、capacity business case 和风险偏好 |
| Days 21-25 | Governance and audit evidence binder | 能说明 NIST AI RMF 如何落到优化决策系统 |
| Days 26-30 | Interview story and portfolio case | 能用 staffing、fraud、collections、inventory/pricing 或 contact center 做完整案例 |
11. 30 天训练计划
Week 1: OR for AI Decisioning 基础到建模
| Day | 训练主题 | 输出 |
|---|---|---|
| 1 | 选择一个金融零售决策场景,写 decision inventory | 决策名称、owner、频率、影响对象、自动化等级 |
| 2 | 把场景拆成 sets、parameters、decision variables | 变量清单和数据来源 |
| 3 | 写 objective function 的业务解释和数学方向 | objective memo |
| 4 | 分类 hard / soft / guardrail constraints | constraint registry v1 |
| 5 | 画 forecast-to-optimization 流程 | 从预测到执行的 sequence |
Week 2: LP / MILP / CP-SAT / Routing 方法选择
| Day | 训练主题 | 输出 |
|---|---|---|
| 6 | 用 LP 表达连续资源分配 baseline | LP problem note |
| 7 | 用 binary variables 表达是否选择、是否分配 | MILP modeling note |
| 8 | 用 CP-SAT 思路表达排班、互斥、覆盖和偏好 | CP-SAT modeling note |
| 9 | 用 routing / scheduling 语言描述时间窗和路径 | routing scenario note |
| 10 | 写 solver selection ADR | 为什么选 LP、MILP、CP-SAT 或 routing |
Week 3: AI + Optimization 产品架构
| Day | 训练主题 | 输出 |
|---|---|---|
| 11 | 定义 AI 输入及其误差如何影响决策 | forecast risk matrix |
| 12 | 设计 decision service API 和 schema | API contract sketch |
| 13 | 设计 solver runtime controls | time limit、fallback、gap、status handling |
| 14 | 设计 Agent proposes / solver decides 交互 | agent boundary and validation memo |
| 15 | 画端到端架构图 | solver decision service architecture |
Week 4: Scenario、Sensitivity、Governance、Interview
| Day | 训练主题 | 输出 |
|---|---|---|
| 16 | 设计 base、demand shock、capacity loss 场景 | scenario pack |
| 17 | 做 sensitivity / shadow price 解释 | capacity business case |
| 18 | 写 exception workflow | infeasible、time limit、data failure 流程 |
| 19 | 写 audit event schema | decision evidence fields |
| 20 | 用 NIST AI RMF 做治理映射 | Govern / Map / Measure / Manage table |
| 21 | Retail workforce case 深挖 | staffing optimization story |
| 22 | Fraud review queue case 深挖 | fraud queue optimization story |
| 23 | Credit collections case 深挖 | collections optimization story |
| 24 | Inventory / pricing case 深挖 | pricing-inventory optimization story |
| 25 | Contact center scheduling case 深挖 | scheduling optimization story |
| 26 | 准备 30 秒 pitch | short answer |
| 27 | 准备 2 分钟架构说明 | architecture answer |
| 28 | 准备 tradeoff 追问 | multi-objective answer |
| 29 | 准备治理追问 | audit and risk answer |
| 30 | 组合作品集 narrative | one-page portfolio case |
12. 面试答案
12.1 为什么 AI 决策系统需要 operations research / optimization
30 秒回答
AI 负责预测风险、需求、响应概率和候选动作,但金融零售的真实决策通常受容量、SLA、合规、预算、技能和客户保护约束。Operations research 把这些约束和目标转成可求解、可审计、可执行的优化问题,让 AI 从“给分数”升级为“在约束下做最优行动组合”。
2 分钟回答
如果 fraud 模型给每个交易一个风险分,按分数排序只能解决优先级的一小部分。实际运营还要考虑审核员容量、技能、预计处理时长、客户误拦截成本、SLA 和监管要求。优化层可以把这些因素放进 objective 和 constraints,输出可执行的审核队列和分配方案。
架构上,我会把它设计成 forecast-to-optimization decision service: 模型输出预测参数,constraint registry 提供容量和政策,solver service 求解 LP / MILP / CP-SAT 或 routing 问题,policy gate 做最终控制,workflow 执行动作,audit store 记录版本、输入、约束、求解状态和人工 override。这样 AI 决策系统不仅更有效,也更可治理。
12.2 LP、MILP 和 CP-SAT 怎么选
30 秒回答
如果变量连续、目标和约束线性,用 LP;如果有是否选择、是否分配、整数数量,用 MILP;如果是复杂排班、互斥、覆盖、时间窗和逻辑约束很多,CP-SAT 往往更合适。选择不是看算法名,而是看决策变量、约束结构、求解时间和生产解释需求。
2 分钟回答
比如预算在渠道间连续分配,可以用 LP 做 baseline,也方便做 shadow price 和 sensitivity。Fraud case 分配给 reviewer 是 binary assignment,更适合 MILP。Retail workforce 和 contact center scheduling 有大量班次、休息、技能、互斥、偏好和覆盖规则,CP-SAT 的表达力会更好。Routing 则要考虑路径、容量和时间窗,通常用专门的 routing solver。
产品上还要考虑 SLA。如果在线同步只能给 200 毫秒,就不适合每次求大规模 MILP;可以用预计算策略、heuristic、缓存或分层求解。离线周排班可以给更长时间,追求更高质量方案和 scenario analysis。
12.3 如何处理 multi-objective tradeoffs
30 秒回答
我会先区分不可交易的 hard constraints、可交易的 business objectives 和上线后监控的 guardrails。多目标可以用 weighted sum、lexicographic priority、epsilon constraints 或 Pareto scenarios。关键不是把所有东西揉成一个分数,而是让权重、优先级、风险偏好和业务影响被 owner 明确批准并可审计。
2 分钟回答
以 fraud review 为例,目标至少包括预期挽损、客户摩擦、审核成本和 SLA。客户保护、授权和监管要求是 hard constraints;挽损和成本可以进入 objective;误拦截率、投诉率和 segment impact 是 guardrail。
如果风险团队要求先守住客户摩擦上限,我会用 epsilon constraint: 在 false positive impact 不超过阈值的前提下最大化挽损。如果高层要比较不同风险偏好,我会输出 Pareto scenario,让他们看到每降低一点摩擦会损失多少挽损。这样 tradeoff 是透明的,而不是藏在模型分数里。
12.4 怎么解释 forecast-to-optimization
30 秒回答
Forecast-to-optimization 是把 AI 预测结果作为优化模型参数,再由 solver 在约束下选择行动。比如预测每半小时呼入量和 AHT,然后优化坐席排班、技能覆盖和休息安排。预测告诉我们可能发生什么,优化决定我们该如何配置资源。
2 分钟回答
关键是预测输出必须带时间粒度、实体粒度、置信区间和版本。Contact center 里,呼入量预测、AHT 预测、转人工率预测会转成每个时段的 capacity demand。优化模型再考虑坐席技能、班次、休息、SLA、外包容量和成本,生成班表和溢出策略。
如果预测不确定性高,我不会只用一个点预测,而会做 base、upper band、lower band 和 stress scenario,观察方案是否稳定。生产上还要把实际呼入、等待时间、abandon rate、repeat contact 回流给预测模型和 constraint registry。
12.5 Agent proposes / solver decides 为什么重要
30 秒回答
Agent 擅长理解上下文、生成候选方案和解释,但不应该直接决定受约束的高影响行动。成熟架构应该让 Agent 提出结构化 proposal,solver 检查目标和约束并选择可行方案,policy gate 决定能否执行,workflow 和 audit 负责落地与留证。
2 分钟回答
例如门店运营 Agent 发现周五下午客流异常,提出“增加两名兼职并延长营业支持”。这个建议必须转成结构化输入: 哪些门店、哪些时段、哪些技能、成本上限和服务目标。Solver 再检查员工可用性、劳动规则、预算和最低覆盖,输出可行排班。Policy gate 再确认是否符合授权和审批要求。
这样可以保留 Agent 的解释能力和运营洞察,同时避免 prompt 直接覆盖劳动法规、预算、资质或客户保护约束。
12.6 Solver 找不到可行解怎么办
30 秒回答
不可行不是简单报错,而是产品工作流。系统应输出冲突约束、影响范围和可批准的 relaxation options,并按预设层级处理: 先放松体验偏好,再调整运营目标,高风险偏好需要批准,法规和授权边界不可放松。
2 分钟回答
以 contact center scheduling 为例,如果某天高峰双语技能不足,solver 可能 infeasible。系统需要说明是哪几个时段、哪类技能、哪些 SLA 约束冲突。可选动作包括启用 callback、调整休息、使用外包、批准加班、降低非关键队列 SLA,或将部分咨询引导到异步渠道。
但是不能放松敏感业务授权或合规边界。所有 relaxation 都要有 owner、审批和审计记录。长期看,不可行率本身是 capacity planning 的信号。
12.7 Shadow price 在业务里怎么讲
30 秒回答
Shadow price 可以解释一个资源约束多增加一单位时目标值的边际变化,适合 LP 或 LP relaxation。业务上可以说“多 1 小时高技能审核能力大约带来多少预期挽损”。但对 MILP 和 CP-SAT,不能机械套用,要用场景重求解和离散增量解释。
2 分钟回答
我会把 shadow price 用作 capacity business case 的起点,而不是最终结论。比如 fraud queue 的 LP relaxation 显示高技能 reviewer 小时的边际价值很高,说明这个约束是瓶颈。然后我会做 scenario re-solve: 增加 1 人、2 人、不同班次和不同技能组合,观察实际挽损、SLA、误拦截和成本变化。
这比只说“我们缺人”更有说服力,因为它把 headcount 或外包预算和可量化业务价值连接起来。
12.8 如何把优化决策系统做成可审计架构
30 秒回答
每次决策都要记录 trace id、输入数据版本、预测模型版本、约束版本、目标权重、solver 配置、求解状态、输出、policy check、人工 override 和最终结果。治理上按 NIST AI RMF 做 Govern、Map、Measure、Manage,确保 owner、风险、监控和整改闭环清楚。
2 分钟回答
金融零售里,优化决策可能影响客户权益、员工排班、信贷催收、欺诈拦截和定价。因此不能只保存最终结果。我们要能复现“当时为什么这么决定”。
我会建立 decision audit event,并在 release gate 检查: objective 和 constraint 是否有 owner,权重是否批准,scenario 是否覆盖压力情况,infeasible 和 data failure 是否有 fallback,客户伤害和公平性是否监控,人工 override 是否有原因和审批。这样 solver 才不是黑箱,而是可治理的 decision service。
13. 高级作品集表达
如果把本 playbook 转成作品集,可以用一个金融零售案例贯穿:
Case: AI-assisted fraud review queue optimization
Business problem
Fraud model can score cases, but reviewer capacity is limited and customer friction is high.
Product architecture
Feature service + risk model + constraint registry + MILP solver service + policy gate + case workflow + audit store.
Optimization model
Variables: assign / release / hold / escalate.
Objective: maximize expected prevented loss minus friction and SLA penalty.
Constraints: reviewer capacity, skill, SLA, high-risk mandatory review, customer protection.
AI + OR collaboration
AI predicts fraud probability, loss, handling time and friction.
Solver chooses feasible action mix.
Agent explains bottlenecks and proposes scenario narratives.
Governance
NIST AI RMF mapping, audit event schema, override review, scenario stress test, rollback criteria.
Business value
Higher prevented loss per reviewer hour, lower false positive friction, clearer capacity investment case.
面试中最强的表达不是“我懂 OR-Tools”,而是:
我能把 AI 预测、业务约束、风险偏好、solver 服务、工作流执行和治理审计连接成一个可上线的决策系统。