返回 Papers
AI 底层逻辑 / 经典论文

AI Core Banking Modernization:核心现代化与绞杀者证据架构

重要说明: 本文是学习、作品集和内部架构训练材料, 不构成法律意见、监管解释、合规结论、审计意见、核心迁移批准意见、供应商选型建议或生产 cutover 指令。具体适用范围、监管义务、会计处理、数据保留、客户通知、外包与第三方责任、业务连续性要求和上线批准必须由机构授权角色结合司法辖区、牌照、产品、客户群、监管关系、合同和内部政策确认。访问日期按 2026-06-30 记录。

374ai-foundations/papers/147-ai-core-banking-modernization-strangler-evidence-architecture.md

AI Core Banking Modernization / Legacy Strangler / Evidence Architecture 解读

面向对象: CBAP+ 金融零售 Senior PM / Senior BA / Solution Architect / Enterprise Architect / Core Banking Transformation Lead / Data Migration Owner / Technology Risk Partner。 核心问题: 核心银行现代化不能被简化成“替换主机”或“上新核心包”。真正的难点是如何在存款、贷款、账户、客户、交易、利息、费用、总账、渠道、运营、监管证据和客户影响之间, 用 strangler modernization、anti-corruption layer、capability slicing、migration controls 和 evidence architecture 逐步迁移事实与责任。 学习目标: 建立 AI-assisted core modernization 的高级架构心智模型, 能解释哪些工作 AI 可以安全辅助, 哪些核心写入、迁移判断、cutover 和 source-of-truth 变更必须由授权人和控制流程负责。

重要说明: 本文是学习、作品集和内部架构训练材料, 不构成法律意见、监管解释、合规结论、审计意见、核心迁移批准意见、供应商选型建议或生产 cutover 指令。具体适用范围、监管义务、会计处理、数据保留、客户通知、外包与第三方责任、业务连续性要求和上线批准必须由机构授权角色结合司法辖区、牌照、产品、客户群、监管关系、合同和内部政策确认。访问日期按 2026-06-30 记录。


Source Anchors

SourceOfficial link本文使用方式
FFIEC Architecture, Infrastructure, and Operations IT Handbookhttps://ithandbook.ffiec.gov/it-booklets/architecture-infrastructure-and-operations/用 enterprise architecture、data flow、technology asset、change、operations、resilience 和 third-party oversight 组织核心现代化架构控制。
FFIEC Development, Acquisition, and Maintenance IT Handbookhttps://ithandbook.ffiec.gov/it-booklets/development-acquisition-and-maintenance/用 development/acquisition/maintenance governance、risk management、testing、change 和 acquisition 组织核心包改造、集成与迁移生命周期。
FFIEC Management IT Handbookhttps://ithandbook.ffiec.gov/it-booklets/management用 IT governance、risk management、enterprise architecture、project management、monitoring/reporting 组织 transformation accountability。
FFIEC Business Continuity Management IT Handbookhttps://ithandbook.ffiec.gov/it-booklets/business-continuity-management用 BIA、risk assessment、business continuity strategies、plan、training、exercises、maintenance、board reporting 组织 cutover / rollback / degraded mode。
NIST SP 800-160 Vol. 1 Rev. 1 Engineering Trustworthy Secure Systemshttps://csrc.nist.gov/pubs/sp/800/160/v1/r1/final用 systems security engineering 和 trustworthy secure systems 思维设计核心银行系统边界、可信交互和生命周期控制。
NIST SP 800-218 Secure Software Development Frameworkhttps://csrc.nist.gov/pubs/sp/800/218/final用 secure SDLC、prepare/protect/produce/respond 组织核心现代化代码、配置、供应链和缺陷响应。
NIST AI Risk Management Frameworkhttps://www.nist.gov/itl/ai-risk-management-framework用 Govern / Map / Measure / Manage 界定 AI 辅助现代化的用途、风险、度量、控制和持续改进。
ISO/IEC 42001 AI management systemshttps://www.iso.org/standard/81230.html用 AI management system、责任、运行控制、绩效评价和持续改进组织 AI 工具在核心转型中的治理。

一句话:

Core modernization is not a replacement project. It is a controlled transfer of business facts, operational responsibility and audit evidence from a constrained legacy estate to a safer target operating model.


1. Thesis: 核心现代化不是“换系统”, 是事实责任迁移

低成熟度说法:

旧核心太老
  -> 买一个新核心包
  -> 做数据迁移
  -> 周末 cutover
  -> 关掉旧系统

高级架构说法:

legacy constraints and customer harm model
  -> domain / capability slicing
  -> anti-corruption layer and canonical contracts
  -> event capture and read replica
  -> controlled coexistence
  -> dual-run / parallel-run / reconciliation
  -> evidence-backed cutover
  -> rollback / BCP / operational readiness
  -> source-of-truth retirement by capability

核心银行系统承载的不是普通 CRUD:

  • 客户的账户、余额、利息、费用、额度、还款、冻结、交易历史和合同义务。
  • 渠道、柜面、呼叫中心、支付、卡、贷款、总账、风控、对账、报表、催收、投诉和运营流程。
  • 监管、审计、客户争议、财务控制、数据保留和业务连续性证据。

因此现代化的本质是回答:

问题低成熟度答案高级答案
谁是事实源“新系统上线后就是新系统”每个 capability、data object、posting type、as-of period 都有明确 source-of-truth 迁移状态。
如何降低风险“多测几轮”用 capability slice、shadow ledger、parallel run、reconciliation gate 和 rollback design 降低客户影响。
AI 怎么参与“让 AI 帮忙迁移和写代码”AI 辅助理解、建议、生成测试和分析缺陷, 但不拥有核心写入、迁移批准和 cutover 决策。
审计怎么证明“保存项目文档”evidence architecture 自动连接需求、映射、代码、数据快照、对账、审批、异常、客户影响和恢复演练。

2. Legacy / Mainframe / Core Package Constraints

核心现代化失败通常不是因为目标架构不会画图, 而是没有尊重约束。

Constraint典型表现架构含义
Mainframe batch window夜间批处理、利息计提、费用入账、日终、月终、报表抽取互相挤占窗口不能只按 API latency 设计, 必须理解 batch calendar、freeze time、as-of semantics。
COBOL / copybook / VSAM / DB2 complexity字段复用、压缩格式、历史编码、隐式规则、job dependency 不透明需要 code/document mining、data profiling、lineage 和 business rule evidence。
Core package parameterization产品、费用、利率、额度、状态机通过参数和脚本配置迁移对象不只是代码, 还包括 parameter book、product catalog、operating procedures。
Vendor release cadence核心包升级、补丁、接口变更由供应商节奏约束architecture runway 要包含 vendor dependency、contractual SLA、environment availability。
Channel coupling网银、移动、柜面、IVR、CRM、支付、卡系统直接依赖核心字段strangler 需要 anti-corruption layer, 不能让渠道直接理解两套核心语义。
Ledger and subledger integrity存款、贷款、交易、费用、利息、总账勾稽任何 migration 或 dual-write 都必须有 reconciliation and accounting evidence。
Customer harm exposure错误余额、错误费用、拒绝交易、重复扣款、错误征信或错误催收cutover gate 必须绑定 customer harm scenario, 不是只看技术成功率。

架构师要用这些约束定义 modernization tempo。不是每个 bounded context 都适合先迁。


3. Strangler Fig: 从能力切片, 不是从系统清单切片

Strangler modernization 的关键不是“旧系统外面包一层 API”, 而是逐步把业务能力、数据事实、运营责任和证据链迁移到新平台。

Channels / operations / partners
        |
        v
Experience and process layer
        |
        v
Anti-corruption layer
  intent API | canonical model | mapping | validation | policy | evidence
        |
        +--------------------+
        |                    |
        v                    v
Legacy core estate      Modernized capability
mainframe / package     product service / ledger service / workflow
        |                    |
        v                    v
Event capture       Read model / shadow ledger / reconciliation
        \____________________/
                  |
                  v
Evidence and control plane

能力切片的优先顺序应由四个维度决定:

Dimension问题高优先迁移信号低优先迁移信号
Business value迁移后能否释放产品速度、运营效率或风险控制价值新产品发布慢、渠道体验被旧核心阻塞、人工操作多低变化、低收益、历史查询为主
Coupling与日终、总账、支付、贷款生命周期耦合度可通过 ACL 隔离, 读多写少, 规则边界清楚高频 posting、复杂利息/费用、跨产品勾稽
Evidence readiness是否能证明旧新一致、客户影响可控有稳定 source extract、mapping、recon、test oracle旧规则隐式、数据质量差、异常案例多
Operational readiness运营、客服、风险、财务是否能支撑 coexistenceSOP、培训、rollback、queue、issue playbook 准备充分人工队列脆弱, 供应商环境不可控

4. Anti-Corruption Layer: 语义防火墙

Anti-corruption layer 不是普通 adapter。它是新旧核心之间的语义防火墙, 防止旧系统字段、状态码、批处理假设和异常路径污染目标域模型。

ACL capability核心问题证据
Intent API渠道表达业务意图, 而不是直接写旧核心字段API contract、consumer mapping、approval history
Canonical modelaccount、customer、product、transaction、balance、interest、fee、hold、loan schedule 等核心概念统一model version、field lineage、semantic decision log
Mapping and validation新旧字段、状态、金额、日期、精度、币种、时区、as-of 语义可证明mapping table、rule tests、exception samples
Policy gate哪些写入、查询、客户影响动作允许、拒绝、升级policy version、decision log、override evidence
Idempotency and sequencing防止重复交易、乱序事件、重复入账和恢复重放风险idempotency key、sequence check、replay test
Evidence emission每次转换、调用、回写、拒绝、异常都产生 evidence eventtrace id、event id、source snapshot、approval id

高级判断:

如果 ACL 只是技术转发层, 它会把 legacy complexity 复制到新平台;如果 ACL 管理语义、控制和证据, 它才是 strangler 的治理边界。


5. Event Capture, Read Replica, Canonical Model, Shadow Ledger

5.1 Event Capture

事件捕获适合把旧核心变化转成新世界可消费的事实流:

legacy transaction / batch / table change
  -> capture
  -> normalize
  -> validate
  -> publish canonical event
  -> build read model / reconciliation set / operational dashboard

关键不是“有没有事件”, 而是事件是否能说明:

  • 这是什么业务事实。
  • 发生在何时, 生效于何时, 被谁或什么系统触发。
  • 源记录版本、batch run、job id、sequence 和校验和是什么。
  • 事件是否可重放、可去重、可追溯到旧核心记录。

5.2 Read Replica

Read replica 适合降低渠道和分析系统对旧核心的查询压力, 但不能被误当成事实源:

使用方式可以不可以
客户资料查询缓存非实时或准实时 profile, 标注 freshness用 replica 覆盖核心客户主数据
账户余额展示展示可用余额和账面余额, 显示 as-of time在时效不明时承诺最终余额
运营查询支持客服、投诉、对账工作台用它执行核心 write 或 regulatory fact change
AI 辅助作为 RAG / tool read source, 带 lineage 和 freshness让 AI 基于过期 replica 直接行动

5.3 Shadow Ledger

Shadow ledger 适合在迁移前验证新 ledger / posting engine 与旧核心是否一致:

legacy posting stream
  -> canonical transaction event
  -> new posting engine in shadow mode
  -> balance / interest / fee / GL projection
  -> daily reconciliation
  -> break classification
  -> defect / rule / data correction loop

Shadow ledger 不是生产事实源。它的价值是产生 confidence evidence:

  • 新旧余额差异。
  • 利息、费用、还款、冲正、冻结、追溯调整的差异。
  • 差异分类: 数据问题、映射问题、规则问题、时间问题、手工调整问题。
  • 每个差异的处理责任和关闭证据。

6. Dual-Run / Parallel-Run / Migration Evidence

Core modernization 的高级控制不是“迁移完成率 100%”, 而是每个迁移对象有可证明的迁移质量。

Evidence object说明关键字段
Migration population manifest本次迁移覆盖哪些客户、账户、产品、合同、交易历史、余额和状态population id、source extract time、record count、hash、exclusion reason
Mapping decision record字段、状态、产品参数、利率、费用、异常路径如何映射source field、target field、rule id、owner、approval、test sample
Data quality profile源数据缺失、异常、重复、历史编码和不可迁移项defect type、severity、population impact、fix path
Reconciliation report新旧余额、交易、利息、费用、GL、客户状态是否一致tolerance、break count、break value、aging、owner
Parallel-run scorecard新旧系统在同一业务场景下输出是否一致scenario id、input set、legacy result、target result、variance
Cutover readiness pack技术、业务、运营、供应商、BCP、客户影响和证据是否达标gate status、exceptions、risk acceptance、approvers
Rollback evidence失败时如何恢复旧路径、补偿交易、通知运营和保护证据trigger、decision owner、recovery point、data replay plan

Dual-run 的重点:

same population
same business date
same product rule
same fee / interest / posting semantics
same reconciliation tolerance
same defect classification
same approval evidence

只跑“happy path”不能证明核心迁移可上线。必须覆盖追溯调整、冲正、冻结、异常利率、提前还款、收费豁免、长期未动户、已销户、争议交易、死亡/破产/欺诈标记、合并客户、历史产品代码等高风险案例。


7. AI Assist Boundary

AI 可以提升核心现代化的理解、搜索、映射、测试和运营分析效率, 但必须被放在 evidence-backed human decision loop 中。

7.1 AI 可以安全辅助

AI assist area可做什么必须保留的控制
Requirements mining从 BRD、FRD、SOP、Jira、会议纪要、监管说明、供应商文档抽取规则和冲突引用来源、置信度、BA/SME 审核、冲突清单
Code/document understanding解释 COBOL、copybook、batch job、parameter file、接口说明只读访问、片段引用、专家复核、不可直接生成生产结论
Mapping suggestion建议旧字段到 canonical/target 字段、状态码和规则映射mapping owner 审批、样本验证、diff history
Data profiling发现异常值、空值、重复、格式漂移、历史编码、边界案例数据分类、脱敏、profiling 结果可复算
Test generation生成边界案例、回归案例、parallel-run oracle 草稿QA/SME 选择、测试数据控制、结果不可被 AI 自评闭环
Cutover rehearsal analysis分析演练日志、耗时、队列积压、错误聚类、依赖瓶颈runbook owner 复核、时间线证据、手工决策
Defect clustering把 recon breaks、UAT defects、production issues 聚类成根因候选issue owner 确认、根因证据、不得自动关闭问题
Runbook copilot帮值班和 cutover command center 检索步骤、影响、联系人、历史事故只读、引用 runbook version、禁止自行执行客户影响动作

7.2 AI 必须不能拥有

禁止边界原因控制表达
Final migration decision涉及客户、财务、监管、运营和风险接受Migration Authority / Steering Committee 签署
Unreviewed core writes核心写入可能改变余额、费用、状态、额度和客户权利tool gateway 写操作默认禁止, 高风险动作双人审批
Customer-impacting cutovercutover 会影响服务可用性、交易、余额展示、通知和投诉command center 人工决策, evidence gate, rollback authority
Source-of-truth changes事实源变更影响审计、争议、报表和运营责任SoT registry 版本化, data owner / system owner 审批
Autonomous reconciliation closure差异关闭代表接受风险或确认事实recon owner 审核, materiality rule, exception disclosure
Regulatory/audit conclusionAI 不能替代授权合规、法务、审计或监管关系判断AI output 标注为辅助草稿, 人工批准和引用来源

8. Customer Harm and Operational Readiness

核心迁移必须从客户伤害模型反推控制。

Harm scenario可能根因必须控制
错误余额或可用余额迁移余额错误、事件延迟、hold 语义不同balance reconciliation、as-of disclosure、customer service script
重复扣款或漏扣idempotency 缺失、重放错误、cutover 队列处理不当idempotency key、queue drain proof、duplicate detection
错误利息或费用产品参数、日计息规则、豁免规则迁移错误shadow calculation、fee/interest tolerance、sample disclosure
交易被错误拒绝渠道路由、风险状态、冻结标记映射错误pre-cutover eligibility check、real-time monitoring
投诉和争议无法处理客服看不到旧新两边证据unified case view、runbook、evidence retrieval
财务或报表差异subledger / GL mapping 不一致GL reconciliation、adjustment approval、period close gate

Operational readiness 不是培训材料签收。它应包括:

  • Command center RACI and authority。
  • 业务、技术、供应商、风险、客服、财务、合规、内审观察员的联动。
  • Runbook version、decision log、communication templates、rollback checklist。
  • 客户影响监控、投诉监控、交易拒绝率、余额差异、queue backlog、error budget。
  • 演练证据、值班表、环境健康、供应商响应、BCP / degraded mode。

9. Architecture Runway

核心现代化的 architecture runway 不是“先搭平台”。它是让每个 capability slice 可以被安全迁移的前置能力。

Runway capability为什么重要
Source-of-truth registry明确每类事实当前归属, 支持逐步迁移和责任交接。
Canonical model and event standards降低渠道、核心包、主机、新服务之间的语义污染。
ACL and tool gateway保护 legacy and target writes, 管理幂等、策略和证据。
Evidence event bus把迁移、对账、审批、异常、cutover、rollback 变成可查询事件。
Reconciliation engine支持余额、交易、利息、费用、GL、状态、客户影响的自动对账。
Data quality workbench在迁移前暴露源数据风险, 不把脏数据推给 cutover 周末。
Parallel-run environment支持真实数据规模、时间窗口、批处理和 replay。
Operational cockpit在 coexistence 阶段监控交易、错误、队列、供应商、客户影响。
AI governed workspace支持文档/代码理解和测试生成, 同时保留引用、访问控制和审查。

10. Anti-Patterns

Anti-pattern后果替代做法
Big-bang replacement周末风险集中, rollback 模糊, 客户影响不可控Capability strangler with readiness gates
API wrapping without semantics新渠道继承旧字段和状态码混乱ACL with canonical model and mapping evidence
Data migration as ETL job只关注装载成功, 不证明业务事实正确Migration evidence factory and reconciliation gates
AI-generated mapping accepted by default字段误映射导致余额、费用或状态错误AI suggestion + SME approval + sample testing
Parallel run without defect taxonomy差异无法归因, 上线信心虚高Break classification and closure evidence
Cutover gate dominated by technology忽视客服、投诉、财务、运营和客户沟通Enterprise readiness gate with customer harm lens
Vendor package treated as black box参数、升级、接口和数据语义不可控Vendor control pack and contract-backed evidence
Evidence captured after the fact审计和事故复盘依赖截图与会议记忆Evidence-by-design events, manifests and decision logs

11. PM / Architect Implications

高级 PM / BA / Architect 在核心现代化中的价值不是写更多需求, 而是建立可迁移、可证明、可运营的决策结构:

Role高级贡献
Product / BA把客户旅程、产品规则、异常路径、运营 SOP 和客户伤害转成 capability slice、test oracle 和 cutover gate。
Solution Architect设计 ACL、canonical model、event capture、read model、shadow ledger、integration pattern 和 rollback mechanics。
Enterprise Architect管理 target state、transition architecture、source-of-truth registry、architecture runway、vendor dependency 和 portfolio sequencing。
Data Architect设计 migration population、data quality profile、lineage、reconciliation、retention 和 audit evidence model。
Risk / Audit partner把控制目标转成证据要求, 观察 gate 是否真实运行, 不在最后一周补材料。

12. Interview Answers

Q1: 你会如何设计核心银行现代化的 strangler 架构?

30 秒版本:

我不会从系统替换开始, 会从 capability slice 和 customer harm model 开始。先建立 anti-corruption layer、canonical model、event capture、read replica、reconciliation engine 和 evidence plane, 再按低耦合、高价值、证据就绪的能力逐步迁移。旧核心和新能力在 coexistence 阶段通过 parallel run、shadow ledger、read/write gate 和 source-of-truth registry 控制, 每个 cutover 都要有 rollback、BCP、运营和审计证据。

2 分钟版本:

核心银行现代化的风险在于它承载余额、利息、费用、交易、客户状态、总账和监管证据, 不是普通系统迁移。我会先盘点 legacy constraints: mainframe batch window、核心包参数、渠道耦合、subledger/GL 勾稽、供应商 release cadence 和客户伤害场景。

架构上, 我会在渠道和核心之间建立 anti-corruption layer, 用 intent API 和 canonical model 隔离旧语义。通过 event capture 和 read replica 降低旧核心读压力, 用 shadow ledger 和 parallel run 验证新 posting / product rules。迁移不是一次性 ETL, 而是每个 population 都有 manifest、mapping decision、data profile、reconciliation 和 approval evidence。

AI 可以帮助挖掘需求、理解 COBOL 和供应商文档、建议 mapping、生成测试、分析 cutover 演练和聚类缺陷。但 AI 不能拥有 final migration decision、未复核核心写入、客户影响 cutover、source-of-truth 变更和审计结论。最终 gate 必须由业务、技术、风险、运营、财务和供应商授权角色签署。

Q2: 为什么核心迁移需要 evidence architecture?

30 秒版本:

因为上线成功不等于迁移正确。核心迁移必须能证明迁移了哪些客户和账户、源数据是什么版本、字段如何映射、差异如何对账、谁批准例外、cutover 何时发生、客户是否受影响、出现问题如何 rollback。Evidence architecture 把这些证明变成系统事件和证据包, 而不是事后截图。

2 分钟版本:

金融核心迁移的失败通常不是单点 bug, 而是事实链断裂。余额错了, 团队需要知道源 extract、mapping rule、batch time、产品参数、事件顺序、人工调整和 target posting 哪一步出了问题。监管、内审、财务、投诉和客户争议也需要相同证据。

所以我会设计 evidence plane: migration manifest、mapping decision record、data quality profile、parallel-run result、reconciliation break、approval decision、cutover command log、rollback record 和 customer impact signal 都作为 versioned evidence events。这样每个 capability cutover 都能被复盘、被审计、被持续改进。

Q3: 你如何控制 AI 在核心现代化中的风险?

30 秒版本:

我会把 AI 定位为辅助理解和分析工具, 不是迁移责任主体。AI 可以做需求和代码挖掘、mapping 建议、数据 profiling、测试生成、演练日志分析和 runbook copilot;但不能做最终迁移决策、未经审批核心写入、客户影响 cutover、source-of-truth 变更或合规审计结论。

2 分钟版本:

我会建立 AI assist boundary。所有 AI 输出都必须有来源引用、版本、置信度、reviewer、审批状态和使用范围。对核心写入和 cutover 相关场景, AI 工具默认只读或 dry-run;高风险建议进入人审工作流;AI 不能自动关闭 reconciliation breaks, 不能自动批准 migration mapping, 不能执行客户影响动作。

治理上我会参考 NIST AI RMF 和 ISO/IEC 42001, 把 AI 用例纳入登记、风险分级、评估、监控和持续改进。工程上参考 SSDF 和 systems security engineering, 确保 AI workspace 的数据访问、供应链、日志、缺陷响应和权限边界都可控。