返回架构笔记
Arch Day 138

Arch Day 138: 云迁移策略 — 7R、Strangler Fig与大型机现代化

云迁移不是"把服务器搬到云上",而是一次重新审视应用架构、优化运营模式的战略机会。选择正确的迁移策略(7R)决定了投入产出比。

2026-08-15
第五阶段 - 云架构深度
云迁移7RStranglerFig大型机BluAge数据库迁移

日期: 2026-08-15 (Day 138) 阶段: 第五阶段 - 云架构深度 标签: #云迁移 #7R #StranglerFig #大型机 #BluAge #数据库迁移


核心概念

一句话定义

云迁移不是"把服务器搬到云上",而是一次重新审视应用架构、优化运营模式的战略机会。选择正确的迁移策略(7R)决定了投入产出比。


知识点详解

1. 7R迁移策略

策略描述风险周期
Rehost原样搬迁
Replatform用托管服务替换部分组件中低
Refactor云原生重构季度
Rebuild完全重新设计最高半年+
ReplaceSaaS替代
Retain保留本地
Retire淘汰最低

2. 数据库零停机迁移(5阶段)

阶段活动时长
PreparationSchema分析、工具选择1-2周
Bulk Load并行加载历史数据1-10天
CDC实时变更同步(<1-5s延迟)持续
Dual Write双写确保一致性迁移期间
Cutover渐进式读流量切换数小时到数天

工具:Debezium+Kafka(开源)、AWS DMS(托管)、pgloader(PG迁移)

3. Strangler Fig Pattern + Service Mesh

增量式替换旧系统:

  • Istio/Envoy做流量分配(新旧服务按百分比路由)
  • Canary发布逐步迁移流量
  • Feature flag控制进度,随时回滚

4. 大型机现代化

驱动因素: 71%大型机团队人手不足,COBOL外包$250+/小时

AWS Blu Age: COBOL→Java Spring Boot自动转换,**85-95%**自动化

重要变更: AWS Migration Hub Refactor Spaces 2025.11停止新客户;AWS Transform(AI驱动)取代旧版

5. 迁移反模式

反模式后果正确做法
一次性"大爆炸"迁移风险集中,回滚困难分批迁移,每批验证
只做Rehost不优化云上成本更高Rehost后规划Replatform
忽略数据迁移迁移失败主因数据迁移先行,充分测试
跳过性能基线无法验证迁移后性能迁移前建立性能基线

面试题

问题:如何为一个运行15年的核心银行系统制定迁移策略?

回答:1) 评估:识别所有依赖,建立性能基线;2) 外围先行:非核心系统(报表/管理后台)先Rehost/Replace;3) 核心系统Strangler Fig:新功能用微服务,通过API Gateway路由,逐步替换旧模块;4) 数据层:DMS做CDC实时同步,双写验证;5) 最后切换:预留回滚窗口。