返回架构笔记
Arch Day 115

Arch Day 115: 业务架构面试专题

Arch Day 115: 业务架构面试专题

2026-07-23
第四阶段 - 高阶融合
面试业务架构TOGAF能力建模价值流WardleyBIAN

日期: 2026-07-23 (Day 115) 阶段: 第四阶段 - 高阶融合 标签: #面试 #业务架构 #TOGAF #能力建模 #价值流 #Wardley Map #BIAN


概述

业务架构面试是高级架构师面试中最能体现"架构师 vs 高级开发"差距的环节。技术架构人人都会说微服务、DDD,但能清晰阐述业务能力建模、价值流分析、企业架构治理的候选人屈指可数。

本专题整理15道业务架构面试高频题,每道题包含:

  • 30秒版本(电梯演讲)
  • 2分钟版本(标准回答)
  • 追问准备(深度展示)

题目 1:如何为一个企业做业务能力建模?

30秒版本

业务能力建模是将企业"能做什么"抽象为分层的能力树——Level 0是战略能力域(如"客户管理"),Level 1分解为具体能力(如"客户获取""客户服务""客户分析"),Level 2进一步细化。关键原则是"能力描述What,不描述How",且能力应该稳定,不随组织架构变化而变化。

2分钟版本

什么是业务能力:业务能力是企业为交付价值而必须具备的"能力集"。它回答"企业能做什么",而非"企业怎么做"。例如"定价管理"是能力,"用Excel做定价"是实现方式。

建模步骤

步骤1: 确定范围和利益相关方
  └── 全企业 vs 某业务线?谁是输入方?

步骤2: 识别Level 0能力域 (通常5-8个)
  ├── 战略管理
  ├── 产品管理
  ├── 客户管理
  ├── 供应链管理
  ├── 财务管理
  └── 技术管理

步骤3: 逐层分解到Level 1-2 (通常30-80个能力)
  客户管理
  ├── 客户获取 (L1)
  │   ├── 客户资格验证 (L2)
  │   ├── 客户注册 (L2)
  │   └── KYC审核 (L2)
  ├── 客户服务 (L1)
  └── 客户分析 (L1)

步骤4: 评估能力成熟度 (热力图)
  每个能力评分: 1(初始) → 5(优化)
  识别差距: 战略目标要求的vs当前水平

步骤5: 关联业务价值
  将能力与价值流阶段映射
  确定投资优先级

常见方法

  • 自顶向下:从战略目标分解(适合新建)
  • 自底向上:从现有系统/流程提取(适合现状建模)
  • 参考框架:银行用BIAN,保险用ACORD,零售参考ARTS
  • Event Storming:通过领域事件反推能力(DDD方法)

关键原则

  1. 能力与组织架构解耦(组织可能调整,能力应稳定)
  2. 能力与实现解耦("支付处理"能力可以是自研也可以是外购)
  3. 每个能力有唯一Owner(即使跨部门共享)
  4. 粒度统一(同一Level的能力粒度应大致相当)

追问准备

追问: "能力建模和流程建模的区别?"

能力是"What"(企业能做什么),流程是"How"(具体怎么做)。能力稳定,流程可能经常优化。一个能力可能包含多个流程,一个流程可能涉及多个能力。能力建模适合做战略规划和投资分析,流程建模适合做运营优化和自动化。

追问: "在实践中,能力建模最大的挑战是什么?"

粒度控制——太粗了没有分析价值,太细了变成了流程。我的经验法则是Level 2能力应该能对应到1-3个业务服务/应用系统。另一个挑战是跨部门共识——不同部门对同一能力的理解不同,需要反复对齐。


题目 2:TOGAF ADM如何裁剪?

30秒版本

TOGAF ADM是一个通用框架,实际使用时必须裁剪。核心原则是"根据项目规模和组织成熟度裁剪"。小型项目可以合并Phase B/C/D为一个迭代;敏捷环境下可以将ADM嵌入Sprint周期,每个Sprint完成一个架构切片;成熟组织可以跳过需求管理(已有成熟流程)。关键是保留ADM的核心价值——利益相关方管理、架构治理、变更管理。

2分钟版本

ADM全周期回顾

Preliminary → A(架构愿景) → B(业务架构) → C(信息系统架构)
→ D(技术架构) → E(机会和解决方案) → F(迁移规划) → G(实施治理) → H(变更管理)

裁剪策略矩阵

场景裁剪方式保留重点
小项目(3个月内)合并B+C+D为一个轻量迭代架构愿景+关键决策记录
敏捷/SAFe环境ADM嵌入PI Planning架构Runway+ADR
成熟组织(已有EA)跳过Preliminary,轻量Phase A增量架构变更
新建组织完整走一遍,但限时能力基线+目标架构
技术现代化重点Phase C+D,轻量Phase B技术债清理+迁移路径

敏捷环境下的ADM裁剪(2025-2026最常问):

传统ADM:        Phase A → B → C → D → E → F → G → H
                (瀑布式,6-12个月)

敏捷裁剪:
  ┌─────────────────────────────────────────────────┐
  │  架构Runway (持续)                               │
  │  ├── 愿景(A): PI Planning时刷新                  │
  │  ├── 业务架构(B): Epic分析时完成                 │
  │  ├── 技术架构(C+D): Enabler Story              │
  │  └── 治理(G): Architecture Review每Sprint       │
  │                                                 │
  │  Sprint 1  Sprint 2  Sprint 3 ... Sprint 5     │
  │  [分析]    [设计]    [实现]       [验证]        │
  │     └── 每个Sprint产出ADR记录架构决策            │
  └─────────────────────────────────────────────────┘

我在实践中的裁剪原则

  1. 决不裁掉的:利益相关方分析(Phase A)、架构决策记录(贯穿全程)、架构评审(Phase G)
  2. 可以简化的:详细的架构描述文档(用ADR替代长文档)、正式的架构治理委员会(用轻量Review替代)
  3. 必须适配的:交付节奏(瀑布→Sprint)、评审频率(月→每Sprint)、文档形式(Word→Wiki+ADR)

追问准备

追问: "你在项目中实际怎么用TOGAF?"

我不会说"我们严格按TOGAF执行",而是说"我们借鉴TOGAF的能力基线方法和变更管理框架"。具体来说,我在项目中用ADM的Phase A做利益相关方对齐,用Phase B的能力建模做业务分析,用ADR替代完整的架构文档。TOGAF给我的最大价值不是流程,而是思维框架。


题目 3:价值流分析如何驱动IT投资?

30秒版本

价值流是端到端的价值交付过程——从客户需求到客户满足。每个价值流阶段映射到业务能力,通过评估各能力的成熟度和战略重要性,识别"高价值+低成熟度"的能力缺口,这些缺口就是IT投资的优先方向。这比传统的"业务需求驱动IT项目"更系统化,因为它从价值交付视角而非部门视角做投资决策。

2分钟版本

价值流驱动投资的步骤

步骤1: 识别核心价值流

  示例(零售银行):
  ┌─────┐   ┌─────┐   ┌─────┐   ┌─────┐   ┌─────┐
  │客户 │→ │需求 │→ │产品│→ │ 服务│→ │ 深化│
  │获取 │   │识别 │   │开通 │   │ 交付│   │ 关系│
  └──┬──┘   └──┬──┘   └──┬──┘   └──┬──┘   └──┬──┘
     │         │         │         │         │
  能力映射:  能力映射:  能力映射:  能力映射:  能力映射:
  • 渠道管理  • 客户   • KYC   • 交易   • 交叉销售
  • 营销     • 需求分析 • 开户  • 客服   • 客户分析
  • 品牌     • 风险评估 • 合规  • 投诉   • 生命周期

步骤2: 评估每个阶段的"痛点"和"价值泄漏"

  客户获取: 转化率仅3% (行业均值5%) → 价值泄漏$2M/年
  产品开通: 平均7天 (竞品2天) → 客户流失15%
  服务交付: NPS 30 (行业均值45) → 续约率下降

步骤3: 将痛点映射到能力差距

  | 痛点 | 相关能力 | 当前成熟度 | 目标成熟度 | 差距 |
  |------|---------|-----------|-----------|------|
  | 转化率低 | 数字营销 | 2 | 4 | -2 |
  | 开户慢 | KYC自动化 | 1 | 4 | -3 |
  | NPS低 | 全渠道客服 | 2 | 4 | -2 |

步骤4: 计算投资优先级

  Priority = 价值影响 × 差距大小 / 实施难度

  KYC自动化: $3M收入影响 × 3差距 / 中等难度 → P0
  数字营销: $2M × 2 / 低难度 → P1
  全渠道客服: $1.5M × 2 / 高难度 → P2

步骤5: 形成投资路线图
  Q1-Q2: KYC自动化 (投资$500K,预期ROI 6x)
  Q3-Q4: 数字营销升级 (投资$300K,预期ROI 7x)
  Next Year: 全渠道客服 (投资$800K,预期ROI 4x)

价值流分析的优势

  • 从客户视角而非部门视角做决策
  • 用数据量化"投资这个能力值多少钱"
  • 避免"会哭的孩子有奶吃"——谁声音大谁拿到预算

追问准备

追问: "价值流分析和CBAM有什么关系?"

CBAM(基于成本的架构分析方法)是在架构方案层面做经济分析,而价值流分析是在战略层面做投资决策。两者互补——价值流分析决定"投资哪个能力",CBAM决定"这个能力的架构方案怎么选"。在实践中,我通常先做价值流分析确定投资方向,再用CBAM评估具体技术方案的ROI。


题目 4:Wardley Map如何辅助技术战略?

30秒版本

Wardley Map通过两个维度——价值链(纵轴:用户可见度)和演化阶段(横轴:Genesis→Custom→Product→Commodity)——来可视化技术组件的战略定位。它能帮助回答三个关键问题:哪些该自建(Genesis/Custom阶段)、哪些该买/用SaaS(Product阶段)、哪些该用云服务/开源(Commodity阶段),以及哪些组件即将演化到下一阶段需要提前布局。

2分钟版本

Wardley Map的构建

可见度
  高 │  [用户需求]
     │       │
     │  [Web前端] ─── [移动App]
     │       │            │
     │  [业务逻辑层]───────┘
     │       │
     │  [订单管理]  [支付处理]  [推荐引擎]
     │       │          │           │
     │  [数据库]   [支付网关]  [ML模型]
     │       │          │           │
  低 │  [云基础设施]────────────────┘
     │
     └───┬──────┬──────┬──────┬───→ 演化
       Genesis Custom Product Commodity

战略决策应用

演化阶段特征策略示例
Genesis新颖/不确定自建+试验AI推荐算法
Custom定制化/差异化自建+核心团队订单路由引擎
Product成熟/有现成方案买/SaaSCRM/ERP
Commodity标准化/无差异云服务/开源数据库/消息队列

2025-2026最新应用——AI时代的Wardley Map

根据2026年David Haberlah的分析,Agentic AI正在改变Build vs Buy的经济学——曾经明确属于"Buy"(Product/Commodity阶段)的SaaS组件,由于AI降低了开发成本,部分正在回归"Build"。具体而言:

  • **SaaS平台(Product阶段)**原来是明确的"Buy",但现在AI编码让定制化构建成本暴降
  • 评估标准变化:不是"这个产品够不够好",而是"它与我工作流的匹配程度值不值得我付出集成成本"

我在实际项目中的应用

场景: 为一家零售银行做3年技术战略

1. 画出当前Wardley Map
   - 核心银行: Custom (自研老系统)
   - 手机银行: Product (外购)
   - 风控引擎: Custom (自研)
   - 基础设施: Commodity (IDC)

2. 预测演化方向(3年)
   - 核心银行: Custom → Product (云原生核心银行成熟)
   - 手机银行: Product → Commodity (低代码可搭建)
   - 风控引擎: Custom → Custom (仍需差异化)
   - 基础设施: Commodity → Commodity (全面上云)
   - AI Agent: Genesis → Custom (新赛道)

3. 得出战略
   - 核心银行: 准备迁移到Thought Machine等云原生平台
   - 手机银行: 降低投入,用低代码平台快速迭代
   - 风控引擎: 继续投资,融入AI能力
   - AI Agent: 组建创新团队试验

追问准备

追问: "Wardley Map和波特五力模型有什么区别?"

波特五力分析的是行业结构和竞争格局(静态),Wardley Map分析的是价值链组件的演化方向(动态)。波特告诉你"行业有多激烈",Wardley告诉你"接下来会发生什么"。在战略规划中,我先用波特五力理解竞争环境,再用Wardley Map规划技术演进。


题目 5:如何用BIAN标准规划银行架构?

30秒版本

BIAN(Banking Industry Architecture Network)提供了银行业的标准服务目录——约300+个Service Domain覆盖银行全业务。它的价值不是"照搬",而是作为参考模型来检查自己的架构是否有遗漏、服务粒度是否合理。实践中我会先用BIAN Service Landscape做能力对标,识别差距,然后选择性采纳——核心域保留自己的建模,通用域对齐BIAN标准。

2分钟版本

BIAN框架核心结构

BIAN Service Landscape (约300+ Service Domains)

┌─────────────────────────────────────────────┐
│  业务领域 (Business Areas)                   │
│                                             │
│  ┌──────────────┐  ┌──────────────┐         │
│  │ 客户管理      │  │ 产品管理      │         │
│  │ • Party       │  │ • Product    │         │
│  │ • Contact     │  │ • Design     │         │
│  │ • Directory   │  │ • Directory  │         │
│  └──────────────┘  └──────────────┘         │
│                                             │
│  ┌──────────────┐  ┌──────────────┐         │
│  │ 销售服务      │  │ 运营服务      │         │
│  │ • Offer       │  │ • Payment    │         │
│  │ • Agreement   │  │ • Settlement │         │
│  │ • Fulfillment │  │ • Accounting │         │
│  └──────────────┘  └──────────────┘         │
│                                             │
│  ┌──────────────┐  ┌──────────────┐         │
│  │ 风险合规      │  │ 基础服务      │         │
│  │ • Compliance  │  │ • Reference  │         │
│  │ • Fraud       │  │ • Transaction│         │
│  │ • Credit Risk │  │ • Security   │         │
│  └──────────────┘  └──────────────┘         │
└─────────────────────────────────────────────┘

BIAN的实际应用方式

方式1: 能力对标
  将自己的服务目录和BIAN对比
  → 发现缺少"Customer Behavioral Insights"服务
  → 纳入规划

方式2: 服务粒度参考
  自己的"客户管理"是一个大单体
  BIAN分解为: Party Reference, Customer Profile,
  Customer Behavior Models, Customer Access Entitlement...
  → 参考BIAN做微服务拆分

方式3: API标准化
  BIAN定义了Service Operation (CRUD+Execute+Request+Notify)
  → 统一团队的API设计规范

方式4: 厂商评估
  用BIAN Service Domain覆盖率评估核心银行供应商
  → 某厂商覆盖80%的BIAN域 → 差距20%需要定制

注意事项

  • BIAN是参考不是标准——不必100%对齐
  • 大型银行用BIAN做架构治理最有价值
  • 中小银行可以选择性采纳核心域
  • BIAN与TOGAF互补——TOGAF是方法论,BIAN是银行业参考内容

追问准备

追问: "BIAN和DDD限界上下文如何结合?"

BIAN的Service Domain可以近似映射为DDD的限界上下文,但粒度通常更细。我的做法是以BIAN的Service Domain为参考划分微服务边界,但内部建模仍用DDD方法(聚合根/实体/值对象)。例如BIAN的"Current Account"Service Domain → DDD的"活期账户"限界上下文。


题目 6:如何向非技术高管解释架构决策?

30秒版本

关键是"翻译"——将技术决策翻译为业务影响。我用"三明治法":先说业务目标("我们要支撑双11 10倍流量"),再用类比解释技术方案("就像高速公路扩容,我们需要从4车道变8车道"),最后说投资和收益("投入200万,避免宕机损失2000万")。永远不要用技术术语,用业务语言。

2分钟版本

高管沟通框架

1. 业务语境 (Business Context) - 30秒
   "我们的战略目标是支撑未来3年5倍业务增长"

2. 当前痛点 (Pain Points) - 30秒
   "现在系统每次大促都会宕机2小时,直接损失500万"

3. 方案选项 (Options) - 30秒
   "方案A: 投入200万,优化现有系统(短期有效,1年后还是不行)
    方案B: 投入800万,重建云原生架构(一次到位,支撑5倍增长)
    方案C: 投入500万,分阶段迁移(平衡风险和收益)"

4. 推荐理由 (Recommendation) - 20秒
   "推荐方案C,因为:
    • 风险可控(分阶段,每阶段可验证)
    • ROI最优(18个月回本)
    • 不影响在线业务"

5. 决策请求 (Ask) - 10秒
   "需要批准500万预算和6个月第一阶段"

实用技巧

  • 类比而非术语(微服务→"乐高积木式组装")
  • 数字量化影响("每次宕机损失500万"而非"可用性降低")
  • 风险引起关注("不做的风险是什么")
  • 竞品制造紧迫感("竞品已经完成了云迁移")

追问准备

追问: "高管说'太贵了'怎么回应?"

我会展示"不投资的成本":按照当前每年宕机损失500万×5年=2500万,加上因系统慢导致的客户流失率增加3%=年损失1000万。500万投资对比这些损失,ROI非常明确。另外我会提供分阶段方案——第一阶段只需200万,3个月见效。


题目 7:业务流程建模用BPMN还是Event Storming?

30秒版本

BPMN适合建模"已知的、需要精确定义的"流程(如合规流程、审批流程),强调控制流和网关条件。Event Storming适合"探索的、需要发现的"领域(如新产品设计、系统重构),强调领域事件和聚合发现。两者互补——先用Event Storming探索业务全貌,再用BPMN精确定义关键流程。

2分钟版本

对比分析

维度BPMNEvent Storming
目的精确定义流程探索和发现领域
受众业务分析师/流程自动化架构师/开发/业务
产出流程图(可执行)领域模型/限界上下文
协作模式一人画多人审多人协作(贴便利贴)
粒度任务级(Task/Activity)事件级(Domain Event)
工具Camunda/Activiti便利贴/Miro
适用场景审批流/工作流/合规新项目/重构/探索

何时用BPMN

  • 需要流程自动化(Camunda/Zeebe执行引擎)
  • 需要精确的控制流(网关/条件/并行/补偿)
  • 合规要求流程可审计
  • 跨部门流程需要精确定义职责(泳道图)

何时用Event Storming

  • 项目初期,领域不清晰
  • 需要技术和业务对齐
  • 识别限界上下文和聚合
  • 发现隐藏的业务规则

我的实践方法

Phase 1: Big Picture Event Storming (半天工作坊)
  → 发现核心领域事件和限界上下文
  → 产出: 领域事件流 + 限界上下文地图

Phase 2: Process-Level Event Storming (每个上下文1-2天)
  → 深入每个上下文,发现命令/聚合/策略
  → 产出: 聚合设计 + 关键业务规则

Phase 3: BPMN精确建模 (关键流程)
  → 对需要流程引擎驱动的流程用BPMN建模
  → 产出: 可执行的流程定义

结论: Event Storming先行探索,BPMN后行精确化

追问准备

追问: "Event Storming效果好,但很多团队做不好,为什么?"

三个常见问题:(1) 没有真正的领域专家参与——只有开发人员"自嗨";(2) 引导师技能不够——不会控场,被细节带跑;(3) 后续没有跟进——热闹完回去还是老样子写代码。解决方法:确保业务方参与、找有经验的引导师、Event Storming产出直接转化为Backlog。


题目 8:企业架构治理如何落地?

30秒版本

架构治理 = 规则 + 流程 + 工具 + 文化。规则是架构原则和标准(如"所有服务必须通过API Gateway"),流程是评审机制(如"每个Sprint有Architecture Review"),工具是ADR和架构适应度函数(自动检查合规),文化是让团队理解"架构治理不是限制自由,而是确保方向一致"。最重要的是轻量级——过重的治理没人遵守。

2分钟版本

架构治理框架

┌─────────────────────────────────────────────┐
│             架构治理四个支柱                   │
├─────────────────────────────────────────────┤
│                                             │
│  1. 架构原则 (Principles)                    │
│     ├── 业务原则: "客户优先""数据驱动"       │
│     ├── 架构原则: "API First""事件驱动"      │
│     ├── 技术原则: "Cloud Native""开源优先"   │
│     └── 安全原则: "零信任""最小权限"         │
│                                             │
│  2. 评审流程 (Review Process)                │
│     ├── L1: 团队自评 (每Sprint, ADR)         │
│     ├── L2: 架构评审 (每月, 跨团队)          │
│     ├── L3: 架构委员会 (季度, 重大决策)       │
│     └── 触发条件: 新服务/技术选型/大变更      │
│                                             │
│  3. 合规工具 (Compliance Tools)              │
│     ├── ADR系统: 决策记录和搜索              │
│     ├── ArchUnit: 代码级架构约束自动检查     │
│     ├── 适应度函数: CI/CD中自动验证          │
│     └── 技术雷达: 技术选型指导(Hold/Assess/  │
│         Trial/Adopt)                        │
│                                             │
│  4. 架构文化 (Culture)                       │
│     ├── 内部Tech Talk (每月分享)             │
│     ├── 架构决策透明 (ADR全员可见)           │
│     ├── 允许实验 (Innovation Sprint)         │
│     └── 奖励优秀架构实践                     │
└─────────────────────────────────────────────┘

落地关键

  • 从小做起:先推ADR,再推评审,最后推适应度函数
  • 自动化优于人工:用ArchUnit自动检查,而非开会Review
  • 引导优于强制:用技术雷达引导选型,而非禁止清单
  • 度量优于感觉:统计ADR数量、评审覆盖率、合规率

追问准备

追问: "架构治理和开发自由度如何平衡?"

我的原则是"大方向管控,小细节自由"。架构原则和技术选型(如"用Kafka做消息队列")是必须遵守的——这是"高速公路的车道线"。但具体实现(如"用Kotlin还是Java写服务")是团队自主的——这是"车道内怎么开"。治理的目的是让100个团队的系统能互操作,而非统一编码风格。


题目 9:商业模式画布如何映射到架构设计?

30秒版本

商业模式画布的9个要素直接影响架构关键决策:价值主张决定核心域设计,客户细分决定多租户/个性化架构,渠道决定接入层设计,收入模式决定计费/结算系统,关键资源决定技术平台选择,关键伙伴决定集成架构,成本结构决定自研/外购/云策略。架构师必须理解商业模式,否则设计出的架构和业务脱节。

2分钟版本

映射关系

商业模式要素架构影响示例
价值主张核心域设计"最快配送"→投资路由引擎和调度系统
客户细分多租户/SaaS架构B端+C端→不同的BFF和数据隔离
渠道接入层/BFF全渠道→统一API Gateway+多BFF
客户关系CRM/会员系统自助→在线客服系统 / 专属→客户经理系统
收入模式计费/结算引擎订阅→Billing系统 / 佣金→清结算系统
关键资源技术平台选择数据驱动→投资数据平台 / IP驱动→保护算法
关键活动核心流程自动化物流→WMS/TMS / 制造→MES/ERP
关键伙伴集成架构多供应商→开放API平台 / 生态→SDK
成本结构自研vs外购策略成本敏感→SaaS/开源 / 差异化→自研

实践方法

  1. 和业务方一起画商业模式画布
  2. 对每个要素问:"这对系统架构意味着什么?"
  3. 标记哪些是核心域(差异化竞争力)、哪些是通用域(标准化)
  4. 根据收入模式推导系统的可靠性/性能/安全要求
  5. 根据成本结构推导技术选型策略

追问准备

追问: "平台型商业模式对架构有什么特殊要求?"

平台模式(如淘宝/美团)的架构核心是"供需撮合+交易信任+规则引擎"。技术上需要:多租户隔离(每个商家一个"虚拟空间")、开放API平台(商家接入)、规则引擎(平台规则动态调整)、分账结算系统(多方分润)、信用/评价体系。平台架构的关键词是"开放、弹性、治理"。


题目 10:如何评估业务架构的成熟度?

30秒版本

我用五级成熟度模型评估:Level 1-无架构(各做各的),Level 2-被动响应(项目驱动的临时架构),Level 3-主动规划(有能力基线和目标架构),Level 4-度量优化(架构决策可追溯、合规率可度量),Level 5-持续演进(架构与战略紧密联动,自动化治理)。大多数企业在Level 2-3,达到Level 4就已经是行业前10%。

2分钟版本

五级成熟度模型

Level 5: 持续演进 ────────────── 极少数标杆企业
  • 架构与战略实时联动
  • 自动化架构适应度检查
  • 数据驱动的架构决策
  • 架构创新引领业务创新

Level 4: 度量优化 ────────────── 行业领先(Top 10%)
  • ADR覆盖所有重大决策
  • 架构合规率可度量(>90%)
  • 技术债可量化和管理
  • 定期ATAM评审

Level 3: 主动规划 ────────────── 多数成熟企业目标
  • 有能力基线和目标架构
  • 有架构原则和标准
  • 架构评审流程建立
  • 但执行不够一致

Level 2: 被动响应 ────────────── 多数企业现状
  • 项目驱动的架构决策
  • 依赖个别架构师经验
  • 缺乏统一标准
  • 技术债积累

Level 1: 无架构  ────────────── 初创/小团队
  • 没有架构师角色
  • 没有架构文档
  • 完全依赖开发经验

评估维度和度量

维度度量指标L2标准L4标准
架构文档ADR覆盖率<20%>90%
架构评审重大变更评审率<30%>95%
技术标准技术栈合规率无标准>85%
技术债债务量化率不知道有多少全部量化
架构可观测依赖图准确率没有图自动生成
战略对齐架构路线图覆盖率没有路线图年度更新

追问准备

追问: "如何在6个月内将成熟度从Level 2提升到Level 3?"

三步走:(1) 第1-2月——建立架构原则和ADR制度(所有新决策必须写ADR);(2) 第3-4月——做一次现状能力建模(As-Is),建立能力基线;(3) 第5-6月——制定目标架构和差距分析,形成第一版架构路线图。核心是"先建制度,再填内容"。


题目 11:数字化转型中架构师的角色是什么?

30秒版本

架构师在数字化转型中扮演"翻译官+设计师+守护者"三重角色:翻译业务战略为技术架构方向,设计现代化的目标架构和迁移路径,守护架构演进过程中的一致性和质量。最关键的是做好"遗留系统现代化"的规划——80%的转型失败都源于低估了遗留系统改造的复杂性。

2分钟版本

三重角色详解

角色1: 翻译官 (Business ↔ Technology)
  ├── 将CEO的"我们要数字化"翻译为具体架构目标
  ├── 将技术约束翻译为业务影响("老系统限制了...")
  └── 建立业务能力到技术系统的映射

角色2: 设计师 (Architecture Design)
  ├── 设计目标架构(Cloud-Native/Microservices/Event-Driven)
  ├── 设计迁移路径(Big Bang vs Strangler vs Parallel Run)
  ├── 设计数据迁移策略(最容易被忽视的部分)
  └── 设计组织架构变化(Conway's Law)

角色3: 守护者 (Architecture Governance)
  ├── 确保转型过程不偏离架构方向
  ├── 管控技术债(新系统不能再堆债)
  ├── 平衡短期交付压力和长期架构目标
  └── 建立架构度量和反馈机制

2025-2026趋势:数字化转型已进入"第二波"——从"上云/上线"到"AI驱动的智能化"。架构师的新挑战是将AI能力嵌入现有架构,包括AI Agent编排、数据治理(AI需要高质量数据)、模型运维(MLOps/LLMOps)。

追问准备

追问: "数字化转型中最常见的架构反模式?"

(1) "分布式单体"——拆了微服务但耦合没解开;(2) "技术驱动转型"——没有业务目标,为了微服务而微服务;(3) "忽视数据"——系统换了但数据还是一团糟;(4) "Big Bang"——想一步到位,结果一步到坑。


题目 12:如何做架构现状评估(As-Is Assessment)?

30秒版本

架构现状评估的核心产出是三张图和一份报告:系统全景图(有哪些系统、怎么交互)、能力覆盖热力图(哪些能力强、哪些弱)、技术债分布图(哪些系统债务最重),以及一份差距分析报告(现状vs目标的差距)。方法上结合文档审查、利益相关方访谈、代码/系统分析三个维度。

2分钟版本

评估框架

输入:
  ├── 现有架构文档(如果有的话)
  ├── 系统运维记录(故障/性能/变更)
  ├── 利益相关方诉求
  └── 业务战略目标

评估维度:
  1. 系统拓扑: 有多少系统?怎么交互?数据怎么流转?
  2. 技术栈: 用了什么技术?版本?EOL?
  3. 质量属性: 性能/可用性/安全/可维护性 当前水平
  4. 业务覆盖: 哪些业务能力有系统支撑?哪些还是手工?
  5. 技术债: 代码质量/架构债务/基础设施债务
  6. 组织能力: 团队技术栈/人员配比/DevOps成熟度

方法:
  Week 1: 文档收集 + 系统清单梳理
  Week 2: 利益相关方访谈 (业务+技术, 10-15人)
  Week 3: 技术深潜 (代码审查/架构分析/性能测试)
  Week 4: 差距分析 + 报告撰写

产出:
  ├── 系统全景图 (ArchiMate)
  ├── 能力覆盖热力图
  ├── 技术债登记簿
  ├── 差距分析矩阵
  └── 改进建议优先级排序

追问准备

追问: "如果企业没有任何架构文档怎么办?"

这其实是常见情况。三个办法:(1) 从运维监控反推——看Zabbix/Prometheus/日志,能知道系统拓扑;(2) 从数据库反推——ER图暴露了业务模型;(3) 从代码反推——用工具(如Lattix/Structure101)分析代码依赖。最有效的是"一小时白板会"——请系统负责人花1小时画出他负责的系统和上下游。


题目 13:能力热力图如何辅助投资决策?

30秒版本

能力热力图在二维矩阵上展示每个业务能力的"战略重要性"和"当前成熟度"。右下角(高重要性+低成熟度)是优先投资区;左上角(低重要性+高成熟度)是过度投资区。这个可视化工具帮助管理层直观看到"把钱花在哪里回报最大"。

2分钟版本

                    战略重要性
              低          中          高
         ┌──────────┬──────────┬──────────┐
    高   │ 过度投资  │  维持     │  保持领先  │
         │ → 降低投入│  → 稳定   │  → 持续优化│
  成 ├──────────┼──────────┼──────────┤
  熟    中   │ 非优先    │ 按需提升  │  重点关注  │
  度    │ → 维持   │  → 择机   │  → 快速补齐│
         ├──────────┼──────────┼──────────┤
    低   │ 暂不投资  │ 评估价值  │  紧急投资  │
         │ → 观望   │  → 论证   │  → 立即启动│
         └──────────┴──────────┴──────────┘

示例(零售企业):
  紧急投资: 全渠道库存(高重要×低成熟) → 投入$1M
  重点关注: AI推荐(高重要×中成熟) → 投入$500K
  过度投资: 传统报表(低重要×高成熟) → 减少投入

制作步骤

  1. 列出所有L1级业务能力(通常20-30个)
  2. 业务方评估"战略重要性"(1-5分)
  3. IT评估"当前成熟度"(1-5分)
  4. 绘制热力图,标识象限
  5. 计算投资优先级 = (重要性 - 成熟度) × 影响系数

追问准备

追问: "评分主观怎么办?"

三个办法降低主观性:(1) 多人评分取均值(至少5人);(2) 用数据支撑——"成熟度"可以用系统可用性/客户满意度/效率指标量化;(3) 和竞品对标——竞品有而我们没有=低成熟度。最终评分不需要精确,能区分出"高/中/低"三档就够了。


题目 14:如何做技术雷达(Technology Radar)?

30秒版本

技术雷达借鉴ThoughtWorks的实践——将技术分为四个象限(语言框架/工具/平台/技术实践),每项技术标注四个状态(Adopt-推荐使用/Trial-可以试用/Assess-观望评估/Hold-停止使用)。每季度更新,由架构团队+资深开发共同评审。它的核心价值是"统一选型标准"——新项目选技术时先查雷达,不在雷达上的需要申请评审。

2分钟版本

技术雷达结构

          ┌──────────────────────────┐
          │      Technology Radar     │
          ├──────────────────────────┤
          │                          │
  Adopt ──┤  Kotlin  React  K8s     │
          │  Go     PostgreSQL       │
          │                          │
  Trial ──┤  Rust   Pulsar  Dapr    │
          │  WASM   Temporal         │
          │                          │
 Assess ──┤  Zig    Mojo   Valkey   │
          │  AI Agent Framework      │
          │                          │
   Hold ──┤  jQuery  Oracle→PG迁移  │
          │  自研RPC→gRPC迁移       │
          └──────────────────────────┘

四个象限:
  ├── Languages & Frameworks (语言和框架)
  ├── Tools (工具链)
  ├── Platforms (平台和基础设施)
  └── Techniques (技术实践和方法)

运营机制

  • 更新频率:每季度一次
  • 评审团:首席架构师 + 各团队Tech Lead(8-12人)
  • 评审标准:社区活跃度/生产验证/团队掌握程度/与现有栈兼容性
  • 例外流程:使用非雷达技术需要提交ADR,经架构评审通过

追问准备

追问: "团队不遵守技术雷达怎么办?"

先理解原因——是不知道?还是有合理理由?如果是合理理由(如特定场景确实需要),走例外流程记录ADR。如果是不遵守制度,通过代码审查和CI检查(如ArchUnit限制依赖)自动拦截。治理的终极目标不是100%合规,而是让每个"例外"都有记录和理由。


题目 15:业务架构和企业架构的关系是什么?

30秒版本

企业架构(EA)包含四个维度:业务架构、数据架构、应用架构、技术架构。业务架构是EA的"锚点"——它定义了企业需要什么能力、什么流程、什么数据,后三个架构都是为了支撑业务架构而存在。没有业务架构的EA就像没有需求的代码——技术可能很厉害但不知道在解决什么问题。TOGAF把Phase B(业务架构)放在C(信息系统)和D(技术)之前,正是这个原因。

2分钟版本

四维架构关系

                 ┌──────────────┐
                 │  业务战略     │
                 │  (Why/What)  │
                 └──────┬───────┘
                        │ 驱动
                        ▼
                 ┌──────────────┐
                 │  业务架构     │
                 │  能力/流程/   │
                 │  组织/信息    │
                 └──────┬───────┘
                        │ 约束
           ┌────────────┼────────────┐
           ▼            ▼            ▼
    ┌──────────┐ ┌──────────┐ ┌──────────┐
    │ 数据架构  │ │ 应用架构  │ │ 技术架构  │
    │ 概念/逻辑│ │ 系统/集成│ │ 平台/网络│
    │ /物理模型│ │ /接口    │ │ /基础设施│
    └──────────┘ └──────────┘ └──────────┘
           │            │            │
           └────────────┼────────────┘
                        │ 实现
                        ▼
                 ┌──────────────┐
                 │  实施方案     │
                 │  项目/迁移/  │
                 │  路线图      │
                 └──────────────┘

核心观点

  • 业务架构是"需求侧",其余三个是"供给侧"
  • 业务架构决定IT投资方向(投什么)
  • 应用架构决定系统边界(建什么)
  • 数据架构决定信息流转(流什么)
  • 技术架构决定平台支撑(用什么)

常见误区

  • "EA就是画系统拓扑图" → EA核心是业务与技术的对齐
  • "业务架构是BA的事" → 架构师必须理解业务
  • "四个架构分开做" → 必须迭代推进,互相验证

追问准备

追问: "在敏捷组织中,EA是否还有价值?"

绝对有,但形式需要变化。传统EA产出厚厚的文档半年后才能用,敏捷EA产出的是"架构Runway"——提前1-2个Sprint做必要的架构决策,为团队铺路。SAFe中的"Architectural Runway"正是这个概念。EA的价值从"制定蓝图"变为"提供方向+确保一致性"。


面试技巧总结

如何在面试中展示业务架构思维

技巧1: 永远从业务出发
  ✗ "我建议用微服务架构..."
  ✓ "根据业务增长目标,核心系统需要支撑10倍扩展..."

技巧2: 用框架但不被框架困住
  ✗ "按照TOGAF ADM的Phase B..."
  ✓ "我通常用能力建模来理解业务全貌,这个方法论来自TOGAF..."

技巧3: 展示量化思维
  ✗ "这个能力很重要需要投资"
  ✓ "这个能力差距导致每年损失500万,投资200万6个月回本"

技巧4: 展示沟通能力
  ✗ 只画技术架构图
  ✓ 用价值流图、能力热力图这些"业务人也能看懂"的可视化

技巧5: 展示权衡思维
  ✗ "这是最佳实践"
  ✓ "方案A更快但技术债高,方案B更稳但周期长,我推荐B因为..."

业务架构面试评分维度

维度权重优秀表现
业务理解30%能清晰描述业务能力和价值流
方法论20%灵活运用TOGAF/BIAN/能力建模
量化能力20%用数据支撑架构决策
沟通表达20%不同受众不同语言
实战经验10%有真实项目案例

今日总结

关键收获

  1. 业务架构是架构师的"隐形门槛"——技术架构大家都会说,但业务架构能力才是区分高级和资深的关键
  2. 能力建模是业务架构的基石——能力稳定、与组织解耦、可度量
  3. 价值流是投资决策的依据——从客户视角分析价值泄漏,用数据驱动投资
  4. Wardley Map是战略工具——在AI时代,Build vs Buy的边界正在被重新定义
  5. 治理要轻量——ADR+自动化检查+架构评审,不要搞成"架构审批委员会"

15题速查表

#题目核心关键词
1业务能力建模What not How / 分层 / 稳定
2TOGAF裁剪敏捷适配 / 保留核心 / ADR替代文档
3价值流投资价值泄漏 / 差距分析 / ROI
4Wardley Map演化阶段 / Build vs Buy
5BIAN标准银行参考模型 / 服务目录
6高管沟通翻译 / 类比 / 数字 / 风险
7BPMN vs Event StormingWhat vs How / 探索 vs 精确
8架构治理原则+流程+工具+文化
9商业模式→架构9要素映射 / 核心域识别
10成熟度评估五级模型 / 度量指标
11数字化转型角色翻译官+设计师+守护者
12As-Is评估三张图一报告 / 四周完成
13能力热力图重要性×成熟度 / 投资象限
14技术雷达Adopt/Trial/Assess/Hold
15BA与EA关系业务是锚点 / 四维迭代

明日预告: Day 116 - 软件架构面试专题,15道精选软件架构面试题,涵盖DDD、微服务、事件驱动、CQRS、Saga等核心主题。