返回架构笔记
Arch Day 125

Arch Day 125: Kubernetes生产模式 — EKS vs AKS vs GKE与生产实战

托管Kubernetes不是"谁都一样的K8s"——三大云的K8s在控制平面定价、版本支持速度、自动化程度上差异显著,选错平台意味着每月数千美元的额外成本和运维负担。

2026-08-02
第五阶段 - 云架构深度
KubernetesEKSAKSGKEKarpenterGatewayAPI生产运维

日期: 2026-08-02 (Day 125) 阶段: 第五阶段 - 云架构深度 标签: #Kubernetes #EKS #AKS #GKE #Karpenter #GatewayAPI #生产运维


核心概念

一句话定义

托管Kubernetes不是"谁都一样的K8s"——三大云的K8s在控制平面定价、版本支持速度、自动化程度上差异显著,选错平台意味着每月数千美元的额外成本和运维负担。


知识点详解

1. 三大托管K8s深度对比

维度AWS EKSAzure AKSGCP GKE
控制平面费用$0.10/hr (~$73/月)免费$0.10/hr (~$73/月)
新版本支持速度4-8周3-6周2周内(最快)
LTS支持14+12个月24个月30个月(Autopilot)
自动化亮点Karpenter原生免费控制平面Autopilot(无节点管理)
AI集成Inferentia/TrainiumTPU v5
集群创建10-15分钟5-10分钟3-5分钟

2. Gateway API — 强制迁移(2026最紧迫任务)

  • 2025年11月: Ingress NGINX Controller宣布2026年3月31日退役
  • 退役后无新版本、无安全补丁
  • Gateway API已GA,是生产就绪替代方案
  • Ingress2Gateway 1.0支持30+常见annotation迁移
  • 优势:模块化、RBAC原生支持、多租户友好

3. Karpenter vs Cluster Autoscaler

维度KarpenterCluster Autoscaler
调度事件驱动,每个Pending Pod立即触发时间驱动,10+秒扫描一次
节点管理直接操作EC2实例通过Auto Scaling Groups
缩容全局评估(20个70%→15个)逐节点评估
多云AWS原生,AKS Preview所有主流云

趋势: Karpenter已成EKS事实标准,AKS也开始原生集成。

4. K8s 1.32-1.35关键特性

K8s 1.32 "Penelope": 39项增强,DRA架构重构 K8s 1.35 "Timbernetes": 60项增强,OCI Image Volume升Beta,OpenTelemetry Profiles进Alpha


面试题

问题:EKS vs GKE,你在什么场景选哪个?

回答

  • EKS:已有AWS投入、需要Karpenter极致弹性、Inferentia/Trainium AI推理
  • GKE:运维团队小(Autopilot模式)、数据密集型(BigQuery集成)、需要TPU
  • AKS:预算敏感(免费控制平面)、Windows容器、Azure生态