Arch Day 125
Arch Day 125: Kubernetes生产模式 — EKS vs AKS vs GKE与生产实战
托管Kubernetes不是"谁都一样的K8s"——三大云的K8s在控制平面定价、版本支持速度、自动化程度上差异显著,选错平台意味着每月数千美元的额外成本和运维负担。
2026-08-02
第五阶段 - 云架构深度KubernetesEKSAKSGKEKarpenterGatewayAPI生产运维
日期: 2026-08-02 (Day 125) 阶段: 第五阶段 - 云架构深度 标签: #Kubernetes #EKS #AKS #GKE #Karpenter #GatewayAPI #生产运维
核心概念
一句话定义
托管Kubernetes不是"谁都一样的K8s"——三大云的K8s在控制平面定价、版本支持速度、自动化程度上差异显著,选错平台意味着每月数千美元的额外成本和运维负担。
知识点详解
1. 三大托管K8s深度对比
| 维度 | AWS EKS | Azure AKS | GCP GKE |
|---|---|---|---|
| 控制平面费用 | $0.10/hr (~$73/月) | 免费 | $0.10/hr (~$73/月) |
| 新版本支持速度 | 4-8周 | 3-6周 | 2周内(最快) |
| LTS支持 | 14+12个月 | 24个月 | 30个月(Autopilot) |
| 自动化亮点 | Karpenter原生 | 免费控制平面 | Autopilot(无节点管理) |
| AI集成 | Inferentia/Trainium | — | TPU v5 |
| 集群创建 | 10-15分钟 | 5-10分钟 | 3-5分钟 |
2. Gateway API — 强制迁移(2026最紧迫任务)
- 2025年11月: Ingress NGINX Controller宣布2026年3月31日退役
- 退役后无新版本、无安全补丁
- Gateway API已GA,是生产就绪替代方案
- Ingress2Gateway 1.0支持30+常见annotation迁移
- 优势:模块化、RBAC原生支持、多租户友好
3. Karpenter vs Cluster Autoscaler
| 维度 | Karpenter | Cluster Autoscaler |
|---|---|---|
| 调度 | 事件驱动,每个Pending Pod立即触发 | 时间驱动,10+秒扫描一次 |
| 节点管理 | 直接操作EC2实例 | 通过Auto Scaling Groups |
| 缩容 | 全局评估(20个70%→15个) | 逐节点评估 |
| 多云 | AWS原生,AKS Preview | 所有主流云 |
趋势: Karpenter已成EKS事实标准,AKS也开始原生集成。
4. K8s 1.32-1.35关键特性
K8s 1.32 "Penelope": 39项增强,DRA架构重构 K8s 1.35 "Timbernetes": 60项增强,OCI Image Volume升Beta,OpenTelemetry Profiles进Alpha
面试题
问题:EKS vs GKE,你在什么场景选哪个?
回答:
- EKS:已有AWS投入、需要Karpenter极致弹性、Inferentia/Trainium AI推理
- GKE:运维团队小(Autopilot模式)、数据密集型(BigQuery集成)、需要TPU
- AKS:预算敏感(免费控制平面)、Windows容器、Azure生态