多云架构指南

多云 vs 混合云

策略定义优势挑战
多云使用 2 个及以上公有云(AWS + GCP 等)避免厂商锁定,利用最佳服务运维复杂度高,技能要求多
混合云本地数据中心 + 公有云数据主权合规、遗留系统集成网络延迟、统一工具链难度高
多厂商最优不同工作负载使用不同云厂商的最优服务各取所长数据引力、出流费用高
单一云全部押注一家云厂商简单、深度集成、折扣大厂商锁定、风险集中

云中立抽象层

层级工具/标准抽象内容
基础设施Terraform / OpenTofu / Pulumi虚拟机、网络、存储供应
容器Kubernetes(任何云)计算调度、服务发现
服务网格Istio / Linkerd流量管理、mTLS、可观测性
存储MinIO(S3 兼容)对象存储可移植性
CI/CDGitHub Actions、ArgoCD云无关流水线
可观测性OpenTelemetry、Prometheus、Grafana跨云的指标、追踪、日志
密钥HashiCorp Vault集中化密钥管理

工作负载分配模式

# 模式一:各取所长 # - AI/ML 工作负载 → GCP(Vertex AI、TPU) # - .NET / Azure AD 已有投入 → Azure # - 核心基础设施 → AWS(生态最成熟) # 模式二:主动-主动灾备 # - 相同工作负载同时运行在 AWS + GCP # - Cloudflare 全球负载均衡分发流量 # - 数据跨云复制(出流费用较高!) # 模式三:数据合规/属地要求 # - 欧盟用户数据 → Azure 欧洲区(GDPR) # - 中国市场 → 阿里云/腾讯云 # Kubernetes 多集群 # kubectl ctx cluster-aws → 部署到 AWS EKS # kubectl ctx cluster-gcp → 部署到 GCP GKE # 使用 Flux 多集群或 Argo ApplicationSet 自动化