跳到主要内容

AI 平台选择指南

📅 撰写日期:2026-04-15 | ⏱️ 阅读时间:约 15 分钟

고객이 AI를 직접 개발하려 할 때 가장 먼저 직면하는 질문은 "매니지드 서비스를 쓸 것인가, 오픈소스로 직접 구축할 것인가?"입니다. 이 문서는 SageMaker Unified Studio, Bedrock AgentCore, EKS 기반 오픈 아키텍처 중 고객 상황에 맞는 최적 접근을 선택할 수 있도록 의사결정 프레임워크를 제공합니다.

AI 平台构建路径大致分为 3 种:

  • (A) AWS 托管:通过 Bedrock + Strands SDK + AgentCore 无需基础设施运营即可开始
  • (B) EKS + 开源:通过 vLLM、llm-d、Langfuse 等自托管获得最大控制权
  • (C) 混合:结合 Bedrock 和 EKS 实现成本·控制·速度的平衡
前置文档

阅读本文档前请先参考以下文档:


AWS AI 平台服务全景

AWS AI 服务分为 4 个 Tier 层次。客户从下层 Tier 开始,根据需要向上层 Tier 迁移。

Tier 划分的核心

  • Tier 1-3:通过 AWS 托管服务无需基础设施运营即可开始。
  • Tier 4:需要精细控制、成本优化、数据主权时选择。
  • 大多数客户从 Tier 1 开始逐步扩展,企业倾向于将 Tier 3 和 Tier 4 混合组合。

SageMaker Unified Studio

统一 AI 开发环境

SageMaker Unified Studio 是 2024 年下半年发布的统一 AI 开发环境,旨在让 ML/数据/分析工作在一个 IDE 中完成。以前需要分别使用 SageMaker Studio Classic、Athena、Glue Studio 等分散的工具,但 Unified Studio 将它们统一为一体。

核心差异点

功能说明相比现有的改进
统一 IDEJupyterLab + SQL 编辑器 + 无代码界面相比 SageMaker Studio Classic 集成数据+ML
Built-in MLflow实验跟踪、模型注册表、模型比较无需单独运营 MLflow 服务器
Lakehouse 集成Apache Iceberg 表、Glue Catalog 原生联动数据工程 → ML 流水线一站式
治理协作基于 Amazon DataZone 的 IAM 共享、数据血缘跟踪团队间安全的数据/模型共享
统一计算在单一环境中管理训练、笔记本、流水线防止资源碎片化

定位:何时选择??

核心信息

SageMaker Unified Studio 是开发环境(Tier 2)。与 Bedrock(推理)或 EKS(服务)是互补关系,特别是当数据团队和 ML 团队需要在一个平台上协作时提供最大价值。


平台比较矩阵

根据客户情况,最佳方法有所不同。用 5 个核心评估轴比较各平台选项。

AI平台5轴比较矩阵
评估轴Bedrock + AgentCoreSageMaker Unified StudioEKS+开源混合
成本结构按使用付费,无需GPU管理实例+使用混合,笔记本/训练分开Spot/MIG优化,需初期投资Bedrock+自托管SLM混合,Cascade节省66%
运营负担最小 — AWS完全托管低 — 基础设施管理最小,专注ML工作流中等 — 需要K8s/GPU运营能力(Auto Mode降低)中等 — 需了解两种环境
数据主权AWS区域内处理VPC隔离,训练数据保留在S3完全控制 — VPC内模型+数据隔离按工作负载选择性隔离
定制化受限 — Bedrock支持的模型,Guardrails范围内MLflow,自定义管道,Fine-tuning支持完全灵活 — 所有开源模型,LoRA,自定义网关按需选择性扩展
价值实现时间2-4周 — 仅API调用即可开始4-8周 — 环境配置+管道设置2-4个月 — 集群+GPU+模型服务构建1-3个月 — Bedrock开始+EKS渐进扩展
成本详细分析

自托管和 Bedrock 的详细成本比较(盈亏平衡点、Cascade Routing 节省效果)请参考编码工具成本分析


决策流程图

可在客户会议中使用的决策流程。通过回答核心问题找到最佳方法。

流程图是起点

此流程图是对话的起点,不是最终结论。实际客户情况复杂,大多数企业会收敛到混合方法


按客户成熟度推荐路径

根据客户当前的 AI/ML 成熟度,起点和扩展路径有所不同。

AI平台成熟度路径
成熟度特征推荐堆栈核心服务时间
Level 1 — AI探索者无AI/ML工作负载,需快速PoCAWS托管优先Bedrock API + Strands SDK + AgentCore2-4周
Level 2 — AI构建者部分运营ML,需训练管道SageMaker + Bedrock混合SageMaker Unified Studio + Bedrock + S3/Glue1-3个月
Level 3 — AI优化者大规模推理,成本压力,自定义模型EKS开放架构 + Cascade路由EKS + vLLM/llm-d + kgateway + Bifrost + Langfuse3-6个月

各级别详细指南


混合组合模式

大多数企业不是单一方法,而是收敛到混合方式。以下是经过验证的 4 种组合模式。

混合模式摘要
模式配置适用场景复杂度
Bedrock + EKS SLMBedrock(推理) + EKS自托管SLM(高频)大规模推理急需降低API成本★★☆☆☆
SageMaker训练 + EKS服务SageMaker(训练/实验) + EKS+vLLM(服务)ML团队与服务团队分离的组织★★★☆☆
AgentCore + 自托管模型AgentCore(Agent运行时) + EKS(自定义模型推理)Agent运营由AWS,模型自托管★★★☆☆
Full StackUnified Studio(开发) + Bedrock(外部) + EKS(自托管) + AgentCore(运营)企业AI CoE,全AI生命周期管理★★★★☆

模式 1:Bedrock + EKS SLM(Cascade Routing)

使用时机:月推理量超过 50 万次,且请求的 60-70% 是简单任务(代码完成、翻译、摘要)时

核心价值:保持 Bedrock API 质量的同时降低 40-60% 成本

参考推理网关 & Cascade Routing


模式 2:SageMaker 训练 + EKS 服务

使用时机:训练自定义模型并希望最小化推理成本时

核心价值:SageMaker 的托管训练环境 + EKS 的成本高效服务

参考SageMaker-EKS 集成


模式 3:AgentCore + 自有模型

使用时机:Agent 运行时以无服务器方式运营,但特定领域模型自托管时

核心价值:AgentCore 的无服务器运营性 + 自定义模型的领域准确度

参考AWS Native 平台


模式 4:Full Stack(SageMaker + Bedrock + EKS)

最复杂但提供最大灵活性的模式:

  • 数据 & 训练:SageMaker Unified Studio + Pipelines
  • 生产推理:Bedrock API(高可靠任务)+ EKS vLLM(高容量任务)
  • Agent 运行时:AgentCore(无服务器)+ Kagent(Kubernetes 原生)
  • Observability:CloudWatch(托管)+ Langfuse(自托管)

该模式在大型企业中为满足各团队不同需求而选择。架构复杂度高,因此明确的运营责任边界和服务目录是必需的。

参考:混合架构的技术实现请参考 SageMaker-EKS 集成


成本模拟总结

根据月推理量的最佳选项和预期成本。

月推理量最佳选项预期月成本备注
~10 万次Bedrock API~$300-500无需 GPU 管理,最快启动
~50 万次Bedrock + Cascade~$800-1,200开始用 SLM 分离简单请求
~150 万次混合转换点~$2,500-3,500接近自托管盈亏平衡
~500 万次+EKS 自托管~$3,500-5,000用 Spot + Cascade 节省 60%+
详细成本分析

关于具体实例成本、Spot 节省率、Cascade Routing 效果的详细分析请参考编码工具成本分析


客户 Discovery 检查清单

在客户会议中为确定最佳方法的 10 个核心问题。

  1. 当前是否运营 AI/ML 工作负载? → 判断成熟度级别
  2. 月推理请求规模有多大? → 成本优化路径
  3. 需要 Open Weight 模型自托管吗? → EKS 必要性
  4. 有数据主权或 VPC 隔离要求吗? → 自托管/混合
  5. 团队有 Kubernetes 运营经验吗? → 评估运营负担
  6. 是否同时进行 ML 训练和数据工程? → SageMaker Unified Studio
  7. 月预算范围有多大? → 匹配成本结构
  8. 生产部署目标时间是何时? → Time-to-Value 路径
  9. 有多云或本地混合需求吗? → EKS Hybrid Nodes
  10. 当前使用哪些 AWS 服务? → 利用现有投资

相关文档

设计 & 架构

Reference Architecture