Agentic AI Platform
Agentic AI Platform 是一个支持自主 AI Agent 执行复杂任务的统一平台。将单一大型 LLM 投入企业核心业务时,在成本、响应延迟、信息准确性(幻觉)和治理方面存在明显局限。企业需要转向异构多模型生态系统——复杂推理由 LLM 负责,重复性实务由领域特化 SLM 承担,而高效运营这一生态系统的关键在于基础设施平台化。Kubernetes 正在快速扩展 DRA、Gateway API Inference Extension、Kueue 等 AI 原生功能,本平台基于 K8s 生态实现无需代码变更的多模型切换支持。
本文档系列将引导您理解平台架构、识别构建过程中面临的 5 大核心 挑战,并分别通过 AWS Native 托管方案和 EKS 开放架构两种方式加以解决。两种方案互为补充,建议从 AWS Native 起步,按需扩展至 EKS。
生产推理管道架构
基于 EKS Auto Mode 的生产推理管道完整请求流程。kgateway ExtProc 分析提示词确定 LLM 路由,经过 Bifrost 治理层和 llm-d KV Cache 感知路由,将请求发送到最优模型。
文档结构
推荐学习路径
平台构建路径: 设计与架构 → 模型服务与推理基础设施 → 运营与治理 → Reference Architecture
GenAI 应用开发路径: 模型服务(vLLM)→ 分布式推理(llm-d)→ 网关(Inference Gateway)→ RAG(Milvus)→ Agent(Kagent)→ 评估(Ragas)
相关分类
- AIDLC — AI Development Lifecycle 与 AgenticOps
- Hybrid Infrastructure — 混合环境的 AI 部署
- EKS Best Practices — EKS 运营最佳实践