Agentic AI Platform
Amazon EKS에서 생성형 AI 및 AI/ML 워크로드 구축과 운영에 대한 심화 기술 문서
Amazon EKS에서 생성형 AI 및 AI/ML 워크로드 구축과 운영에 대한 심화 기술 문서
Agentic AI 워크로드 운영 시 직면하는 4가지 핵심 도전과제와 Kubernetes 기반 오픈소스 생태계
EKS Auto Mode, Karpenter, Self-Managed Node Group, Hybrid Node의 GPU 워크로드별 최적 노드 전략
Amazon EKS Hybrid Nodes 도입을 위한 완전한 가이드: 아키텍처, 구성, 네트워킹, DNS, GPU 서버, 비용 분석 및 동적 리소스 할당(DRA)
Amazon EKS와 AWS 서비스를 활용한 Agentic AI 도전과제 해결 가이드
복수 GPU 클러스터 환경에서의 동적 리소스 할당 및 Karpenter 기반 자동 스케일링
vLLM 기반 Llama 4 모델 서빙에서 GPU 인스턴스(p5, p4d, g6e)와 AWS 커스텀 실리콘(Trainium2, Inferentia2)의 성능 및 비용 효율성 비교 벤치마크
llm-d를 활용한 EKS 환경에 서의 Kubernetes 네이티브 분산 추론 배포 및 운영 가이드 — Auto Mode와 Karpenter 배포 전략 비교
Mixture of Experts 모델의 EKS 기반 배포 및 최적화 전략
vLLM을 활용한 Foundation Model 배포, Kubernetes 통합, 성능 최적화 전략