跳到主要内容

10 篇文档已标记「operations」

查看所有标签

AgenticOps

AIDLC 所构建软件的基于 AI 代理的自主运维 — 可观测性、预测、自动响应

관측성 & 모니터링

Agent 실행 추적·LLM 호출 모니터링·에이전트 수명주기 관측성을 다루는 문서 모음

데이터 인프라

Agentic AI 플랫폼의 벡터 데이터베이스·임베딩 스토어 등 데이터 계층 운영

自主响应

基于 AI Agent 的自主事件响应 — 集成 Strands/Kagent、Chaos Engineering + AI、Ontology 反馈循环

运维与稳定性

EKS 集群稳定运维的 GitOps、故障诊断、高可用性、Pod 生命周期管理最佳实践

运营与治理

AI 平台监控、Observability、评估、合规、领域特化运营指南

预测运维

基于 ML 的预测性伸缩与异常检测 — Karpenter+AI、CloudWatch Anomaly Detection、AI Right-Sizing