AgenticOps 指标 — 运营中需观测的 Agent KPI
阅读时间: 约 5 分钟
AI Agent 部署生产后,仅凭 系统是否正常响应 无法评判质量。必须测量 用户感知质量 (Perceived Quality),比如 "是否准确理解了用户意图?"、"是否调用了正确工具?"、"回答是否充实?"。本文介绍 Agent 运营必备的 KPI 类别 与基于 Langfuse · OTel 的埋点方法。
1. 为什么需要 Agent 专用指标
1.1 传统 APM 的局限
传统 APM (Application Performance Monitoring) 以 HTTP 成功率、响应时间、错误率等 系统指标 为主设计。Agent 则需要额外指标,原因如下:
| 传统 APM | Agent 质量指标 | 差距 |
|---|---|---|
| HTTP 200 OK | 回答是否正确 | 请求成功 ≠ 结果质量 |
| 响应时间 (整体) | Time to First Token | streaming 中用户感知速度不同 |
| 错误率 | Hallucination rate | LLM 错误并非 HTTP 500,而是正常响应 |
| CPU/Memory | Token cost | 云 LLM 按 token 计费 |
| N/A | Tool-call accuracy | 错误工具调用非系统错误 |
1.2 用户感知质量 vs 系统指标
Agent 的实际质量由 是否准确完成用户所需任务 判断,与系统成功指标相互独立。