编码工具对接与成本分析
1. 概述
在企业环境中使用 AI 编码工具需要考虑 IDE 对接、成本优化、数据主权 三个方面。本文档提供 Aider、Cline、Continue.dev 等主要编码工具连接自托管 LLM 的方法,以及 Bedrock vs Kiro vs 自托管的成本分析。
为什么需要自托管对接?
| 限制 | SaaS(Kiro、Copilot) | 自托管 |
|---|---|---|
| 数据主权 | 代码传输到外部 | VPC 内完全隔离 |
| 定制化 | 仅使用提供的模 型 | LoRA Fine-tuning |
| 成本控制 | Token 单价固定 | Cascade 节省 66% |
| 可观测性 | 有限 | Langfuse 完全控制 |
在 kgateway 后部署 LLM Classifier,客户端只使用单一端点(/v1),根据 Prompt 内容自动选择 SLM(Qwen3-4B)/ LLM(GLM-5)。通过 Langfuse 追踪所有请求,无需手动选择模型即可通过 Cascade Routing 节省 66% 成本。
2. IDE/编码工具连接
2.1 LLM Classifier 自动分流(推荐)
使用 LLM Classifier 时所有客户端通过单一端点连接,根据 Prompt 内容自动选择 SLM/LLM。无需手动选择模型。
| 工具 | LLM Classifier 兼容 | 设置方法 |
|---|---|---|
| Aider | 是 | OPENAI_API_BASE=http://<NLB>/v1 aider --model openai/auto |
| Cline | 是 | Model: auto, Base URL: http://<NLB>/v1 |
| Continue.dev | 是 | model: auto, apiBase: http://<NLB>/v1 |
| Cursor | 是 | 模型名无需 / — 使用 auto |
Bifrost 需要的 provider/model 格式(openai/glm-5)和 Aider double-prefix 技巧(openai/openai/glm-5)完全不需要。Cursor 也可以无 / 限制使用。
2.2 Aider 连接示例
Aider 是支持 Git-aware 代码修改 + 自动提交的开源 CLI 工具。
# 安装 Aider
pip install aider-chat
# LLM Classifier 自动分流 — 单一端点,自动选择模型
OPENAI_API_BASE="http://<NLB_ENDPOINT>/v1" \
OPENAI_API_KEY="dummy" \
aider --model openai/auto
用 model: "auto" 请求时 LLM Classifier 分析 Prompt 内容自动选择 SLM(Qwen3-4B)或 LLM(GLM-5 744B)。简单代码补全用 Qwen3-4B($0.3/hr),重构/架构分析用 GLM-5($12/hr)路由。
2.3 Continue.dev 设置示例
Continue.dev 是 VSCode/JetBrains 用 AI 编码助手。
{
"models": [
{
"title": "Auto (LLM Classifier)",
"provider": "openai",
"model": "auto",
"apiBase": "http://<NLB_ENDPOINT>/v1",
"apiKey": "dummy"
}
]
}
2.4 Cline 设置示例
Cline 是 VSCode 用 AI 编码工具。
Settings -> API Provider -> OpenAI Compatible
- Base URL:
http://<NLB_ENDPOINT>/v1 - Model:
auto - API Key:
dummy
3. 路由架构对比
3.1 LLM Classifier vs Bifrost
| 项目 | LLM Classifier(推荐) | Bifrost |
|---|---|---|
| 适用环境 | 自托管 vLLM cascade | 外部 Provider 集成(OpenAI/Anthropic) |
| 模型名格式 | auto(任意值可) | provider/model 强制 |
| Prompt 分析 | 直接访问 body | CEL 仅访问 headers |
| 多后端 | WEAK/STRONG URL 分离 | 每 provider 单一 base_url |
| Aider 兼容 | 无需技巧 | 需要 double-prefix |
| Cursor 兼容 | 是 | 不可(斜杠不允许) |
| 镜像大小 | ~50MB | ~100MB |
Bifrost 针对外部 LLM Provider(OpenAI、Anthropic、Bedrock)集成、failover、rate limiting 优化。自托管 vLLM 间的智能 cascade 请使用 LLM Classifier。两者也可以一起用(外部用 Bifrost、自托管用 LLM Classifier)。