领域特化(LoRA + RAG)
提供将通用 LLM 优化为金融/通信/制造等特定领域以大幅提升编码质量的 3 层策略。
核心问题
"为什么用 Claude 或 GPT 生成的代码不遵循我们公司的标准?" → 因为模型没有学习到你的领域知识。
3 层详解
领域特化按 Steering → RAG → LoRA 顺序渐进式应用。
Layer 1:Steering(立即应用)
定义:通过 spec 文件明确定义编码规则指导 LLM。
优点:立即应用、零成本、维护简单(只需修改 spec 文件)
缺点:复杂领域逻辑有局限、浪费上下文窗口
Layer 2:RAG(1-2 周)
定义:将内部文档嵌入到向量数据库,实时检索相关信息加入 Prompt。
优点:自动反映最新文档(无需重新训练)、内部 API 规范准确度高、不修改模型权重
缺点:需要基础设施(Milvus、Neo4j)、检索质量直接决定输出质量、嵌入成本
Layer 3:LoRA(1-2 个月)
定义:用领域数据调整模型权重本身,生成领域专家水准的输出。
优点:一致的代码风格、领域术语最高准确度、复杂模式学习 缺点:GPU 训练成本($2,000)、需要收集训练数据
Kiro GLM-5 vs 自托管
Kiro IDE 从 2026 年 4 月起原生支持 GLM-5 可立即使用。但 LoRA Fine-tuning、多客户 LoRA 热交换、合规自主控制仅在自托管中可行。 推荐:原型用 Kiro,生产级领域特化用自托管
QLoRA 训练方法、NeMo/Unsloth 框架、检查点管理等详细实现请参阅 自定义模型流水线指南。
按场景所需层级表
| 需求 | Layer 1(Steering) | Layer 2(RAG) | Layer 3(LoRA) | 推荐组合 |
|---|---|---|---|---|
| 编码规范 | 足够 | 过度 | 不需要 | Layer 1 |
| 内部 API 使用 | 不足 | 必须 | 不需要 | Layer 1 + 2 |
| 领域专业术语 | 有限 | 辅助 | 需要 | Layer 2 + 3 |
| SOC2 流程 | Playbook 足够 | 不需要 | 不需要 | Layer 1 |
| 一致代码风格 | 仅基本 | 辅助 | 最有效 | Layer 1 + 3 |
| 遗留迁移模式 | 不可能 | 提供示例 | 核心 | Layer 2 + 3 |
性价比
- 仅 Layer 1:免费,60% 改善
- Layer 1 + 2:基础设施成本,80% 改善
- Layer 1 + 2 + 3:$2,000,95% 改善