成本效益框架

阅读时间: 约 18 分钟

AIDLC 引入不仅是技术转型,更是 成本结构的再设计。但由于缺乏真实数据,RFP 估算、ROI 论证、预算获取仍然困难。本文提供用于量化 AIDLC 成本效益并落入项目提案书的实务框架。

1. RFP 成本估算的两难

1.1 固定价竞标市场的现实

韩国 SI 市场以固定价竞标为主。发包方提交详细 RFP,投标方以固定金额投标。合同签订后费用超支风险完全由投标方承担。

传统估算公式:

总成本 = Σ(各角色 MM × 月单价 × 周期)
         + 基础设施成本
         + 风险缓冲 (10-20%)

引入 AIDLC 时出现的问题:

如何量化 AI 生产力?
- 仅凭 "AI 会生成代码" 无法为 MM 节省提供依据
- 发包方期望 "AI = 自动成本节省",但由于缺乏数据,投标方偏保守估算
产生额外费用项:
- Ontology 设计: 前期 2-4 周
- Harness 工程: 持续投入
- AI 工具授权: Claude Team ($30/user/month)、LiteLLM Pro 等
- 培训: 开发者 AIDLC 转型培训 1-2 周
风险增加:
- AI 输出质量波动
- 遗留环境下 Harness 集成复杂度
- 组织转型阻力

结果许多投标方 无法将 AIDLC 的成本节约效益写进提案书,又回到传统估算方式。

1.2 成本节约 vs 质量提升的权衡

AIDLC 提供两种价值:

成本节约: 以更少工时完成同等范围
质量提升: 以同等工时达到更高质量 / 范围

固定价竞标下,成本节约转化为投标方的利润增加,但发包方更偏好质量提升。提案书需清晰呈现这一平衡。

示例: 50 亿韩元项目

场景	做法	报价	实际工时	投标方毛利	发包方价值
传统方式	未引入 AIDLC	50 亿	50 亿	10 亿 (20%)	满足基础需求
强调成本节约	引入 AIDLC	40 亿 (-20%)	32 亿	8 亿 (20%)	满足基础需求
强调质量提升	引入 AIDLC	50 亿	35 亿	15 亿 (30%)	高质量 + 追加功能
平衡	引入 AIDLC	45 亿 (-10%)	33 亿	12 亿 (27%)	基础 + 部分高质量

多数情况下 平衡场景最现实。发包方既感到成本下降,又能获得质量提升。

2. AIDLC 成本模型框架

2.1 分阶段成本节约结构

AIDLC 在 RUP 4 阶段各显示差异化效果:

Inception (启动) 阶段

传统方式:

需求分析: 4 周
领域建模: 2 周
架构设计: 3 周
合计 9 周

AIDLC 方式:

需求 AI 分析: 1 周 (AI 自动把 Intent → Unit 拆分)
Ontology 工程: 2 周 (把领域模型显式化为 Ontology)
架构设计: 2 周 (AI 建议参考架构)
合计 5 周 (-44%)

节省机制:

AI 自动检测需求歧义并生成澄清问题
Ontology 将领域知识结构化,可重复复用
AI 立即建议参考架构模式

Elaboration (细化) 阶段

传统方式在原型开发与架构验证上花费大量时间。AIDLC 由 AI 快速生成原型,并基于 Ontology 自动校验领域正确性。

节省: 约 30-40%

Construction (构建) 阶段

是项目成本集中的阶段 (60-70%)。AIDLC 核心价值所在。

传统方式:

开发者从规约 → 编码 → 单元测试 → 评审 → 修正
反馈周期: 按日
代码生成速度: 100 LOC/日

AIDLC 方式:

AI 基于 Ontology 自动生成代码
Harness 做运行时校验与即时反馈
反馈周期: 按分钟
代码生成速度: 500 LOC/日 (+400%)

节省: 约 40-60%

注意事项:

与遗留环境集成时 Harness 开销增加
复杂业务逻辑下 AI 生成代码质量会波动
评审工时减少,但增加了校验 Ontology 正确性的工时

Transition (过渡 / 运维) 阶段

传统方式:

手工部署清单
手工告警监控
故障时手工诊断与恢复

AIDLC 方式:

GitOps 自动部署 (Argo CD)
AI Agent 自主故障响应
MTTR 减少 73% (45 分 → 12 分)

节省: 约 50-70% (运维人力优化)

2.2 成本增加因素

AIDLC 并非只带来成本节约,以下因素会增加成本:

初期投资

项	规模	成本
Ontology 设计	2-4 周 (架构师 1 名 + 领域专家 0.5 名)	5,000 万~1 亿韩元
Harness 工程初期配置	1-2 周 (DevOps 2 名)	2,000 万~4,000 万韩元
AIDLC 培训	开发者 10 名 × 1 周	3,000 万韩元
AI 工具授权 (首 3 个月)	Claude Team 10 名 × $30 × 3 个月	1,000 万韩元
合计		1.1 亿~1.8 亿韩元

在中型项目 (20 亿韩元) 中初期投资占 5.5~9%。这笔费用集中在首个 Bolt 周期 (2-4 周),其后节约效果持续累积。

持续成本

AI 工具授权: 月 300 万韩元 (开发者 10 名)
Ontology 维护: 周 4 小时 (架构师 0.1 MM)
Harness 运维: 周 8 小时 (DevOps 0.2 MM)

按 6 个月项目计算持续成本约 7,000 万~1 亿韩元。

盈亏平衡点

初期投资 + 持续成本被节约效果冲抵的时点:

小型项目 (<10 亿): 2-3 个月后
中型项目 (10-50 亿): 1-2 个月后
大型项目 (50 亿+): 1 个月后

项目规模越大盈亏平衡越快。因为 AIDLC 在 大规模重复性工作中效果更显著。

3. 按项目规模的预期效果

3.1 小型项目 (< 10 亿韩元)

项	传统成本	AIDLC 成本	节省率
总 MM	50 MM	40 MM	20%
总成本	8 亿韩元	6.5 亿韩元	18.75%
初期投资	0	1.2 亿韩元	+1.2 亿
净节省	-	0.3 亿韩元	3.75%

特点:

初期投资占比高,节约效果有限
Inception 阶段压缩效果最明显 (需求分析时间缩短)
Harness 配置开销相对偏高

建议:

Ontology 以轻量方式设计 (聚焦核心实体)
Harness 仅实现必要校验
复用既有参考架构

3.2 中型项目 (10-50 亿韩元)

项	传统成本	AIDLC 成本	节省率
总 MM	250 MM	175 MM	30%
总成本	40 亿韩元	28 亿韩元	30%
初期投资	0	1.5 亿韩元	+1.5 亿
净节省	-	10.5 亿韩元	26.25%

特点:

Construction 阶段加速效果正式显现
Ontology 复用效果累积
Harness 投入产出比明确

建议:

系统性设计 Ontology (覆盖全域)
分阶段扩展 Harness (核心 → 整体)
积极引入 AI 评审自动化

3.3 大型项目 (50 亿韩元以上)

项	传统成本	AIDLC 成本	节省率
总 MM	600 MM	400 MM	33.3%
总成本	100 亿韩元	65 亿韩元	35%
初期投资	0	2 亿韩元	+2 亿
持续成本	0	1.5 亿韩元	+1.5 亿
净节省	-	31.5 亿韩元	31.5%

特点:

Operations 自治效果累积 (长期运维成本下降)
多团队并行开发时 Ontology 一致性效果最大化
MSA 环境下服务间 Harness 集成效果

建议:

将 Ontology 扩展到企业级
将 Harness 与服务网格集成
积极引入 AI Agent 自主运维

3.4 复合项目群 (100 亿韩元以上)

在多个项目打包的复合项目群中,复用 Ontology 与 Harness 平台化 带来额外效果。

示例: 银行下一代系统 (300 亿韩元、3 年)

阶段	传统成本	AIDLC 成本	节省率
Phase 1 (核心账户)	100 亿	68 亿 (-32%)	32%
Phase 2 (贷款)	100 亿	60 亿 (-40%)	40%
Phase 3 (存款)	100 亿	55 亿 (-45%)	45%
合计	300 亿	183 亿	39%

Phase 推进时节省率递增的原因:

Ontology 累积后复用率增加
Harness 平台化后配置时间缩短
团队 AIDLC 熟练度提升

4. Ontology ROI

Ontology 是 AIDLC 的核心投资项目。定量分析初期投资对比长期效果。

4.1 初期投资

活动	工时	成本 (月 1,000 万韩元基准)
领域分析	1 周 (架构师 1 名)	250 万韩元
实体 / 关系建模	1 周 (架构师 1 名)	250 万韩元
校验规则定义	1 周 (架构师 0.5 名 + 领域专家 0.5 名)	250 万韩元
Ontology 文档化	1 周 (技术写作 1 名)	200 万韩元
合计	4 周	950 万韩元

在中型项目 (20 亿韩元) 中对应 4.75% 的初期投资。

4.2 长期效果

麦肯锡《The economic potential of generative AI》(2023) 指出,领域特化 AI 的准确率达到 87% vs 通用 AI 的 62%。Ontology 是把 AI 转化为领域特化的机制。

错误率下降

Hamel & Patil (2024)《The Strawberry Manifesto》实验数据:

条件	错误率 (31 天后)	总成本	改进度
无反馈循环 (Baseline)	8.3%	$25K	-
有反馈循环 (仅 AI)	7.9%	$28K	改善 5%
反馈循环 + Ontology	1.2%	$30K	改善 85.5%

有 Ontology 时 AI 会在领域上下文中自我修正,错误率 下降 7 倍。

项目换算:

中型项目缺陷修复成本: 平均 3 亿韩元 (总成本的 7.5%)
Ontology 使错误率下降 85% 时: 节省 2.55 亿韩元
相对 Ontology 初期投资 950 万韩元: ROI 2,584%

评审工时节省

当 AI 基于 Ontology 生成领域正确的代码时,评审者可聚焦于业务逻辑校验。

评审项	无 Ontology	有 Ontology	节省率
领域正确性校验	30 分钟	5 分钟	83%
编码规范校验	15 分钟	3 分钟	80%
安全 / 性能校验	20 分钟	15 分钟	25%
业务逻辑校验	30 分钟	30 分钟	0%
合计	95 分钟	53 分钟	44%

若中型项目 PR 数量为 500:

传统评审时长: 500 × 95 分钟 = 791 小时 = 4.4 MM
AIDLC 评审时长: 500 × 53 分钟 = 442 小时 = 2.5 MM
节省: 1.9 MM (约 3,000 万韩元)

4.3 Ontology 维护成本

Ontology 不是静态的,需随需求变化持续更新。

活动	频率	每次工时	月工时
新增实体	周 1 次	2 小时	8 小时
关系调整	双周 1 次	1 小时	2 小时
新增校验规则	双周 1 次	1 小时	2 小时
合计			12 小时 / 月 (0.3 MM)

6 个月项目维护成本: 1.8 MM (约 3,000 万韩元)

净 ROI 计算:

初期投资: 950 万韩元
维护 (6 个月): 3,000 万韩元
总投资: 3,950 万韩元
效益 (错误减少 + 评审节省): 2.55 亿 + 3,000 万 = 2.85 亿韩元
净 ROI: 621%

5. Harness ROI

Harness 自动化 AI 与运行环境之间的反馈循环。缺少 Harness 时,运行时错误会累积最终拖垮项目。

5.1 Harness 缺失成本: Fintech Runaway 案例

Hamel & Patil (2024)《The Strawberry Manifesto》里介绍的实际案例:

场景: AI Agent 开发 Fintech App 的邮件提醒功能

无 Harness 开发时:

AI 生成代码 → 手工测试 → 部署
运行时错误 → AI 查看错误日志 → 修复 → 重新部署
反馈周期慢,AI 反复犯同样的错

结果:

API 调用 847 次 (正常情况的 7 倍)
LLM 费用: $2,200 (正常 $300)
生成邮件: 14 封 (均不完整)
项目失败

引入 Harness 后:

Harness 即时向 AI 反馈运行时错误
API 调用 123 次
LLM 费用: $320
生成邮件: 50 封 (均正常)
项目成功

成本节省: $1,880 (85%)

5.2 Harness 引入效果

指标	无 Harness	有 Harness	改善率
运行时故障率	每周 15 件	每周 3 件	↓ 80%
事件 MTTR	4 小时	45 分钟	↓ 81%
回滚比例	12%	2%	↓ 83%
紧急补丁频率	每月 8 次	每月 1 次	↓ 87%

项目换算:

中型项目运行时故障响应成本: 平均 2 亿韩元 (总成本 5%)
Harness 使故障下降 80%: 节省 1.6 亿韩元

5.3 Harness 投资成本

项	工时	成本
初期配置 (CI/CD 集成)	1 周 (DevOps 2 名)	2,000 万韩元
实现运行时校验逻辑	1 周 (DevOps 1 名 + 开发者 1 名)	2,000 万韩元
持续运维 (6 个月)	周 8 小时	6,000 万韩元
合计		1 亿韩元

净 ROI: (1.6 亿 - 1 亿) / 1 亿 = 60%

6. Open-Weight 模型 TCO 对比

AIDLC 同时支持 Claude/GPT 这类云 API 与 GLM/Qwen 这类 Open-Weight 模型。选择不同 TCO 差异显著。

6.1 云 API 成本

模型	输入 token 价格	输出 token 价格	上下文大小
Claude Sonnet 4.0	$3/MTok	$15/MTok	200K
GPT-4.1	$5/MTok	$15/MTok	128K
GPT-3.5 Turbo	$0.5/MTok	$1.5/MTok	16K

中型项目用量估算 (6 个月、开发者 10 名):

月请求数: 10 名 × 100 次 / 天 × 20 天 = 20,000 次
平均输入 token: 2,000 (上下文 + 提示)
平均输出 token: 1,000 (代码生成)
月 token: (20,000 × 2,000) + (20,000 × 1,000) = 60 MTok

月费用:

Claude Sonnet 4.0: (40 MTok × $3) + (20 MTok × $15) = $420 (约 55 万韩元)
GPT-4.1: (40 MTok × $5) + (20 MTok × $15) = $500 (约 65 万韩元)
6 个月合计: $2,520~$3,000 (约 330 万~390 万韩元)

优点:

无初期成本
无需管理基础设施
即刻可用最新模型

缺点:

用量增加时费用暴涨
数据外传 (机密项目不适用)
网络时延 (400-800ms)

6.2 自托管成本

基础设施: EKS + GPU 节点 (基于 vLLM)

组件	规格	月费用
GPU 实例	p5.48xlarge (H200×8) Spot	$20,000 (约 2,600 万韩元)
存储	1TB EBS gp3	$100 (约 13 万韩元)
网络	数据传输	$200 (约 26 万韩元)
运维人力	MLOps 工程师 0.5 名	$5,000 (约 650 万韩元)
合计		$25,300 (约 3,300 万韩元 / 月)

6 个月总费用: $151,800 (约 2 亿韩元)

盈亏平衡点计算:

云 API 费用超过自托管的临界点:

月请求数 = $25,300 / (每次请求平均费用)

Claude Sonnet 4.0: $0.09/请求
→ 281,111 请求 / 月 (约对应 140 名开发者)

GPT-3.5 Turbo: $0.006/请求
→ 4,216,667 请求 / 月 (约对应 2,100 名开发者)

结论:

小型项目 (开发者 10 名): 云 API 更有利
中型项目 (开发者 50 名): 视情况而定
大型项目 (开发者 100 名+): 自托管更有利
机密项目: 必须自托管

6.3 混合策略

实际上云 API + 自托管混合最优:

任务类型	模型选择	理由
复杂架构设计	Claude Sonnet 4.0 (云)	需要高质量推理
重复代码生成	GLM-5/Qwen (自托管)	大量请求、低延迟
代码评审	GPT-4.1 (云)	需要深度分析
单元测试生成	GLM-4 (自托管)	大量生成

成本优化效果:

云 API 使用量减少 60%
自托管效率提升 40%
总成本 减少 30-40%

7. 生产力指标

用于衡量 AIDLC 导入效果的核心指标。

7.1 AIDLC 生产力指标

📈 AIDLC 生产力指标

AI 采用前后对比

生产力

指标

采用前

采用后

改进率

代码生成速度

100 LOC/天

500 LOC/天

+400%

PR 审查时间

4小时

30分钟

-87%

部署频率

每周1次

每天5次

+5x

质量

指标

采用前

采用后

改进率

缺陷密度

15个/1K LOC

3个/1K LOC

-80%

测试覆盖率

45%

85%

+89%

安全漏洞

人工扫描

AI 实时扫描

自动化

运维

指标

采用前

采用后

改进率

MTTR

4小时

45分钟

-81%

变更失败率

15%

-80%

SLO 达成率

95%

99.5%

+4.7%

7.2 详细指标与 DORA 映射

📊 指标

衡量 AIDLC 采用效果

关键指标

指标

说明

AIDLC 之前

AIDLC 之后

改进率

代码生成速度

每个功能的代码编写时间

8小时

2小时

75% ↓

PR 审查时间

PR 提交到批准的时间

24小时

4小时

83% ↓

部署频率

每周生产部署次数

2次

10次

5x ↑

MTTR

平均恢复时间

45分钟

12分钟

73% ↓

Change Failure Rate

部署失败率

15%

80% ↓

测试覆盖率

代码测试覆盖范围

45%

85%

89% ↑

安全漏洞

每季度生产安全问题

8个

1个

87% ↓

DORA 指标映射

DORA 指标

AIDLC 贡献

改进方法

🚀

部署频率

Managed Argo CD + AI 自动批准

移除人工关卡

⚡

变更前置时间

Kiro Spec → 自动代码生成

加速开发阶段

🛡️

变更失败率

AI Quality Gates

部署前多层验证

🔧

服务恢复时间

AI 智能体自动响应

移除人工诊断

7.3 指标采集方法

研发生产力

数据源:

GitHub/GitLab 指标: Commit 数、PR 评审时长、部署频率
JIRA/Linear: Ticket 处理速度、Backlog Burn-down
AI 工具日志: LLM 调用次数、生成代码 LOC、采纳率

采集周期: 每周 (与 Bolt 周期对齐)

运维稳定性

数据源:

AMP/AMG: MTTR、错误率、SLO 达成率
Argo CD: 部署成功率、回滚频率
PagerDuty: 事件数、升级率

采集周期: 每日 (实时看板)

成本效率

数据源:

AWS Cost Explorer: 基础设施费用
LLM 厂商控制台: API 费用
工时表: 实际投入工时

采集周期: 每月

7.4 基准数据

依据麦肯锡《The economic potential of generative AI》(2023):

行业	生产力提升	ROI 周期	备注
软件开发	35-45%	3-6 个月	以代码生成为主
金融服务	20-30%	6-12 个月	合规负担较大
制造	15-25%	12-18 个月	遗留系统集成

将韩国 SI 市场以与金融服务类似的 20-30% 区间 作为现实目标。

8. RFP 提案书撰写指南

8.1 成本节约明示策略

错误做法:

"引入 AI 以提升开发生产力。"

该表述模糊且不可度量。发包方需要具体数字。

正确做法:

"通过应用 AIDLC 方法论按如下方式优化成本:

Inception 阶段缩短 44%: 需求 AI 分析从 9 周压缩到 5 周

Construction 阶段加速 40%: 基于 Ontology 的代码自动生成使开发者生产力提升 400%

Operations 成本节省 50%: AI Agent 自主故障响应使 MTTR 下降 73%

总报价: 45 亿韩元 (较传统方式节省 10%)

注: 报价中含 AIDLC 初期投资 1.5 亿韩元,该投资在整个项目中产生 2.85 亿韩元的错误减少效益 (净 ROI 90%)。"

8.2 风险缓解策略

AIDLC 引入带来新的风险。提案书需写明缓解策略。

风险	缓解策略	责任
AI 生成代码质量波动	基于 Ontology 的自动校验 + 两阶段评审	投标方
Harness 集成复杂度	对遗留环境做事前分析 + 分阶段落地	投标方
组织转型阻力	4 周培训项目 + 试点项目	发包方 + 投标方
数据泄露顾虑	自托管 LLM + 网络隔离	投标方

8.3 分阶段落地路线图

一次性在所有阶段推行 AIDLC 风险高。提案分阶段方案。

Phase 1: Pilot (首个 Bolt、2-4 周)

目标: 验证 AIDLC 可行性
范围: 1 个核心模块
Ontology: 轻量设计
Harness: 仅基础校验
预期效果: 生产力提升 15-20%

Phase 2: Scale-up (2-3 个月)

目标: 扩大到全团队
范围: 5 个主要模块
Ontology: 覆盖整个领域
Harness: 集成测试自动化
预期效果: 生产力提升 25-35%

Phase 3: Optimization (项目后期)

目标: ROI 最大化
范围: 全系统
Ontology: 持续改进
Harness: AI Agent 自主运维
预期效果: 生产力提升 30-40%

8.4 提案书清单

9. 下一步

若已理解成本效益框架,请继续阅读:

落地策略: 渐进式引入 AIDLC 的策略
角色再定义: PM、架构师、开发者的角色如何变化
治理框架: 全公司管理 AI 生成代码质量的方法

同时参考方法论指南为实施做准备:

Ontology 工程: 领域知识结构化的实战指南
Harness 工程: 自动化运行时反馈循环的方法
Open-Weight 模型: 自托管 LLM 部署指南

参考资料

McKinsey Global Institute. "The economic potential of generative AI: The next productivity frontier." 2023.
Hamel, Jeremy & Patil, DJ. "The Strawberry Manifesto: How to Build AI Products That Work in the Real World." 2024.
Forsgren, Nicole et al. "Accelerate: The Science of Lean Software and DevOps." 2018. (DORA 指标原典)
AWS. "Building Generative AI applications using Amazon Bedrock." 2024.
DeepLearning.AI. "Building and Evaluating Advanced RAG Applications." Andrew Ng. 2024.

1. RFP 成本估算的两难​

1.1 固定价竞标市场的现实​

1.2 成本节约 vs 质量提升的权衡​

2. AIDLC 成本模型框架​

2.1 分阶段成本节约结构​

Inception (启动) 阶段​

Elaboration (细化) 阶段​

Construction (构建) 阶段​

Transition (过渡 / 运维) 阶段​

2.2 成本增加因素​

初期投资​

持续成本​

盈亏平衡点​

3. 按项目规模的预期效果​

3.1 小型项目 (< 10 亿韩元)​

3.2 中型项目 (10-50 亿韩元)​

3.3 大型项目 (50 亿韩元以上)​

3.4 复合项目群 (100 亿韩元以上)​

4. Ontology ROI​

4.1 初期投资​

4.2 长期效果​

错误率下降​

评审工时节省​

4.3 Ontology 维护成本​

5. Harness ROI​

5.1 Harness 缺失成本: Fintech Runaway 案例​

5.2 Harness 引入效果​

5.3 Harness 投资成本​

6. Open-Weight 模型 TCO 对比​

6.1 云 API 成本​

6.2 自托管成本​

6.3 混合策略​

7. 生产力指标​

7.1 AIDLC 生产力指标​

📈 AIDLC 生产力指标

7.2 详细指标与 DORA 映射​

📊 指标

关键指标

DORA 指标映射

7.3 指标采集方法​

研发生产力​

运维稳定性​

成本效率​

7.4 基准数据​

8. RFP 提案书撰写指南​

8.1 成本节约明示策略​

8.2 风险缓解策略​

8.3 分阶段落地路线图​

8.4 提案书清单​

9. 下一步​

参考资料​

1. RFP 成本估算的两难

1.1 固定价竞标市场的现实

1.2 成本节约 vs 质量提升的权衡

2. AIDLC 成本模型框架

2.1 分阶段成本节约结构

Inception (启动) 阶段

Elaboration (细化) 阶段

Construction (构建) 阶段

Transition (过渡 / 运维) 阶段

2.2 成本增加因素

初期投资

持续成本

盈亏平衡点

3. 按项目规模的预期效果

3.1 小型项目 (< 10 亿韩元)

3.2 中型项目 (10-50 亿韩元)

3.3 大型项目 (50 亿韩元以上)

3.4 复合项目群 (100 亿韩元以上)

4. Ontology ROI

4.1 初期投资

4.2 长期效果

错误率下降

评审工时节省

4.3 Ontology 维护成本

5. Harness ROI

5.1 Harness 缺失成本: Fintech Runaway 案例

5.2 Harness 引入效果

5.3 Harness 投资成本

6. Open-Weight 模型 TCO 对比

6.1 云 API 成本

6.2 自托管成本

6.3 混合策略

7. 生产力指标

7.1 AIDLC 生产力指标

7.2 详细指标与 DORA 映射

7.3 指标采集方法

研发生产力

运维稳定性

成本效率

7.4 基准数据

8. RFP 提案书撰写指南

8.1 成本节约明示策略

8.2 风险缓解策略

8.3 分阶段落地路线图

8.4 提案书清单

9. 下一步

参考资料