API 用量与成本
API Usage & Costs(API 用量与成本)是 OpenClaw 运营中需要持续关注的核心指标。合理管理 API 费用可以在保证服务质量的同时有效控制成本。
成本组成
OpenClaw 的 API 成本主要来自以下环节:
| 环节 | 说明 | 占比 |
|---|---|---|
| LLM 推理 | 大语言模型的 Token 消耗 | 80-95% |
| STT/TTS | 语音转文字 / 文字转语音 | 0-15% |
| 嵌入模型 | 向量嵌入(Embedding)生成 | 1-5% |
| 工具调用 | 第三方 API 调用 | 视业务而定 |
核心成本
绝大部分成本来自 LLM Token 消耗。优化 Token 用量是降本的关键。
模型价格对比
主流模型 Token 定价(每百万 Token)
| 模型 | 输入价格 | 输出价格 | 上下文窗口 |
|---|---|---|---|
| GPT-4o | $2.50 | $10.00 | 128K |
| GPT-4o-mini | $0.15 | $0.60 | 128K |
| Claude 3.5 Sonnet | $3.00 | $15.00 | 200K |
| Claude 3.5 Haiku | $0.80 | $4.00 | 200K |
| DeepSeek V3 | $0.27 | $1.10 | 64K |
| DeepSeek R1 | $0.55 | $2.19 | 64K |
| 通义千问 Max | ¥2.40 | ¥9.60 | 128K |
| 文心一言 4.0 | ¥8.00 | ¥8.00 | 128K |
价格变动
以上价格仅供参考,各服务商定价会随时调整。请以官方最新定价为准。
成本追踪
OpenClaw 内置 Usage Tracking(用量追踪)模块:
yaml
# openclaw.config.yaml
usage:
tracking: true
storage: './data/usage'
granularity: 'per-message' # per-message | per-session | daily查看用量
bash
# 查看今日用量
openclaw usage today
# 查看月度报告
openclaw usage report --month 2026-03
# 按 Agent 统计
openclaw usage breakdown --by agent
# 按模型统计
openclaw usage breakdown --by model预算告警
配置预算阈值,超限时自动告警:
yaml
usage:
budget:
daily: 50.00 # 每日预算上限(美元)
monthly: 1000.00 # 每月预算上限
alert:
threshold: 0.8 # 达到 80% 时告警
channels:
- type: webhook
url: 'https://hooks.example.com/budget-alert'
- type: email
to: 'admin@example.com'
action: 'warn' # warn(警告) | throttle(限流) | stop(停止)费用优化策略
1. 选择合适的模型
yaml
# 对简单任务使用廉价模型
agents:
- name: faq-bot
model: gpt-4o-mini # 简单问答,足够胜任
- name: analysis-agent
model: claude-3.5-sonnet # 复杂分析任务2. 启用 Prompt 缓存
参见 Prompt 缓存,可节省 50-90% 的系统提示词成本。
3. 控制上下文长度
yaml
session:
maxTokens: 4096 # 限制上下文 Token 数
compaction:
enabled: true
threshold: 3000 # 超过阈值自动压缩4. 使用模型降级
参见模型 Failover(故障转移)机制,高峰期自动降级到更经济的模型。
5. 合理设置采样参数
yaml
model:
temperature: 0.3 # 降低随机性,减少无效输出
maxTokens: 1024 # 限制最大输出长度🇨🇳 中国用户须知
- 国产模型中 DeepSeek 性价比最高,V3 输入仅 ¥1/百万 Token
- 通义千问提供免费额度,适合测试和小规模使用
- 国内模型以人民币结算,无需外币支付渠道
- 建议混合使用国内模型(日常对话)和海外模型(复杂推理)以平衡成本与效果
- 关注各厂商的限时免费和阶梯优惠活动
