API 用量与成本

API Usage & Costs（API 用量与成本）是 OpenClaw 运营中需要持续关注的核心指标。合理管理 API 费用可以在保证服务质量的同时有效控制成本。

成本组成

OpenClaw 的 API 成本主要来自以下环节：

环节	说明	占比
LLM 推理	大语言模型的 Token 消耗	80-95%
STT/TTS	语音转文字 / 文字转语音	0-15%
嵌入模型	向量嵌入（Embedding）生成	1-5%
工具调用	第三方 API 调用	视业务而定

核心成本

绝大部分成本来自 LLM Token 消耗。优化 Token 用量是降本的关键。

模型价格对比

主流模型 Token 定价（每百万 Token）

模型	输入价格	输出价格	上下文窗口
GPT-4o	$2.50	$10.00	128K
GPT-4o-mini	$0.15	$0.60	128K
Claude 3.5 Sonnet	$3.00	$15.00	200K
Claude 3.5 Haiku	$0.80	$4.00	200K
DeepSeek V3	$0.27	$1.10	64K
DeepSeek R1	$0.55	$2.19	64K
通义千问 Max	¥2.40	¥9.60	128K
文心一言 4.0	¥8.00	¥8.00	128K

价格变动

以上价格仅供参考，各服务商定价会随时调整。请以官方最新定价为准。

成本追踪

OpenClaw 内置 Usage Tracking（用量追踪）模块：

yaml

# openclaw.config.yaml
usage:
  tracking: true
  storage: './data/usage'
  granularity: 'per-message'  # per-message | per-session | daily

查看用量

bash

# 查看今日用量
openclaw usage today

# 查看月度报告
openclaw usage report --month 2026-03

# 按 Agent 统计
openclaw usage breakdown --by agent

# 按模型统计
openclaw usage breakdown --by model

预算告警

配置预算阈值，超限时自动告警：

yaml

usage:
  budget:
    daily: 50.00       # 每日预算上限（美元）
    monthly: 1000.00   # 每月预算上限
    alert:
      threshold: 0.8   # 达到 80% 时告警
      channels:
        - type: webhook
          url: 'https://hooks.example.com/budget-alert'
        - type: email
          to: '[email protected]'
    action: 'warn'     # warn（警告） | throttle（限流） | stop（停止）

费用优化策略

1. 选择合适的模型

yaml

# 对简单任务使用廉价模型
agents:
  - name: faq-bot
    model: gpt-4o-mini        # 简单问答，足够胜任
  - name: analysis-agent
    model: claude-3.5-sonnet   # 复杂分析任务

2. 启用 Prompt 缓存

参见 Prompt 缓存，可节省 50-90% 的系统提示词成本。

3. 控制上下文长度

yaml

session:
  maxTokens: 4096        # 限制上下文 Token 数
  compaction:
    enabled: true
    threshold: 3000       # 超过阈值自动压缩

4. 使用模型降级

参见模型 Failover（故障转移）机制，高峰期自动降级到更经济的模型。

5. 合理设置采样参数

yaml

model:
  temperature: 0.3       # 降低随机性，减少无效输出
  maxTokens: 1024        # 限制最大输出长度

🇨🇳 中国用户须知

国产模型中 DeepSeek 性价比最高，V3 输入仅 ¥1/百万 Token
通义千问提供免费额度，适合测试和小规模使用
国内模型以人民币结算，无需外币支付渠道
建议混合使用国内模型（日常对话）和海外模型（复杂推理）以平衡成本与效果
关注各厂商的限时免费和阶梯优惠活动

API 用量与成本 ​

成本组成 ​

模型价格对比 ​

主流模型 Token 定价（每百万 Token） ​

成本追踪 ​

查看用量 ​

预算告警 ​

费用优化策略 ​

1. 选择合适的模型 ​

2. 启用 Prompt 缓存 ​

3. 控制上下文长度 ​

4. 使用模型降级 ​

5. 合理设置采样参数 ​

🇨🇳 中国用户须知 ​

API 用量与成本

成本组成

模型价格对比

主流模型 Token 定价（每百万 Token）

成本追踪

查看用量

预算告警

费用优化策略

1. 选择合适的模型

2. 启用 Prompt 缓存

3. 控制上下文长度

4. 使用模型降级

5. 合理设置采样参数

🇨🇳 中国用户须知