用量统计说明
更新时间:2025-04-11
使用方式
平台支持查看预置服务和自定义服务的使用量。包括以下两种查看方式:
- 接口:可通过程序化调用实时获取用量数据。点击查看API和SDK相关指导。
- 控制台:调用统计页中,您可清晰查看该账号下的调用总tokens数、输入总tokens数、输出总tokens数等指标。
接口返回usage说明
usage说明
字段名 | 含义 |
---|---|
prompt_tokens | 问题tokens数(包含历史QA) |
completion_tokens | 回答tokens数;当调用对话Chat API返回此参数 |
total_tokens | 总tokens数;计算方式:问题tokens数+回答tokens数 |
prompt_tokens_details | 问题tokens数详情 |
+search_tokens | 触发检索增强以后膨胀的token;用户可以通过usage.prompt_tokens_details.search_tokens>0判断是否出发了检索增强,并且计算触发检索增强的次数 |
+cached_tokens | 触发上下文缓存后,输入命中缓存的token数量 |
+plugin_tokens | 触发插件以后膨胀的token,key为插件名称,value为token数 |
++ChatFilePlus | 触发阅读助手插件的token |
completion_tokens_details | 回答tokens数详情 |
+reasoning_tokens | 思维链的token |
usage返回示例
深度思考模型返回reasoning_tokens示例
"usage": {
"prompt_tokens": 2,
"completion_tokens": 274,
"total_tokens": 276,
"completion_tokens_details": {
"reasoning_tokens": 242
}
}
触发阅读助手插件返回plugin_tokens示例
"usage": {
"prompt_tokens": 15918,
"completion_tokens": 109,
"total_tokens": 16027,
"prompt_tokens_details": {
"plugin_tokens": {
"ChatFilePlus": 15871
},
"cache_tokens": xxx
"search_tokens":xxxx
}
}
触发搜索返回search_tokens示例
"usage": {
"prompt_tokens": 4149,
"completion_tokens": 287,
"total_tokens": 4436,
"prompt_tokens_details": {
"search_tokens": 4146
}
}
触发prompt cache返回cache_tokens示例
"usage": {
"prompt_tokens": 159,
"completion_tokens": 89,
"total_tokens": 248,
"prompt_tokens_details": {
"cached_tokens": 128
}
}
千帆控制台用量统计说明
用量概览
- 控制台可以查看全量AI原生应用的累计调用量,也可以查看指定应用调用量。
- 调用总量:调用成功+调用失败
- 调用失败:调用失败
- 失败率:调用失败/调用总量
- 调用总tokens数:调用成功的输入+输出token
- 输入tokens数:调用成功的输入token
- 输出tokens数:调用成功的输出token
- 搜索触发次数:调用ERNIE模型触发搜索增强次数,按照0.004元/次计费
- 搜索膨胀tokens数:触发搜索增强以后带来的输入token膨胀数量
- cache tokens数:命中prompt cache的输入token
- cache触发次数:命中prompt cache的次数
单模型用量详情
控制台入口
- 点击列表页【查看V1/V2监控】按钮即可跳转
各指标计算方式
Hover ?处即可展示各指标计算公式:
1、输入token数+输出token数=请求总token数
2、输入token数包含搜索触发膨胀token数(如果触发)和chatifle触发token数(如果触发)
3、prompt cache token数表示输入token当中命中缓存部分的token
账单
点击右上角【财务】链接,即可跳转订单列表页
支持按产品筛选