资讯 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

用量统计说明

使用方式

平台支持查看预置服务和自定义服务的使用量。包括以下两种查看方式:

  • 接口:可通过程序化调用实时获取用量数据。点击查看API和SDK相关指导。
  • 控制台:调用统计页中,您可清晰查看该账号下的调用总tokens数、输入总tokens数、输出总tokens数等指标。

接口返回usage说明

usage说明

字段名 含义
prompt_tokens 问题tokens数(包含历史QA)
completion_tokens 回答tokens数;当调用对话Chat API返回此参数
total_tokens 总tokens数;计算方式:问题tokens数+回答tokens数
prompt_tokens_details 问题tokens数详情
+search_tokens 触发检索增强以后膨胀的token;用户可以通过usage.prompt_tokens_details.search_tokens>0判断是否出发了检索增强,并且计算触发检索增强的次数
+cached_tokens 触发上下文缓存后,输入命中缓存的token数量
+plugin_tokens 触发插件以后膨胀的token,key为插件名称,value为token数
++ChatFilePlus 触发阅读助手插件的token
completion_tokens_details 回答tokens数详情
+reasoning_tokens 思维链的token

usage返回示例

深度思考模型返回reasoning_tokens示例

    "usage": {
        "prompt_tokens": 2,
        "completion_tokens": 274,
        "total_tokens": 276,
        "completion_tokens_details": {
            "reasoning_tokens": 242
        }
    }

触发阅读助手插件返回plugin_tokens示例

    "usage": {
        "prompt_tokens": 15918,  
        "completion_tokens": 109,
        "total_tokens": 16027,
        "prompt_tokens_details": {
            "plugin_tokens": {
                "ChatFilePlus": 15871
            },
        "cache_tokens": xxx
        "search_tokens":xxxx
        }
    }

触发搜索返回search_tokens示例

    "usage": {
        "prompt_tokens": 4149,
        "completion_tokens": 287,
        "total_tokens": 4436,
        "prompt_tokens_details": {
            "search_tokens": 4146
        }
    }

触发prompt cache返回cache_tokens示例

    "usage": {
        "prompt_tokens": 159,
        "completion_tokens": 89,
        "total_tokens": 248,
        "prompt_tokens_details": {
            "cached_tokens": 128
        }
    }

千帆控制台用量统计说明

用量概览

  • 控制台可以查看全量AI原生应用的累计调用量,也可以查看指定应用调用量。

  • 调用总量:调用成功+调用失败
  • 调用失败:调用失败
  • 失败率:调用失败/调用总量
  • 调用总tokens数:调用成功的输入+输出token
  • 输入tokens数:调用成功的输入token
  • 输出tokens数:调用成功的输出token
  • 搜索触发次数:调用ERNIE模型触发搜索增强次数,按照0.004元/次计费
  • 搜索膨胀tokens数:触发搜索增强以后带来的输入token膨胀数量
  • cache tokens数:命中prompt cache的输入token
  • cache触发次数:命中prompt cache的次数

单模型用量详情

控制台入口

  • 点击列表页【查看V1/V2监控】按钮即可跳转

各指标计算方式


Hover ?处即可展示各指标计算公式:
1、输入token数+输出token数=请求总token数
2、输入token数包含搜索触发膨胀token数(如果触发)和chatifle触发token数(如果触发)
3、prompt cache token数表示输入token当中命中缓存部分的token

账单

点击右上角【财务】链接,即可跳转订单列表页

支持按产品筛选