资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

用户部署模型服务调用

概述

当前模型部署支持2种计费模式,按资源算力单元计费和按Tokens计费计费。

按算力单元计费

购买算力单元限时5折起优惠,活动时间:2024年11月13日~2024年12月31日。

当您通过购买算力单元部署服务时,付费信息选择分为以下两种方式:

  • 预付费:需要提前一次性支付所选时间段内的费用,这种模式价格相较于后付费模式更低廉。
  • 后付费:按资源的使用时长收费,不需要提前支付费用,这种模式比预付费模式价格高一些。

预付费

预付费购买的算力单元,按月计费,购买成功后开始计时。具体价格如下:

资源类型 规格 原单价(元/月) 折后价(元/月)
AI加速卡Ⅰ型 1个算力单元 15,000 (5折后) 7,500
AI加速卡Ⅴ型 1个算力单元 9,000 (5折后) 4,500
AI加速卡Ⅵ型 1个算力单元 9,000 (5折后) 4,500
AI加速卡Ⅶ型 1个算力单元 15,000 (5折后) 7,500
CPU 1个算力单元 3,900 (5折后) 1,950

预付费购买的算力单元支持开启/关闭自动续费功能,您可在千帆产品控制台按需设置。

使用中状态的预付费算力单元支持变配(仅升配)功能,您可在千帆产品控制台按需使用。资源变配可能会带来额外的消费,计费规则如下:

  • 公式:(新配置单价- 旧配置单价)* 原订单剩余时长(大于24小时,向下取整;小于24小时,向上取整)
  • 例如:剩余时间为5天时发起扩容,扩容当天不收费,只收取剩余5天的扩容费用;剩余时间为8小时时,扩容收取当天全天的费用;

后付费

后付费购买的算力单元,按分钟计费,按小时出账。使用时长小于15分钟按15分钟收费,超过15分钟按照实际使用时长收费。具体价格如下:

资源类型 规格 原单价(元/分钟) 折后价(元/分钟)
AI加速卡Ⅰ型 1个算力单元 0.52 (5折后) 0.26
AI加速卡Ⅴ型 1个算力单元 0.32 (5折后) 0.16
AI加速卡Ⅵ型 1个算力单元 0.32 (5折后) 0.16
AI加速卡Ⅶ型 1个算力单元 0.52 (5折后) 0.26
CPU 1个算力单元 0.17 (5折后) 0.085

后付费购买的算力单元支持设置定时释放时间,默认处于关闭状态,您可在千帆产品控制台按需设置。

使用中状态的后付费算力单元支持变配(升配/降配)功能,您可在千帆产品控制台按需使用。后付费算力单元根据使用时长后付费,变配成功后,价格会根据新配置自动变更。

按Tokens计费

当您在部署服务时,选择部署经过平台SFT的模型,付费信息可选择服务调用量(后付费),其付费规格如下:

SFT基础模型 模型版本 折扣价 原价
ERNIE Speed ERNIE-Speed-8K 输入:0.004元/千tokens
输出:0.008元/千tokens
输入:0.012元/千tokens
输出:0.024元/千tokens
ERNIE Lite ERNIE-Lite-8K-0308 输入:0.003元/千tokens
输出:0.006元/千tokens
输入:0.009元/千tokens
输出:0.018元/千tokens
ERNIE Lite ERNIE-Lite-8K-0922 0.008元/千tokens 0.024元/千tokens
ERNIE Lite ERNIE-Lite-8K-0725 0.008元/千tokens 0.024元/千tokens
ERNIE Lite ERNIE-Lite-4K-0704 0.008元/千tokens 0.024元/千tokens
ERNIE Lite ERNIE-Lite-4K-0516 0.008元/千tokens 0.024元/千tokens
Llama-2 Qianfan-Chinese-Llama-2-7B 0.004元/千tokens 0.012元/千tokens
Llama-2 Qianfan-Chinese-Llama-2-7B-32K 0.004元/千tokens 0.012元/千tokens
Llama-2 Qianfan-Chinese-Llama-2-13B 0.006元/千tokens 0.018元/千tokens
ChatGLM chatglm2-6b 0.004元/千tokens 0.012元/千tokens
ChatGLM chatglm2-6b-32k 0.004元/千tokens 0.012元/千tokens
Baichuan2 Baichuan2-7B-Chat 0.004元/千tokens 0.012元/千tokens
Baichuan2 Baichuan2-13B-Chat 0.006元/千tokens 0.018元/千tokens
SQLCoder-7B sqlcoder-7b 0.004元/千tokens 0.012元/千tokens
CodeLlama CodeLlama-7b-Instruct 0.004元/千tokens 0.012元/千tokens
BLOOMZ-7B BLOOMZ-7B 0.004元/千tokens 0.012元/千tokens

价格费用举例

算力单元的开始时间以服务部署成功时间为准。

示例1:预付费购买1个月的AI加速卡Ⅰ型算力单元

单副本算力单元数为2,副本数自定义为2,则最终需要购买的算力单元总数为2*2=4个,购买一个月的总价格为: 1(月) x 2(单副本算力单元) x 2(副本数) x 15,000(元/月x 1副本 x 1算力单元) = 60,000 元
活动期间,购买AI加速卡算力单元享有5折优惠,所以折后价为30,000元。

上一篇
平台预置服务调用
下一篇
模型精调