资讯 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

价格

模型价格

原生多模态

模型名称 版本名称 服务内容 子项 在线推理 批量推理 单位
ERNIE 4.5 Turbo VL ERNIE-4.5-Turbo-VL-32K 推理服务 输入 0.003 0.0012 元/千tokens
推理服务 输出 0.009 0.0036 元/千tokens
ERNIE 4.5 ERNIE-4.5-8K 推理服务 输入 0.004 0.0016 元/千tokens
推理服务 输出 0.016 0.0064 元/千tokens
搜索增强 触发 0.004 0.0016 元/次
Llama-4-Maverick Llama-4-Maverick-17B-128E-Instruct 推理服务 输入 0.007 0.0028 元/千tokens
推理服务 输出 0.021 0.0084 元/千tokens
Llama-4-Scout Llama-4-Scout-17B-16E-Instruct 推理服务 输入 0.006 0.0024 元/千tokens
推理服务 输出 0.018 0.0072 元/千tokens

文本生成

按量后付费

模型名称 版本名称 服务内容 子项 在线推理 批量推理 单位
ERNIE 4.5 Turbo ERNIE-4.5-Turbo-128K
ERNIE-4.5-Turbo-32K
推理服务 输入 0.0008 0.00032 元/千tokens
输出 0.0032 0.00128 元/千tokens
搜索增强 触发 0.004 0.0016 元/次
ERNIE 4.0 Turbo ERNIE-4.0-Turbo-8K
ERNIE-4.0-Turbo-128K
ERNIE-4.0-Turbo-8K-Preview
推理服务 输入 0.003 0.0012 元/千tokens
输出 0.009 0.0036 元/千tokens
搜索增强 触发 0.004 0.0016 元/次
ERNIE 4.0 ERNIE-4.0-8K
ERNIE-4.0-8K-Preview
推理服务 输入 0.004 0.0016 元/千tokens
输出 0.016 0.0064 元/千tokens
搜索增强 触发 0.004 0.0016 元/次
ERNIE 3.5 ERNIE-3.5-8K
ERNIE-3.5-128K
ERNIE-3.5-8K-Preview
推理服务 输入 0.0008 0.00032 元/千tokens
输出 0.002 0.0008 元/千tokens
搜索增强 触发 0.004 0.0016 元/次
DeepSeek-V3 DeepSeek-V3 推理服务 输入 0.002 0.00032 元/千tokens
输出 0.008 0.00064 元/千tokens
Qianfan-8B Qianfan-8B 推理服务 输入 0.0005 0.0008 元/千tokens
输出 0.001 0.0008 元/千tokens
Qianfan-70B Qianfan-70B 推理服务 输入 0.0008 0.0025 元/千tokens
输出 0.0032 0.0025 元/千tokens
Qwen3 Qwen3-235B-A22B
如开启思考模式计费详情请查看深度思考
推理服务 输入 0.004 - 元/千tokens
输出 0.012 - 元/千tokens
Qwen3 Qwen3-30B-A3B
如开启思考模式计费详情请查看深度思考
推理服务 输入 0.0015 - 元/千tokens
输出 0.006 - 元/千tokens
Qwen3 Qwen3-32B
如开启思考模式计费详情请查看深度思考
推理服务 输入 0.002 - 元/千tokens
输出 0.008 - 元/千tokens
Qwen3 Qwen3-14B
如开启思考模式计费详情请查看深度思考
推理服务 输入 0.001 - 元/千tokens
输出 0.004 - 元/千tokens
Qwen3 Qwen3-8B
如开启思考模式计费详情请查看深度思考
推理服务 输入 0.0005 - 元/千tokens
输出 0.002 - 元/千tokens
Qwen3 Qwen3-4B
如开启思考模式计费详情请查看深度思考
推理服务 输入 0.0003 - 元/千tokens
输出 0.0012 - 元/千tokens
Qwen3 Qwen3-1.7B
如开启思考模式计费详情请查看深度思考
推理服务 输入 0.0003 - 元/千tokens
输出 0.0012 - 元/千tokens
Qwen3 Qwen3-0.6B
如开启思考模式计费详情请查看深度思考
推理服务 输入 0.0003 - 元/千tokens
输出 0.0012 - 元/千tokens
Qwen2.5 Qwen2.5-7B-Instruct 推理服务 输入 0.0005 0.0002 元/千tokens
输出 0.001 0.0004 元/千tokens
GLM-4-32B-0414 GLM-4-32B-0414 推理服务 输入 0.001 0.0018 元/千tokens
输出 0.004 0.0018 元/千tokens
BLOOMZ-7B BLOOMZ-7B
即将下线
推理服务 输入 0.004 0.0008 元/千tokens
输出 0.004 0.0008 元/千tokens
Meta-Llama-3-8B Meta-Llama-3-8B 推理服务 输入 0.004 0.0008 元/千tokens
输出 0.004 0.0008 元/千tokens
Meta-Llama-3-70B Meta-Llama-3-70B 推理服务 输入 0.035 0.0025 元/千tokens
输出 0.035 0.0025 元/千tokens
Llama-2-7B-Chat Llama-2-7B-Chat
即将下线
推理服务 输入 0.004 0.0008 元/千tokens
输出 0.004 0.0008 元/千tokens
Llama-2-13B-Chat Llama-2-13B-Chat
即将下线
推理服务 输入 0.006 0.0008 元/千tokens
输出 0.006 0.0008 元/千tokens
Llama-2-70B-Chat Llama-2-70B-Chat
即将下线
推理服务 输入 0.035 0.0025 元/千tokens
输出 0.035 0.0025 元/千tokens
ChatGLM2-6B-32K ChatGLM2-6B-32K
即将下线
推理服务 输入 0.004 0.0008 元/千tokens
输出 0.004 0.0008 元/千tokens
AquilaChat-7B AquilaChat-7B
即将下线
推理服务 输入 0.004 0.0008 元/千tokens
输出 0.004 0.0008 元/千tokens
Mixtral-8x7B-Instruct Mixtral-8x7B-Instruct
即将下线
推理服务 输入 0.035 0.0008 元/千tokens
输出 0.035 0.0008 元/千tokens
SQLCoder-7B SQLCoder-7B
即将下线
推理服务 输入 0.004 0.0008 元/千tokens
输出 0.004 0.0008 元/千tokens
CodeLlama-7B-Instruct CodeLlama-7B-Instruct
即将下线
推理服务 输入 0.004 0.0008 元/千tokens
输出 0.004 0.0008 元/千tokens
XuanYuan-70B-Chat-4bit XuanYuan-70B-Chat-4bit
即将下线
推理服务 输入 0.035 0.0025 元/千tokens
输出 0.035 0.0025 元/千tokens
Qianfan-BLOOMZ-7B-compressed Qianfan-BLOOMZ-7B-compressed
即将下线
推理服务 输入 0.004 0.0008 元/千tokens
输出 0.004 0.0008 元/千tokens
Qianfan-Chinese-Llama-2-7B Qianfan-Chinese-Llama-2-7B
即将下线
推理服务 输入 0.004 0.0008 元/千tokens
输出 0.004 0.0008 元/千tokens
Qianfan-Chinese-Llama-2-13B Qianfan-Chinese-Llama-2-13B 推理服务 输入 0.006 0.0018 元/千tokens
输出 0.006 0.0018 元/千tokens
Qianfan-Chinese-Llama-2-70B Qianfan-Chinese-Llama-2-70B
即将下线
推理服务 输入 0.035 - 元/千tokens
输出 0.035 - 元/千tokens
Yi-34B-Chat Yi-34B-Chat
即将下线
推理服务 输入 0.02 0.0018 元/千tokens
输出 0.02 0.0018 元/千tokens
Gemma-7B-it Gemma-7B-it
即将下线
推理服务 输入 0.004 0.0008 元/千tokens
输出 0.004 0.0008 元/千tokens

备注信息:

  1. DeepSeek-V3 批量推理即将于6月13日价格上调,恢复至输入0.0008元/千tokens,输出0.00032元/千tokens。保持预置服务4折。

按量包付费

量包名称 量包额度(Tokens) 服务速率限制 有效期 原价(元) 折扣率 折后价(元)
ERNIE-X1-32K-Preview
系列预置服务共享量包
1亿 TPM = 500K
RPM = 1,500
6个月 350 90% 315
5亿 TPM = 800K
RPM = 1,500
6个月 1,750 85% 1,487.5
10亿 TPM = 1,200K
RPM = 1,500
6个月 3,500 80% 2,800
ERNIE-4.0-8K
系列预置服务共享量包
1000万 TPM = 800K
RPM = 10K
6个月 450 90% 405
5000万 TPM = 800K
RPM = 10K
6个月 2,250 80% 1,800
1亿 TPM =1040K
RPM = 10K
12个月 4,500 80% 3,600
5亿 TPM = 5200K
RPM = 10K
12个月 22,500 75% 16,875
10亿 TPM = 10400K
RPM = 10K
12个月 45,000 70% 31,500
ERNIE-3.5-8K
系列预置服务共享量包
5,000万 TPM = 800K
RPM = 10K
6个月 55 92% 50.60
1亿 TPM = 800K
RPM = 10K
12个月 110 90% 99
5亿 TPM = 800K
RPM = 10K
12个月 550 80% 440
10亿 TPM =1040K
RPM = 10K
12个月 1,100 80% 880
50亿 TPM = 5200K
RPM = 10K
12个月 5,500 75% 4,125
100亿 TPM =10400K
RPM = 10K
12个月 11,000 70% 7,700
ERNIE-4.0-Turbo-8K
系列预置服务共享量包
1,000万 TPM = 800K
RPM = 10K
6个月 300 90% 270
5,000万 TPM = 800K
RPM = 10K
6个月 1,500 80% 1,200
1亿 TPM =1040K
RPM = 10K
12个月 3,000 80% 2,400
5亿 TPM = 5200K
RPM = 10K
12个月 15,000 75% 11,250
10亿 TPM =10400K
RPM = 10K
12个月 30,000 70% 21,000
ERNIE-3.5-128K
系列预置服务共享量包
1亿 TPM = 400K
RPM = 5K
12个月 110 90% 99
5亿 TPM = 400K
RPM = 5K
12个月 550 80% 440
10亿 TPM = 800K
RPM = 5K
12个月 1,100 80% 880
50亿 TPM = 4000K
RPM = 5K
12个月 5,500 75% 4,125
ERNIE-Lite-Pro-128K
系列预置服务共享量包
1亿 TPM = 800K
RPM = 10K
12个月 25 90% 22.5
10亿 TPM = 800K
RPM = 10K
12个月 250 85% 212.50
50亿 TPM = 800K
RPM = 10K
12个月 1,250 80% 1,000
ERNIE-Speed-Pro-128K
系列预置服务共享量包
1亿 TPM = 800K
RPM = 10K
12个月 37.5 90% 33.75
10亿 TPM = 800K
RPM = 10K
12个月 375 85% 318.75
50亿 TPM = 800K
RPM = 10K
12个月 1,875 80% 1,500
ERNIE-4.0-Turbo-128K
系列预置服务共享量包
1亿 TPM = 400K
RPM = 5K
12个月 3,000 90% 2,700
5亿 TPM = 400K
RPM = 5K
12个月 15,000 80% 12,000
10亿 TPM = 800K
RPM = 5K
12个月 30,000 80% 24,000

按TPM付费

模型名称 版本名称 单位规格 预付费单价 后付费单价
原价 活动价 原价 活动价
ERNIE 4.0 ERNIE-4.0-8K TPM = 10000
RPM = 33
¥27,000 ¥12,960 ¥55 ¥27
ERNIE-4.0-8K-Preview TPM = 10000
RPM = 33
¥27,000 ¥12,960 ¥55 ¥27
ERNIE-4.0-8K-Preview-0518 TPM = 10000
RPM = 33
¥27,000 ¥12,960 ¥55 ¥27
ERNIE 4.0 Turbo ERNIE-4.0-Turbo-8K TPM = 10000
RPM = 33
¥12,000 ¥6,480 ¥25 ¥14
ERNIE-4.0-Turbo-128K TPM = 10000
RPM = 2
¥12,000 ¥6,480 ¥10 ¥0.50
ERNIE 3.5 ERNIE-3.5-8K TPM = 10000
RPM = 33
¥4,250 ¥237.60 ¥25 ¥14
ERNIE-3.5-8K-Preview TPM = 10000
RPM = 33
¥4,250 ¥237.60 ¥10 ¥0.50
ERNIE-3.5-128K TPM = 10000
RPM = 2
¥17,000 ¥237.60 ¥40 ¥0.50
ERNIE-3.5-128K-Preview TPM = 10000
RPM = 2
¥17,000 ¥237.60 ¥40 ¥0.50
ERNIE Speed ERNIE-Speed-Pro-128K TPM = 10000
RPM = 2
¥164.70 ¥82.35 ¥0.34 ¥0.17
ERNIE-Speed-8K TPM = 10000
RPM = 33
¥1,900 ¥81 ¥5 ¥0.20
ERNIE-Speed-128K TPM = 10000
RPM = 2
¥7,600 ¥81 ¥20 ¥0.20
ERNIE Lite ERNIE-Lite-Pro-128K TPM = 10000
RPM = 2
¥109.80 ¥54.90 ¥0.23 ¥0.11
ERNIE-Lite-8K TPM = 10000
RPM = 33
¥1,200 ¥54 ¥3 ¥0.12
ERNIE Character ERNIE-Character-Fiction-8K TPM = 10000
RPM = 33
¥1,900 ¥1,900 ¥5 ¥5
ERNIE-Character-8K TPM = 10000
RPM = 33
¥1,900 ¥1,900 ¥5 ¥5
ERNIE Novel ERNIE-Novel-8K TPM = 10000
RPM = 33
¥27,000 ¥12,960 ¥55 ¥27
ERNIE Tiny ERNIE-Tiny-8K TPM = 10000
RPM = 33
¥400 ¥400 ¥1 ¥1

图像理解

模型名称 版本名称 服务内容 子项 在线推理 批量推理 单位
Qianfan-Llama-VL-8B Qianfan-Llama-VL-8B 推理服务 输入 0.002 0.0008 元/千tokens
输出 0.005 0.002 元/千tokens
DeepSeek-VL2 DeepSeek-VL2 推理服务 输入 0.00099 - 元/千tokens
输出 0.00099 - 元/千tokens
DeepSeek-VL2-Small DeepSeek-VL2-Small 推理服务 输入 0.0005 - 元/千tokens
输出 0.0005 - 元/千tokens
Qwen2.5-VL-7B-Instruct Qwen2.5-VL-7B-Instruct 推理服务 输入 0.002 0.0008 元/千tokens
输出 0.005 0.002 元/千tokens
Qwen2.5-VL-32B-Instruct Qwen2.5-VL-32B-Instruct 推理服务 输入 0.008 - 元/千tokens
输出 0.024 - 元/千tokens
InternVL2_5-38B-MPO InternVL2_5-38B-MPO 推理服务 输入 0.008 - 元/千tokens
输出 0.024 - 元/千tokens
Fuyu-8B Fuyu-8B
即将下线
推理服务 - 限时免费 -

备注信息:

  1. Fuyu-8B:限时免费,每个账号每天包含500次调用额度(按调用总次数统计,包括但不限于调用成功的次数)。如需扩容,请使用算力单元发布该模型。

深度思考

按量后付费

模型名称 版本名称 服务内容 子项 在线推理 批量推理 单位
ERNIE X1 Turbo ERNIE-X1-Turbo-32K 推理服务 输入 0.001 0.0004 元/千tokens
输出 0.004 0.0016 元/千tokens
ERNIE X1 ERNIE-X1-32K
ERNIE-X1-32K-Preview
推理服务 输入 0.002 0.0008 元/千tokens
输出 0.008 0.0032 元/千tokens
DeepSeek-R1 DeepSeek-R1 推理服务 输入 0.004 0.0008 元/千tokens
输出 0.016 0.0032 元/千tokens
DeepSeek-R1-Distill-Qianfan-70B DeepSeek-R1-Distill-Qianfan-70B 推理服务 输入 0.002 0.008 元/千tokens
输出 0.008 0.0032 元/千tokens
DeepSeek-R1-Distill-Qianfan-8B DeepSeek-R1-Distill-Qianfan-8B 推理服务 输入 0.001 0.0004 元/千tokens
输出 0.004 0.00016 元/千tokens
DeepSeek-R1-Distill-Qianfan-Llama-70B DeepSeek-R1-Distill-Qianfan-Llama-70B 推理服务 输入 0.002 0.0008 元/千tokens
输出 0.008 0.0032 元/千tokens
DeepSeek-R1-Distill-Qianfan-Llama-8B DeepSeek-R1-Distill-Qianfan-Llama-8B 推理服务 输入 0.001 0.0004 元/千tokens
输出 0.004 0.00016 元/千tokens
DeepSeek-R1-Distill-Llama-70B DeepSeek-R1-Distill-Llama-70B 推理服务 输入 0.002 0.0008 元/千tokens
输出 0.008 0.0032 元/千tokens
DeepSeek-R1-Distill-Llama-8B DeepSeek-R1-Distill-Llama-8B 推理服务 输入 0.001 0.0004 元/千tokens
输出 0.004 0.00016 元/千tokens
DeepSeek-R1-Distill-Qwen-32B DeepSeek-R1-Distill-Qwen-32B 推理服务 输入 0.0015 0.0006 元/千tokens
输出 0.006 0.0024 元/千tokens
DeepSeek-R1-Distill-Qwen-14B DeepSeek-R1-Distill-Qwen-14B 推理服务 输入 0.0006 0.00024 元/千tokens
输出 0.0024 0.00096 元/千tokens
DeepSeek-R1-Distill-Qwen-7B DeepSeek-R1-Distill-Qwen-7B 推理服务 输入 0.0005 0.0002 元/千tokens
输出 0.002 0.0008 元/千tokens
DeepSeek-R1-Distill-Qwen-1.5B DeepSeek-R1-Distill-Qwen-1.5B 推理服务 输入 0.0003 0.00012 元/千tokens
输出 0.0012 0.00048 元/千tokens
GLM-Z1-32B-0414 GLM-Z1-32B-0414 推理服务 输入 0.002 0.0018 元/千tokens
输出 0.008 0.0018 元/千tokens
GLM-Z1-Rumination-32B-0414 GLM-Z1-Rumination-32B-0414 推理服务 输入 0.005 0.0018 元/千tokens
输出 0.02 0.0018 元/千tokens
Qwen3 Qwen3-235B-A22B
如未启用思考模式计费详情请查看文本生成
推理服务 输入 0.004 - 元/千tokens
输出 0.012 - 元/千tokens
Qwen3 Qwen3-30B-A3B
如未启用思考模式计费详情请查看文本生成
推理服务 输入 0.0015 - 元/千tokens
输出 0.006 - 元/千tokens
Qwen3 Qwen3-32B
如未启用思考模式计费详情请查看文本生成
推理服务 输入 0.002 - 元/千tokens
输出 0.008 - 元/千tokens
Qwen3 Qwen3-14B
如未启用思考模式计费详情请查看文本生成
推理服务 输入 0.001 - 元/千tokens
输出 0.004 - 元/千tokens
Qwen3 Qwen3-8B
如未启用思考模式计费详情请查看文本生成
推理服务 输入 0.0005 - 元/千tokens
输出 0.002 - 元/千tokens
Qwen3 Qwen3-4B
如未启用思考模式计费详情请查看文本生成
推理服务 输入 0.0003 - 元/千tokens
输出 0.0012 - 元/千tokens
Qwen3 Qwen3-1.7B
如未启用思考模式计费详情请查看文本生成
推理服务 输入 0.0003 - 元/千tokens
输出 0.0012 - 元/千tokens
Qwen3 Qwen3-0.6B
如未启用思考模式计费详情请查看文本生成
推理服务 输入 0.0003 - 元/千tokens
输出 0.0012 - 元/千tokens
QWQ-32B QWQ-32B 推理服务 输入 0.002 0.0008 元/千tokens
输出 0.006 0.0024 元/千tokens

备注信息:

Qwen3 系列模型思考模式下输出限时优惠,将于5月16日00:00恢复原价。

  1. Qwen3-235B-A22B 限时优惠价0.012元/千tokens,原价0.04元/千tokens
  2. Qwen3-30B-A3B 限时优惠价0.006元/千tokens,原价0.015元/千tokens
  3. Qwen3-32B 限时优惠价0.008元/千tokens,原价0.02元/千tokens
  4. Qwen3-14B 限时优惠价0.004元/千tokens,原价0.01元/千tokens
  5. Qwen3-8B 限时优惠价0.002元/千tokens,原价0.005元/千tokens
  6. Qwen3-4B 限时优惠价0.0012元/千tokens,原价0.003元/千tokens
  7. Qwen3-1.7B 限时优惠价0.0012元/千tokens,原价0.003元/千tokens
  8. Qwen3-0.6B 限时优惠价0.0012元/千tokens,原价0.003元/千tokens

DeepSeek R1 批量推理,将于6月13日价格上调,保持预置服务4折

1、输入:0.0016元/千tokens

2、输出:0.0064元/千tokens

按量包付费

量包名称 量包额度(Tokens) 服务速率限制 有效期 原价(元) 折扣率 折后价(元)
DeepSeek-V3
系列预置服务共享量包
1亿 TPM = 300K
RPM = 1,500
3个月 350 90% 315
5亿 TPM = 500K
RPM = 1,500
3个月 1,750 85% 1,487.5
10亿 TPM = 800K
RPM = 1,500
3个月 3,500 80% 2,800
DeepSeek-R1
系列预置服务共享量包
1亿 TPM = 300K
RPM = 1,500
3个月 700 90% 630
5亿 TPM = 500K
RPM = 1,500
3个月 3,500 85% 2,975
10亿 TPM = 800K
RPM = 1,500
3个月 7,000 80% 5,600

图像生成

模型 服务内容 单价 规格
irag-1.0 推理服务 0.14元/张 1024x1024
FLUX.1-schnell 推理服务 限时0.002元/张 -
Stable-Diffusion-XL 推理服务 0.02元/秒,具体计算逻辑,参考下表。 768x768、576x1024、1024x576,3秒/张 * ¥0.02元/秒=¥0.06元/张
768x1024、1024x768、1024x1024,4秒/张 * ¥0.02元/秒=¥0.08元/张
1536x1536、1152x2048、2048x1152,6秒/张 * ¥0.02元/秒=¥0.12元/张
1536x2048、2048x1536、2048x2048,8秒/张 * ¥0.02元/秒=¥0.16元/张

图像编辑

模型 服务内容 单价 单位
ernie-irag-edit 推理服务 0.14 元/张

向量

模型名称 服务内容 子项 单价 单位
Embedding-V1 推理服务 输入 0.0005 元/千tokens
bge-large-zh 推理服务 输入 0.0005 元/千tokens
bge-large-en 推理服务 输入 0.0005 元/千tokens
tao-8k 推理服务 输入 0.0005 元/千tokens

重排序

模型名称 服务内容 子项 单价 单位
bce-reranker-base 推理服务 输入 0.0005 元/千tokens

模型内置工具价格

联网搜索

按次使用量后付费

基于用户query,大模型自动判断是否触发联网搜索查询相关文献。如果触发联网搜索,则基于搜索结果进行总结回答。如果不触发联网搜索,大模型直接回答。

触发联网搜索包括两部分费用:

  • 按次收费:如果触发搜索,会收取一次联网搜索费用,单次价格见下面表格。
  • 联网搜索search_tokens费用:联网搜索会将检索到的内容输入给大模型,导致输入模型tokens增加,在推理接口返回的usage.prompt_tokens_details.search_tokens当中体现。
服务内容 单价 单位
搜索增强 0.004 元/次

按次量包预付费

搜索增强支持使用量包。使用ERNIE-4.0-8K、ERNIE-3.5-8K、ERNIE-4.0-Turbo-8K、ERNIE-3.5-128K系列预置服务触发搜索增强时,如已购买搜索增强量包,则会优先抵扣量包,量包耗尽或过期后恢复至按次计费。

当前规格及计费如下所示:

次数 有效期 原价 折扣率 折后价
10000次      6个月      ¥80    95%   ¥76   
50000次      6个月      ¥400   95%   ¥380

阅读助手插件

按次使用量后付费

基于plugins入参和用户query,模型自动判断是否调起插件。如果触发插件,则基于文档内容总结回复。如果不触发,大模型直接回答。

触发插件回复包含两部分费用:

  • 按次收费:如果触发插件,会收取一次插件费用,单次价格见下面表格。
  • plugin_tokens费用:触发阅读助手插件后,插件会读取需要阅读的文档/网页内容,并对用户的prompt进行一定扩写,导致输入模型的token增加,在推理接口返回的usage.prompt_tokens_details.plugin_tokens
插件 服务内容 单价
阅读助手插件 推理服务 ¥0.01元/每次

算力单元价格

购买算力单元限时5折起优惠,活动时间:2024年11月13日~2025年6月30日。

当您通过购买算力单元部署服务时,付费信息选择分为以下两种方式:

  • 预付费:需要提前一次性支付所选时间段内的费用,这种模式价格相较于后付费模式更低廉。
  • 后付费:按资源的使用时长收费,不需要提前支付费用,这种模式比预付费模式价格高一些。

预付费

预付费购买的算力单元,按月计费,购买成功后开始计时。具体价格如下:

资源类型 规格 原单价(元/月) 折后价(元/月)
AI加速卡Ⅰ型 1个算力单元 15,000 (5折后) 7,500
AI加速卡Ⅴ型 1个算力单元 9,000 (5折后) 4,500
AI加速卡Ⅵ型 1个算力单元 9,000 (5折后) 4,500
AI加速卡Ⅶ型 1个算力单元 15,000 (5折后) 7,500
CPU 1个算力单元 3,900 (5折后) 1,950

预付费购买的算力单元支持开启/关闭自动续费功能,您可在千帆产品控制台按需设置。

使用中状态的预付费算力单元支持变配(仅升配)功能,您可在千帆产品控制台按需使用。资源变配可能会带来额外的消费,计费规则如下:

  • 公式:(新配置单价- 旧配置单价)* 原订单剩余时长(大于24小时,向下取整;小于24小时,向上取整)
  • 例如:剩余时间为5天时发起扩容,扩容当天不收费,只收取剩余5天的扩容费用;剩余时间为8小时时,扩容收取当天全天的费用;

后付费

后付费购买的算力单元,按分钟计费,按小时出账。使用时长小于15分钟按15分钟收费,超过15分钟按照实际使用时长收费。具体价格如下:

资源类型 规格 原单价(元/分钟) 折后价(元/分钟)
AI加速卡Ⅰ型 1个算力单元 0.52 (5折后) 0.26
AI加速卡Ⅴ型 1个算力单元 0.32 (5折后) 0.16
AI加速卡Ⅵ型 1个算力单元 0.32 (5折后) 0.16
AI加速卡Ⅶ型 1个算力单元 0.52 (5折后) 0.26
CPU 1个算力单元 0.17 (5折后) 0.085

后付费购买的算力单元支持设置定时释放时间,默认处于关闭状态,您可在千帆产品控制台按需设置。

使用中状态的后付费算力单元支持变配(升配/降配)功能,您可在千帆产品控制台按需使用。后付费算力单元根据使用时长后付费,变配成功后,价格会根据新配置自动变更。

价格费用举例

算力单元的开始时间以服务部署成功时间为准。

示例1:预付费购买1个月的AI加速卡Ⅰ型算力单元

单副本算力单元数为2,副本数自定义为2,则最终需要购买的算力单元总数为2*2=4个,购买一个月的总价格为: 1(月) x 2(单副本算力单元) x 2(副本数) x 15,000(元/月x 1副本 x 1算力单元) = 60,000 元
活动期间,购买AI加速卡算力单元享有5折优惠,所以折后价为30,000元。

微调模型按token后付费价格

平台部分基座模型,其微调以后的模型,支持发布为按token后付费的服务,其付费规格如下:

SFT基础模型 模型版本 原价 折扣价
ERNIE Speed ERNIE-Speed-8K 输入:0.012元/千tokens
输出:0.024元/千tokens
输入:0.004元/千tokens
输出:0.008元/千tokens
ERNIE Lite ERNIE-Lite-8K-0308 输入:0.009元/千tokens
输出:0.018元/千tokens
输入:0.003元/千tokens
输出:0.006元/千tokens
ERNIE Lite ERNIE-Lite-8K-0922 0.024元/千tokens 0.008元/千tokens
ERNIE Lite ERNIE-Lite-8K-0725 0.024元/千tokens 0.008元/千tokens
ERNIE Lite ERNIE-Lite-4K-0704 0.024元/千tokens 0.008元/千tokens
ERNIE Lite ERNIE-Lite-4K-0516 0.024元/千tokens 0.008元/千tokens
Llama-2 Qianfan-Chinese-Llama-2-7B 0.012元/千tokens 0.004元/千tokens
Llama-2 Qianfan-Chinese-Llama-2-7B-32K 0.012元/千tokens 0.004元/千tokens
Llama-2 Qianfan-Chinese-Llama-2-13B 0.018元/千tokens 0.006元/千tokens
ChatGLM chatglm2-6b 0.012元/千tokens 0.004元/千tokens
ChatGLM chatglm2-6b-32k 0.012元/千tokens 0.004元/千tokens
Baichuan2 Baichuan2-7B-Chat 0.012元/千tokens 0.004元/千tokens
Baichuan2 Baichuan2-13B-Chat 0.018元/千tokens 0.006元/千tokens
SQLCoder-7B sqlcoder-7b 0.012元/千tokens 0.004元/千tokens
CodeLlama CodeLlama-7b-Instruct 0.012元/千tokens 0.004元/千tokens
BLOOMZ-7B BLOOMZ-7B 0.012元/千tokens 0.004元/千tokens

重要说明:

  • SFT微调模型发布为按token后付费的服务,不支持选择算力单元数量,只支持小流量体验使用
  • 支持SFT微调模型按token后付费的资源有限,当资源被占满时,用户将无法发布
  • 1个智能云账户只能发布一个SFT微调模型按token后付费服务
上一篇
模型
下一篇
平台功能计费