资讯 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

模型服务计费

模型价格

文本生成

按量后付费

模型名称 版本名称 服务内容 子项 在线推理 批量推理 单位
ERNIE 4.5 Turbo ERNIE-4.5-Turbo-128K-Preview
ERNIE-4.5-Turbo-128K
ERNIE-4.5-Turbo-32K
推理服务 输入 0.0008 0.00032 元/千tokens
命中缓存 0.0002 -- 元/千tokens
输出 0.0032 0.00128 元/千tokens
搜索增强 触发 0.004 0.0016 元/次
ERNIE 4.5 Turbo VL ERNIE-4.5-Turbo-VL-Preview
ERNIE-4.5-Turbo-VL
ERNIE-4.5-Turbo-VL-32K
ERNIE-4.5-Turbo-VL-32K-Preview
推理服务 输入 0.003 0.0012 元/千tokens
命中缓存 0.00075 -- 元/千tokens
输出 0.009 0.0036 元/千tokens
ERNIE 4.5 ERNIE-4.5-8K 推理服务 输入 0.004 0.0016 元/千tokens
输出 0.016 0.0064 元/千tokens
搜索增强 触发 0.004 0.0016 元/次
ERNIE 4.5 ERNIE-4.5-VL-28B-A3B
如开启思考模式计费详情请查看深度思考
推理服务 输入 0.001 0.0004 元/千tokens
输出
0.004 0.0016 元/千tokens
ERNIE 4.5 ERNIE-4.5-0.3B 推理服务 输入 0.0001 0.00004 元/千tokens
输出 0.0004 0.00016 元/千tokens
ERNIE 4.5 ERNIE-4.5-21B-A3B 推理服务 输入 0.0005 0.0002 元/千tokens
输出 0.002 0.0008 元/千tokens
ERNIE 4.0 Turbo ERNIE-4.0-Turbo-8K
ERNIE-4.0-Turbo-128K
ERNIE-4.0-Turbo-8K-Preview
推理服务 输入 0.003 0.0012 元/千tokens
输出 0.009 0.0036 元/千tokens
搜索增强 触发 0.004 0.0016 元/次
ERNIE 4.0 ERNIE-4.0-8K
ERNIE-4.0-8K-Preview
推理服务 输入 0.004 0.0016 元/千tokens
输出 0.016 0.0064 元/千tokens
搜索增强 触发 0.004 0.0016 元/次
ERNIE 3.5 ERNIE-3.5-8K
ERNIE-3.5-128K
ERNIE-3.5-8K-Preview
推理服务 输入 0.0008 0.00032 元/千tokens
输出 0.002 0.0008 元/千tokens
搜索增强 触发 0.004 0.0016 元/次
DeepSeek-V3 DeepSeek-V3 推理服务 输入 0.002 0.0008 元/千tokens
输出 0.008 0.0032 元/千tokens
搜索增强 触发 0.004 0.0016 元/次
Kimi-K2-Instruct Kimi-K2-Instruct 推理服务 输入 0.004 0.0016 元/千tokens
输出 0.016 0.0064 元/千tokens
ERNIE Speed Pro ERNIE-Speed-Pro-128K 推理服务 输入 0.0003 0.00012 元/千tokens
输出 0.0006 0.00024 元/千tokens
ERNIE Lite Pro ERNIE-Lite-Pro-128K 推理服务 输入 0.0002 0.00008 元/千tokens
输出 0.0004 0.00016 元/千tokens
ERNIE Speed ernie-speed-128k
ernie-speed-8k
推理服务 输入 0 0.00012 元/千tokens
输出 0 0.00024 元/千tokens
ERNIE Lite ernie-lite-8k 推理服务 输入 0 0.0012 元/千tokens
输出 0 0.0024 元/千tokens
ERNIE Tiny ernie-tiny-8k 推理服务 输入 0 0.00008 元/千tokens
输出 0 0.00016 元/千tokens
ERNIE Character ernie-char-8k
ernie-char-fiction-8k
ernie-char-fiction-8k-preview
推理服务 输入 0.0003 0.00012 元/千tokens
输出 0.0006 0.00024 元/千tokens
ERNIE Novel ernie-novel-8k 推理服务 输入 0.04 -- 元/千tokens
输出 0.12 -- 元/千tokens
Qianfan-8B Qianfan-8B 推理服务 输入 0.0005 0.0008 元/千tokens
输出 0.001 0.0008 元/千tokens
Qianfan-70B Qianfan-70B 推理服务 输入 0.0008 0.0025 元/千tokens
输出 0.0032 0.0025 元/千tokens
Qianfan-Agent Qianfan-Agent-Intent-32K 推理服务 输入 0.0004 - 元/千tokens
输出 0.0012 - 元/千tokens
Qianfan-Sug Qianfan-Sug 推理服务 输入 0.0003 0.00012 元/千tokens
输出 0.0006 0.00024 元/千tokens
Qianfan-Check-VL qianfan-check-vl 推理服务 输入 0.00125 0.0005 元/千tokens
输出 0.00375 0.0015 元/千tokens
Qwen3 Qwen3-Coder-480B-A35B-Instruct 推理服务
输入Token数:[0,32k]
输入 0.006 0.0024 元/千tokens
输出 0.024 0.0096 元/千tokens
推理服务
输入Token数:(32k,128k]
输入 0.009 0.0036 元/千tokens
输出 0.036 0.0144 元/千tokens
Qwen3 Qwen3-Coder-30B-A3B-Instruct 推理服务
输入Token数:[0,32k]
输入 0.0015 0.0006 元/千tokens
输出 0.006 0.0024 元/千tokens
推理服务
输入Token数:(32k,128k]
输入 0.00225 0.0009 元/千tokens
输出 0.009 0.0036 元/千tokens
Qwen3 Qwen3-235B-A22B-Instruct-2507 推理服务 输入 0.002 0.0008 元/千tokens
输出 0.008 0.0032 元/千tokens
Qwen3 Qwen3-30B-A3B-Instruct-2507 推理服务 输入 0.00075 0.0003 元/千tokens
输出 0.003 0.0012 元/千tokens
Qwen3 Qwen3-235B-A22B
如开启思考模式计费详情请查看深度思考
推理服务 输入 0.002 0.0008 元/千tokens
输出 0.008 0.0032 元/千tokens
Qwen3 Qwen3-30B-A3B
如开启思考模式计费详情请查看深度思考
推理服务 输入 0.00075 0.0003 元/千tokens
输出 0.003 0.0012 元/千tokens
Qwen3 Qwen3-32B
如开启思考模式计费详情请查看深度思考
推理服务 输入 0.002 0.0008 元/千tokens
输出 0.008 0.0032 元/千tokens
Qwen3 Qwen3-14B
如开启思考模式计费详情请查看深度思考
推理服务 输入 0.001 0.0004 元/千tokens
输出 0.004 0.0016 元/千tokens
Qwen3 Qwen3-8B
如开启思考模式计费详情请查看深度思考
推理服务 输入 0.0005 0.0002 元/千tokens
输出 0.002 0.0008 元/千tokens
Qwen3 Qwen3-4B
如开启思考模式计费详情请查看深度思考
推理服务 输入 0.0003 0.00012 元/千tokens
输出 0.0012 0.00048 元/千tokens
Qwen3 Qwen3-1.7B
如开启思考模式计费详情请查看深度思考
推理服务 输入 0.0003 0.00012 元/千tokens
输出 0.0012 0.00048 元/千tokens
Qwen3 Qwen3-0.6B
如开启思考模式计费详情请查看深度思考
推理服务 输入 0.0003 0.00012 元/千tokens
输出 0.0012 0.00048 元/千tokens
Qwen2.5 Qwen2.5-7B-Instruct 推理服务 输入 0.0005 0.0002 元/千tokens
输出 0.001 0.0004 元/千tokens
GLM-4-32B-0414 GLM-4-32B-0414 推理服务 输入 0.001 0.0018 元/千tokens
输出 0.004 0.0018 元/千tokens
Llama-4-Maverick Llama-4-Maverick-17B-128E-Instruct 推理服务 输入 0.007 0.0028 元/千tokens
输出 0.021 0.0084 元/千tokens
Llama-4-Scout Llama-4-Scout-17B-16E-Instruct 推理服务 输入 0.006 0.0024 元/千tokens
输出 0.018 0.0072 元/千tokens
Meta-Llama-3-8B Meta-Llama-3-8B 推理服务 输入 0.004 0.0008 元/千tokens
输出 0.004 0.0008 元/千tokens
Meta-Llama-3-70B Meta-Llama-3-70B 推理服务 输入 0.035 0.0025 元/千tokens
输出 0.035 0.0025 元/千tokens
Qianfan-Chinese-Llama-2-13B Qianfan-Chinese-Llama-2-13B 推理服务 输入 0.006 0.0018 元/千tokens
输出 0.006 0.0018 元/千tokens
Qianfan-FuncCaller Qianfan-FuncCaller 推理服务 输入 0.0008 0.00032 元/千tokens
输出 0.0032 0.00128 元/千tokens
Qianfan-ToyTalk Qianfan-ToyTalk 推理服务 输入 0.0001 0.00004 元/千tokens
输出 0.0002 0.00008 元/千tokens

按量包付费

注:文档中的商品价格可能存在延迟,最终价格以订单页为准。

量包名称 量包额度(Tokens) 服务速率限制 有效期 原价(元) 折扣率 折后价(元)
ERNIE-4.0-8K
系列预置服务共享量包
1000万 TPM = 800K
RPM = 10K
6个月 70 90% 63
5000万 TPM = 800K
RPM = 10K
6个月 350 80% 280
1亿 TPM =1040K
RPM = 10K
12个月 700 80% 560
5亿 TPM = 5200K
RPM = 10K
12个月 3,500 75% 2,625
10亿 TPM = 10400K
RPM = 10K
12个月 7,000 70% 4,900
ERNIE-3.5-8K
系列预置服务共享量包
5,000万 TPM = 800K
RPM = 10K
6个月 55 92% 50.60
1亿 TPM = 800K
RPM = 10K
12个月 110 90% 99
5亿 TPM = 800K
RPM = 10K
12个月 550 80% 440
10亿 TPM =1040K
RPM = 10K
12个月 1,100 80% 880
50亿 TPM = 5200K
RPM = 10K
12个月 5,500 75% 4,125
100亿 TPM =10400K
RPM = 10K
12个月 11,000 70% 7,700
ERNIE-4.0-Turbo-8K
系列预置服务共享量包
1,000万 TPM = 800K
RPM = 10K
6个月 45 90% 40.5
5,000万 TPM = 800K
RPM = 10K
6个月 225 80% 180
1亿 TPM =1040K
RPM = 10K
12个月 450 80% 360
5亿 TPM = 5200K
RPM = 10K
12个月 2,250 75% 1,687.5
10亿 TPM =10400K
RPM = 10K
12个月 4,500 70% 3,150
ERNIE-3.5-128K
系列预置服务共享量包
1亿 TPM = 400K
RPM = 5K
12个月 110 90% 99
5亿 TPM = 400K
RPM = 5K
12个月 550 80% 440
10亿 TPM = 800K
RPM = 5K
12个月 1,100 80% 880
50亿 TPM = 4000K
RPM = 5K
12个月 5,500 75% 4,125
ERNIE-Lite-Pro-128K
系列预置服务共享量包
1亿 TPM = 800K
RPM = 10K
12个月 25 90% 22.5
10亿 TPM = 800K
RPM = 10K
12个月 250 85% 212.50
50亿 TPM = 800K
RPM = 10K
12个月 1,250 80% 1,000
ERNIE-Speed-Pro-128K
系列预置服务共享量包
1亿 TPM = 800K
RPM = 10K
12个月 37.5 90% 33.75
10亿 TPM = 800K
RPM = 10K
12个月 375 85% 318.75
50亿 TPM = 800K
RPM = 10K
12个月 1,875 80% 1,500
ERNIE-4.0-Turbo-128K
系列预置服务共享量包
1亿 TPM = 400K
RPM = 5K
12个月 450 90% 405
5亿 TPM = 400K
RPM = 5K
12个月 2,250 80% 1,800
10亿 TPM = 800K
RPM = 5K
12个月 3,600 80% 2,880
ERNIE-4.5-Turbo-32K
系列预置服务共享量包
1亿 TPM = 400K
RPM = 5K
6个月 140 90% 126
5亿 TPM = 600K
RPM = 5K
6个月 700 85% 595
10亿 TPM = 1000K
RPM = 5K
6个月 1,400 80% 1,120
ERNIE-4.5-Turbo-128K
系列预置服务共享量包
1亿 TPM = 400K
RPM = 5K
6个月 140 90% 126
5亿 TPM = 600K
RPM = 5K
6个月 700 85% 595
10亿 TPM = 1000K
RPM = 5K
6个月 1,400 80% 1,120
ERNIE-4.5-Turbo-VL-32K
系列预置服务共享量包
1亿 TPM = 200K
RPM = 1K
6个月 450 90% 405
5亿 TPM = 300K
RPM = 1K
6个月 2,250 85% 1,912.5
10亿 TPM = 500K
RPM = 1K
6个月 4,500 80% 3,600

按TPM付费

注:文档中的商品价格可能存在延迟,最终价格以订单页为准。

TPM类型:输入输出混合TPM
模型名称 版本名称 单位规格 预付费(元/个/月) 后付费(元/个/小时)
原价 活动价 原价 活动价
ERNIE 4.5 ERNIE-4.5-8K-Preview TPM = 10000
RPM = 33
3024 3024 6.5 6.5
ERNIE 4.0 ERNIE-4.0-8K TPM = 10000
RPM = 33
27000 1512 55 3.2
ERNIE-4.0-8K-Preview TPM = 10000
RPM = 33
27000 1512 55 3.2
ERNIE 4.0 Turbo ERNIE-4.0-Turbo-8K TPM = 10000
RPM = 33
12000 972 25 2
ERNIE-4.0-Turbo-128K TPM = 10000
RPM = 33
12000 972 25 2
ERNIE-4.0-Turbo-8K-Preview TPM = 10000
RPM = 33
12000 972 25 2
ERNIE-4.0-Turbo-8K-0628 TPM = 10000
RPM = 33
12000 972 25 2
ERNIE-4.0-Turbo-8K-latest TPM = 10000
RPM = 33
12000 972 25 2
ERNIE 3.5 ERNIE-3.5-8K TPM = 10000
RPM = 33
4250 237.6 10 0.5
ERNIE-3.5-128K TPM = 10000
RPM = 2
17000 237.6 40 0.5
ERNIE-3.5-8K-Preview TPM = 10000
RPM = 33
4250 237.6 10 0.5
ERNIE-3.5-128K-Preview TPM = 10000
RPM = 33
17000 237.6 40 0.5
ERNIE Lite ERNIE-Lite-8K TPM = 10000
RPM = 33
1200 54 3 0.12
ERNIE Lite Pro ERNIE-Lite-Pro-128K TPM = 10000
RPM = 2
109.8 54.9 0.225 0.1125
ERNIE Speed Pro ERNIE-Speed-Pro-128K TPM = 10000
RPM = 2
164.7 82.35 0.3375 0.16875
ERNIE Speed ERNIE-Speed-8K TPM = 10000
RPM = 33
1900 81 5 0.2
ERNIE-Speed-128K TPM = 10000
RPM = 2
7600 81 20 0.2
ERNIE Tiny ERNIE-Tiny-8K TPM = 10000
RPM = 33
400 400 1 1
ERNIE Character ERNIE-Character-8K TPM = 10000
RPM = 33
1900 1900 5 5
ERNIE-Character-Fiction-8K TPM = 10000
RPM = 33
1900 1900 5 5
ERNIE Novel ERNIE-Novel-8K TPM = 10000
RPM = 33
27000 1512 55 3.2
Qwen2.5 Qwen2.5-7B-Instruct TPM = 10000
RPM = 33
270 270 0.56 0.56
Qwen3 Qwen3-32B TPM = 10000
RPM = 20
1512 1512 3.15 3.15
TPM类型:输入输出拆分TPM
模型名称 版本名称 子项 单位规格 预付费价格(单位:元/个/月)
原价 活动价
ERNIE 4.5 Turbo ERNIE-4.5-Turbo-32K 输入 10k 346 242
输出 1k 138.2 96.8
ERNIE-4.5-Turbo-128K 输入 10k 346 242
输出 1k 138.2 96.8
ERNIE 4.5 Turbo VL ERNIE-4.5-Turbo-VL-32K 输入 10k 1296 907
输出 1k 388.8 272.2
DeepSeek-V3 DeepSeek-V3 输入 10k 864 604.8
输出 1k 345.6 241.92

备注信息: RPM = Max(服务总输入TPM/10k,服务总输出TPM/1k) * 20

视觉理解

按量后付费

模型名称 版本名称 服务内容 子项 在线推理 批量推理 单位
ERNIE 4.5 Turbo VL ERNIE-4.5-Turbo-VL-Preview
ERNIE-4.5-Turbo-VL
ERNIE-4.5-Turbo-VL-32K
ERNIE-4.5-Turbo-VL-32K-Preview
推理服务 输入 0.003 0.0012 元/千tokens
输出 0.009 0.0036 元/千tokens
ERNIE 4.5 ERNIE-4.5-8K 推理服务 输入 0.004 0.0016 元/千tokens
输出 0.016 0.0064 元/千tokens
搜索增强 触发 0.004 0.0016 元/次
ERNIE 4.5 ERNIE-4.5-VL-28B-A3B
如开启思考模式计费详情请查看深度思考
推理服务 输入 0.001 0.0004 元/千tokens
输出
0.004 0.0016 元/千tokens
Llama-4-Maverick Llama-4-Maverick-17B-128E-Instruct 推理服务 输入 0.007 0.0028 元/千tokens
输出 0.021 0.0084 元/千tokens
Llama-4-Scout Llama-4-Scout-17B-16E-Instruct 推理服务 输入 0.006 0.0024 元/千tokens
输出 0.018 0.0072 元/千tokens
Qianfan-Llama-VL-8B Qianfan-Llama-VL-8B 推理服务 输入 0.002 0.0008 元/千tokens
输出 0.005 0.002 元/千tokens
Qianfan-QI-VL Qianfan-QI-VL 推理服务 输入 0.0015 0.0006 元/千tokens
输出 0.0045 0.0018 元/千tokens
Qianfan-MultiPicOCR Qianfan-MultiPicOCR 推理服务 输入 0.0025 0.001 元/千tokens
输出 0.0075 0.003 元/千tokens
Qianfan-PublicOpinion-Classification Qianfan-PublicOpinion-Classification 推理服务 输入 0.0015 0.0006 元/千tokens
输出 0.0045 0.0018 元/千tokens
Qianfan-Composition Qianfan-Composition 推理服务 输入 0.0025 0.001 元/千tokens
输出 0.0075 0.003 元/千tokens
Qwen2.5-VL Qwen2.5-VL-7B-Instruct 推理服务 输入 0.002 0.0008 元/千tokens
输出 0.005 0.002 元/千tokens
Qwen2.5-VL Qwen2.5-VL-32B-Instruct 推理服务 输入 0.008 - 元/千tokens
输出 0.024 - 元/千tokens
InternVL3 InternVL3-38B 推理服务 输入 0.008 0.0032 元/千tokens
输出 0.024 0.0096 元/千tokens
InternVL3 InternVL3-14B 推理服务 输入 0.004 0.0016 元/千tokens
输出 0.012 0.0048 元/千tokens
InternVL3 InternVL3-1B 推理服务 输入 0.0004 0.00016 元/千tokens
输出 0.0012 0.00048 元/千tokens
InternVL2_5 InternVL2_5-38B-MPO 推理服务 输入 0.008 - 元/千tokens
输出 0.024 - 元/千tokens
DeepSeek-VL2 DeepSeek-VL2 推理服务 输入 0.00099 - 元/千tokens
输出 0.00099 - 元/千tokens
DeepSeek-VL2 DeepSeek-VL2-Small 推理服务 输入 0.0005 - 元/千tokens
输出 0.0005 - 元/千tokens

按TPM付费

注:文档中的商品价格可能存在延迟,最终价格以订单页为准。

TPM类型:输入输出拆分TPM
模型名称 版本名称 子项 单位规格 预付费价格(单位:元/个/月)
原价 活动价
ERNIE 4.5 Turbo VL ERNIE-4.5-Turbo-VL-32K 输入 10k 1296 907
输出 1k 388.8 272.2

备注信息: RPM = Max(服务总输入TPM/10k,服务总输出TPM/1k) * 20

深度思考

按量后付费

模型名称 版本名称 服务内容 子项 在线推理 批量推理 单位
ERNIE X1 Turbo ERNIE-X1-Turbo-32K
ERNIE-X1-Turbo-32K-Preview
推理服务 输入 0.001 0.0004 元/千tokens
输出 0.004 0.0016 元/千tokens
ERNIE 4.5 ERNIE-4.5-VL-28B-A3B
如未启用思考模式计费详情请查看文本生成
推理服务 输入 0.001 0.0004 元/千tokens
输出 0.01 0.004 元/千tokens
DeepSeek-R1 DeepSeek-R1-250528 推理服务 输入 0.004 0.0016 元/千tokens
输出 0.016 0.0064 元/千tokens
搜索增强 触发 0.004 0.0016 元/次
DeepSeek-R1 DeepSeek-R1 推理服务 输入 0.004 0.0016 元/千tokens
输出 0.016 0.0064 元/千tokens
搜索增强 触发 0.004 0.0016 元/次
DeepSeek-R1-Distill-Qianfan-70B DeepSeek-R1-Distill-Qianfan-70B 推理服务 输入 0.002 0.008 元/千tokens
输出 0.008 0.0032 元/千tokens
DeepSeek-R1-Distill-Qianfan-8B DeepSeek-R1-Distill-Qianfan-8B 推理服务 输入 0.001 0.0004 元/千tokens
输出 0.004 0.00016 元/千tokens
DeepSeek-R1-Distill-Qianfan-Llama-70B DeepSeek-R1-Distill-Qianfan-Llama-70B 推理服务 输入 0.002 0.0008 元/千tokens
输出 0.008 0.0032 元/千tokens
DeepSeek-R1-Distill-Qianfan-Llama-8B DeepSeek-R1-Distill-Qianfan-Llama-8B 推理服务 输入 0.001 0.0004 元/千tokens
输出 0.004 0.00016 元/千tokens
DeepSeek-R1-Distill-Llama-70B DeepSeek-R1-Distill-Llama-70B 推理服务 输入 0.002 0.0008 元/千tokens
输出 0.008 0.0032 元/千tokens
DeepSeek-R1-Distill-Llama-8B DeepSeek-R1-Distill-Llama-8B 推理服务 输入 0.001 0.0004 元/千tokens
输出 0.004 0.00016 元/千tokens
DeepSeek-R1-Distill-Qwen-32B DeepSeek-R1-Distill-Qwen-32B 推理服务 输入 0.0015 0.0006 元/千tokens
输出 0.006 0.0024 元/千tokens
DeepSeek-R1-Distill-Qwen-14B DeepSeek-R1-Distill-Qwen-14B 推理服务 输入 0.0006 0.00024 元/千tokens
输出 0.0024 0.00096 元/千tokens
DeepSeek-R1-Distill-Qwen-7B DeepSeek-R1-Distill-Qwen-7B 推理服务 输入 0.0005 0.0002 元/千tokens
输出 0.002 0.0008 元/千tokens
DeepSeek-R1-Distill-Qwen-1.5B DeepSeek-R1-Distill-Qwen-1.5B 推理服务 输入 0.0003 0.00012 元/千tokens
输出 0.0012 0.00048 元/千tokens
GLM-Z1-32B-0414 GLM-Z1-32B-0414 推理服务 输入 0.002 0.0018 元/千tokens
输出 0.008 0.0018 元/千tokens
GLM-Z1-Rumination-32B-0414 GLM-Z1-Rumination-32B-0414 推理服务 输入 0.005 0.0018 元/千tokens
输出 0.02 0.0018 元/千tokens
Qwen3 Qwen3-235B-A22B-Thinking-2507 推理服务 输入 0.002 0.0008 元/千tokens
输出 0.02 0.008 元/千tokens
Qwen3 Qwen3-30B-A3B-Thinking-2507 推理服务 输入 0.00075 0.0003 元/千tokens
输出 0.0075 0.003 元/千tokens
Qwen3 Qwen3-235B-A22B
如未启用思考模式计费详情请查看文本生成
推理服务 输入 0.002 0.0008 元/千tokens
输出 0.02 0.008 元/千tokens
Qwen3 Qwen3-30B-A3B
如未启用思考模式计费详情请查看文本生成
推理服务 输入 0.00075 0.0003 元/千tokens
输出 0.0075 0.003 元/千tokens
Qwen3 Qwen3-32B
如未启用思考模式计费详情请查看文本生成
推理服务 输入 0.002 0.0008 元/千tokens
输出 0.02 0.008 元/千tokens
Qwen3 Qwen3-14B
如未启用思考模式计费详情请查看文本生成
推理服务 输入 0.001 0.0004 元/千tokens
输出 0.01 0.004 元/千tokens
Qwen3 Qwen3-8B
如未启用思考模式计费详情请查看文本生成
推理服务 输入 0.0005 0.0002 元/千tokens
输出 0.005 0.002 元/千tokens
Qwen3 Qwen3-4B
如未启用思考模式计费详情请查看文本生成
推理服务 输入 0.0003 0.00012 元/千tokens
输出 0.003 0.0012 元/千tokens
Qwen3 Qwen3-1.7B
如未启用思考模式计费详情请查看文本生成
推理服务 输入 0.0003 0.00012 元/千tokens
输出 0.003 0.0012 元/千tokens
Qwen3 Qwen3-0.6B
如未启用思考模式计费详情请查看文本生成
推理服务 输入 0.0003 0.00012 元/千tokens
输出 0.003 0.0012 元/千tokens
QWQ-32B QWQ-32B 推理服务 输入 0.002 0.0008 元/千tokens
输出 0.006 0.0024 元/千tokens
Qianfan-Correct Qianfan-Correct 推理服务 输入 0.0006 0.00024 元/千tokens
输出 0.006 0.0024 元/千tokens

按量包付费

注:文档中的商品价格可能存在延迟,最终价格以订单页为准。

量包名称 量包额度(Tokens) 服务速率限制 有效期 原价(元) 折扣率 折后价(元)
DeepSeek-V3
系列预置服务共享量包
1亿 TPM = 1000K
RPM = 5,000
3个月 350 90% 315
5亿 TPM = 1500K
RPM = 5,000
3个月 1,750 85% 1,487.5
10亿 TPM = 2000K
RPM = 5,000
3个月 3,500 80% 2,800
DeepSeek-R1
系列预置服务共享量包
1亿 TPM = 1000K
RPM = 5,000
3个月 700 90% 630
5亿 TPM = 1500K
RPM = 5,000
3个月 3,500 85% 2,975
10亿 TPM = 2000K
RPM = 5,000
3个月 7,000 80% 5,600
ERNIE-X1-Turbo-32K
系列预置服务共享量包
1亿 TPM = 300K
RPM = 900
6个月 175 90% 157.5
5亿 TPM = 450K
RPM = 900
6个月 875 85% 743.75
10亿 TPM = 750K
RPM = 900
6个月 1,750 80% 1,400

按TPM付费

注:文档中的商品价格可能存在延迟,最终价格以订单页为准。

输入输出混合TPM
模型名称 版本名称 单位规格 预付费(元/个/月) 后付费(元/个/小时)
原价 活动价 原价 活动价
DeepSeek-R1-Distill-Qwen-32B DeepSeek-R1-Distill-Qwen-32B TPM = 10000
RPM = 33
1135 1135 - -
DeepSeek-R1-Distill-Qwen-14B DeepSeek-R1-Distill-Qwen-14B TPM = 10000
RPM = 33
454 454 - -
TPM类型:输入输出拆分TPM
模型名称 版本名称 子项 单位规格 预付费价格(单位:元/个/月)
原价 活动价
ERNIE X1 Turbo ERNIE-X1-Turbo-32K 输入 10k 432 302
输出 1k 172.8 121
DeepSeek-R1 DeepSeek-R1 输入 10k 1728 1209.6
输出 1k 691.2 483.84
DeepSeek-R1 DeepSeek-R1-250528 输入 10k 1728 1209.6
输出 1k 691.2 483.84

备注信息: RPM = Max(服务总输入TPM/10k,服务总输出TPM/1k) * 20

图像生成

模型 服务内容 单价 规格
irag-1.0 推理服务 0.14元/张 1024x1024
FLUX.1-schnell 推理服务 限时0.002元/张 -

图像编辑

模型 服务内容 单价 单位
ernie-irag-edit 推理服务 0.14 元/张

视频生成

视频生成模型采用积分定价方式,单次调用消耗=单位积分价格×消耗积分数,不同模型单位积分价格不同。

MuseSteamer(蒸汽机)

单位积分价格:1元/积分,不用模型和配置消耗积分数不同,详见下表:

图生视频
模型名称 视频时长(秒) 0903前 0903后
消耗积分 调用消耗(元) 消耗积分 调用消耗(元)
MuseSteamer-2.0-Turbo-I2V-Audio 5 1.4 1.4 2.5 2.5
10秒 2.8 2.8 4.2 4.2
MuseSteamer-2.0-Turbo-I2V 5 1.4 1.4 1.4 1.4
MuseSteamer-2.0-Pro-I2V 5 2.5 2.5 2.5 2.5
MuseSteamer-2.0-Lite-I2V 5 0.7 0.7 0.7 0.7
视频特效
模型名称 视频时长(秒) 模板名称 0903前 0903后
消耗积分 调用消耗(元) 消耗积分 调用消耗(元)
MuseSteamer-2.0-Turbo-Effect 5 捏捏乐 1.4 1.4 1.4 1.4
手办秀场 1.4 1.4 1.4 1.4
万物冰淇淋 1.4 1.4 1.4 1.4
膨胀气球 1.4 1.4 1.4 1.4
万物毛绒 1.4 1.4 1.4 1.4
冰爽一夏 1.4 1.4 1.4 1.4
古风换装 1.4 1.4 1.4 1.4
收到花花 1.4 1.4 1.4 1.4
一键果冻 1.4 1.4 1.4 1.4
剪纸世界 1.4 1.4 1.4 1.4

文本向量

模型名称 服务内容 子项 单价 单位
Embedding-V1 推理服务 输入 0.0005 元/千tokens
bge-large-zh 推理服务 输入 0.0005 元/千tokens
bge-large-en 推理服务 输入 0.0005 元/千tokens
tao-8k 推理服务 输入 0.0005 元/千tokens
Qwen3-Embedding-0.6B 推理服务 输入 0.0005 元/千tokens
Qwen3-Embedding-4B 推理服务 输入 0.0005 元/千tokens
Qwen3-Embedding-8B 推理服务 输入 0.0005 元/千tokens

多模态向量

模型名称 版本名称 服务内容 子项 单价 单位
gme-Qwen2-VL-2B-Instruct gme-Qwen2-VL-2B-Instruct 推理服务
输入 0.001 元/千tokens

重排序

模型名称 服务内容 子项 单价 单位
bce-reranker-base 推理服务 输入 0.0005 元/千tokens
Qwen3-Reranker-4B 推理服务 输入 0.0008 元/千tokens

模型内置工具价格

联网搜索

按次使用量后付费

基于用户query,大模型自动判断是否触发联网搜索查询相关文献。如果触发联网搜索,则基于搜索结果进行总结回答。如果不触发联网搜索,大模型直接回答。

触发联网搜索包括两部分费用:

  • 按次收费:如果触发搜索,会收取一次联网搜索费用,单次价格见下面表格。
  • 联网搜索search_tokens费用:联网搜索会将检索到的内容输入给大模型,导致输入模型tokens增加,在推理接口返回的usage.prompt_tokens_details.search_tokens当中体现。
服务内容 单价 单位
搜索增强 0.004 元/次

欠费账户继续推送计费说明:如果你购买了tokens量包预付费/tpm预付费,即使账户欠费,大模型服务调用依然正常。如果此时触发联网搜索,会继续向您的账户推送联网搜索0.004元/次的billing账单。只有当tokens量包预付费使用完毕或者tpm预付费到期,才会停止触发联网搜索。

按次量包预付费

触发搜索增强时,如已购买搜索增强量包,则会优先抵扣量包,量包耗尽或过期后恢复至按次计费。

当前规格及计费如下所示:

次数 有效期 原价 折扣率 折后价
10000次      6个月      ¥40    95%   ¥38   
50000次      6个月      ¥200   95%   ¥190

阅读助手插件

按次使用量后付费

基于plugins入参和用户query,模型自动判断是否调起插件。如果触发插件,则基于文档内容总结回复。如果不触发,大模型直接回答。

触发插件回复包含两部分费用:

  • 按次收费:如果触发插件,会收取一次插件费用,单次价格见下面表格。
  • plugin_tokens费用:触发阅读助手插件后,插件会读取需要阅读的文档/网页内容,并对用户的prompt进行一定扩写,导致输入模型的token增加,在推理接口返回的usage.prompt_tokens_details.plugin_tokens
插件 服务内容 单价
阅读助手插件 推理服务 ¥0.01元/每次

欠费账户继续推送计费说明:如果你购买了tokens量包预付费/tpm预付费,即使账户欠费,大模型服务调用依然正常。如果此时触发阅读助手插件,会继续向您的账户推送阅读助手插件0.01元/次的billing账单。只有当tokens量包预付费使用完毕或者tpm预付费到期,才会停止触发阅读助手插件。

算力单元价格

购买算力单元限时5折起优惠,活动时间:2024年11月13日~2025年6月30日。

当您通过购买算力单元部署服务时,付费信息选择分为以下两种方式:

  • 预付费:需要提前一次性支付所选时间段内的费用,这种模式价格相较于后付费模式更低廉。
  • 后付费:按资源的使用时长收费,不需要提前支付费用,这种模式比预付费模式价格高一些。

预付费

预付费购买的算力单元,按月计费,购买成功后开始计时。具体价格如下:

资源类型 规格 原单价(元/月) 折后价(元/月)
AI加速卡Ⅰ型 1个算力单元 15,000 (5折后) 7,500
AI加速卡Ⅴ型 1个算力单元 9,000 (5折后) 4,500
AI加速卡Ⅵ型 1个算力单元 9,000 (5折后) 4,500
AI加速卡Ⅶ型 1个算力单元 15,000 (5折后) 7,500
CPU 1个算力单元 3,900 (5折后) 1,950

预付费购买的算力单元支持开启/关闭自动续费功能,您可在千帆产品控制台按需设置。

使用中状态的预付费算力单元支持变配(仅升配)功能,您可在千帆产品控制台按需使用。资源变配可能会带来额外的消费,计费规则如下:

  • 公式:(新配置单价- 旧配置单价)* 原订单剩余时长(大于24小时,向下取整;小于24小时,向上取整)
  • 例如:剩余时间为5天时发起扩容,扩容当天不收费,只收取剩余5天的扩容费用;剩余时间为8小时时,扩容收取当天全天的费用;

后付费

后付费购买的算力单元,按分钟计费,按小时出账。使用时长小于15分钟按15分钟收费,超过15分钟按照实际使用时长收费。具体价格如下:

资源类型 规格 原单价(元/分钟) 折后价(元/分钟)
AI加速卡Ⅰ型 1个算力单元 0.52 (5折后) 0.26
AI加速卡Ⅴ型 1个算力单元 0.32 (5折后) 0.16
AI加速卡Ⅵ型 1个算力单元 0.32 (5折后) 0.16
AI加速卡Ⅶ型 1个算力单元 0.52 (5折后) 0.26
CPU 1个算力单元 0.17 (5折后) 0.085

后付费购买的算力单元支持设置定时释放时间,默认处于关闭状态,您可在千帆产品控制台按需设置。

使用中状态的后付费算力单元支持变配(升配/降配)功能,您可在千帆产品控制台按需使用。后付费算力单元根据使用时长后付费,变配成功后,价格会根据新配置自动变更。

价格费用举例

算力单元的开始时间以服务部署成功时间为准。

示例1:预付费购买1个月的AI加速卡Ⅰ型算力单元

单副本算力单元数为2,副本数自定义为2,则最终需要购买的算力单元总数为2*2=4个,购买一个月的总价格为: 1(月) x 2(单副本算力单元) x 2(副本数) x 15,000(元/月x 1副本 x 1算力单元) = 60,000 元
活动期间,购买AI加速卡算力单元享有5折优惠,所以折后价为30,000元。

微调模型按token后付费价格

平台部分基座模型,其微调以后的模型,支持发布为按token后付费的服务,其付费规格如下:

SFT基础模型 模型版本 原价 折扣价
ERNIE Speed ERNIE-Speed-8K 输入:0.012元/千tokens
输出:0.024元/千tokens
输入:0.004元/千tokens
输出:0.008元/千tokens
ERNIE Lite ERNIE-Lite-8K-0308 输入:0.009元/千tokens
输出:0.018元/千tokens
输入:0.003元/千tokens
输出:0.006元/千tokens
ERNIE Lite ERNIE-Lite-8K-0922 0.024元/千tokens 0.008元/千tokens
ERNIE Lite ERNIE-Lite-8K-0725 0.024元/千tokens 0.008元/千tokens
ERNIE Lite ERNIE-Lite-4K-0704 0.024元/千tokens 0.008元/千tokens
ERNIE Lite ERNIE-Lite-4K-0516 0.024元/千tokens 0.008元/千tokens
Llama-2 Qianfan-Chinese-Llama-2-7B 0.012元/千tokens 0.004元/千tokens
Llama-2 Qianfan-Chinese-Llama-2-7B-32K 0.012元/千tokens 0.004元/千tokens
Llama-2 Qianfan-Chinese-Llama-2-13B 0.018元/千tokens 0.006元/千tokens
ChatGLM chatglm2-6b 0.012元/千tokens 0.004元/千tokens
ChatGLM chatglm2-6b-32k 0.012元/千tokens 0.004元/千tokens
Baichuan2 Baichuan2-7B-Chat 0.012元/千tokens 0.004元/千tokens
Baichuan2 Baichuan2-13B-Chat 0.018元/千tokens 0.006元/千tokens
SQLCoder-7B sqlcoder-7b 0.012元/千tokens 0.004元/千tokens
CodeLlama CodeLlama-7b-Instruct 0.012元/千tokens 0.004元/千tokens
BLOOMZ-7B BLOOMZ-7B 0.012元/千tokens 0.004元/千tokens

重要说明:

  • SFT微调模型发布为按token后付费的服务,不支持选择算力单元数量,只支持小流量体验使用
  • 支持SFT微调模型按token后付费的资源有限,当资源被占满时,用户将无法发布
  • 1个智能云账户只能发布一个SFT微调模型按token后付费服务
上一篇
模型
下一篇
平台功能计费