价格
模型价格
原生多模态
模型名称 | 版本名称 | 服务内容 | 子项 | 在线推理 | 批量推理 | 单位 |
---|---|---|---|---|---|---|
ERNIE 4.5 Turbo VL | ERNIE-4.5-Turbo-VL-32K | 推理服务 | 输入 | 0.003 | 0.0012 | 元/千tokens |
推理服务 | 输出 | 0.009 | 0.0036 | 元/千tokens | ||
ERNIE 4.5 | ERNIE-4.5-8K | 推理服务 | 输入 | 0.004 | 0.0016 | 元/千tokens |
推理服务 | 输出 | 0.016 | 0.0064 | 元/千tokens | ||
搜索增强 | 触发 | 0.004 | 0.0016 | 元/次 | ||
Llama-4-Maverick | Llama-4-Maverick-17B-128E-Instruct | 推理服务 | 输入 | 0.007 | 0.0028 | 元/千tokens |
推理服务 | 输出 | 0.021 | 0.0084 | 元/千tokens | ||
Llama-4-Scout | Llama-4-Scout-17B-16E-Instruct | 推理服务 | 输入 | 0.006 | 0.0024 | 元/千tokens |
推理服务 | 输出 | 0.018 | 0.0072 | 元/千tokens |
文本生成
按量后付费
模型名称 | 版本名称 | 服务内容 | 子项 | 在线推理 | 批量推理 | 单位 |
---|---|---|---|---|---|---|
ERNIE 4.5 Turbo | ERNIE-4.5-Turbo-128K ERNIE-4.5-Turbo-32K |
推理服务 | 输入 | 0.0008 | 0.00032 | 元/千tokens |
输出 | 0.0032 | 0.00128 | 元/千tokens | |||
搜索增强 | 触发 | 0.004 | 0.0016 | 元/次 | ||
ERNIE 4.0 Turbo | ERNIE-4.0-Turbo-8K ERNIE-4.0-Turbo-128K ERNIE-4.0-Turbo-8K-Preview |
推理服务 | 输入 | 0.003 | 0.0012 | 元/千tokens |
输出 | 0.009 | 0.0036 | 元/千tokens | |||
搜索增强 | 触发 | 0.004 | 0.0016 | 元/次 | ||
ERNIE 4.0 | ERNIE-4.0-8K ERNIE-4.0-8K-Preview |
推理服务 | 输入 | 0.004 | 0.0016 | 元/千tokens |
输出 | 0.016 | 0.0064 | 元/千tokens | |||
搜索增强 | 触发 | 0.004 | 0.0016 | 元/次 | ||
ERNIE 3.5 | ERNIE-3.5-8K ERNIE-3.5-128K ERNIE-3.5-8K-Preview |
推理服务 | 输入 | 0.0008 | 0.00032 | 元/千tokens |
输出 | 0.002 | 0.0008 | 元/千tokens | |||
搜索增强 | 触发 | 0.004 | 0.0016 | 元/次 | ||
DeepSeek-V3 | DeepSeek-V3 | 推理服务 | 输入 | 0.002 | 0.00032 | 元/千tokens |
输出 | 0.008 | 0.00064 | 元/千tokens | |||
Qianfan-8B | Qianfan-8B | 推理服务 | 输入 | 0.0005 | 0.0008 | 元/千tokens |
输出 | 0.001 | 0.0008 | 元/千tokens | |||
Qianfan-70B | Qianfan-70B | 推理服务 | 输入 | 0.0008 | 0.0025 | 元/千tokens |
输出 | 0.0032 | 0.0025 | 元/千tokens | |||
Qwen3 | Qwen3-235B-A22B 如开启思考模式计费详情请查看深度思考 |
推理服务 | 输入 | 0.004 | - | 元/千tokens |
输出 | 0.012 | - | 元/千tokens | |||
Qwen3 | Qwen3-30B-A3B 如开启思考模式计费详情请查看深度思考 |
推理服务 | 输入 | 0.0015 | - | 元/千tokens |
输出 | 0.006 | - | 元/千tokens | |||
Qwen3 | Qwen3-32B 如开启思考模式计费详情请查看深度思考 |
推理服务 | 输入 | 0.002 | - | 元/千tokens |
输出 | 0.008 | - | 元/千tokens | |||
Qwen3 | Qwen3-14B 如开启思考模式计费详情请查看深度思考 |
推理服务 | 输入 | 0.001 | - | 元/千tokens |
输出 | 0.004 | - | 元/千tokens | |||
Qwen3 | Qwen3-8B 如开启思考模式计费详情请查看深度思考 |
推理服务 | 输入 | 0.0005 | - | 元/千tokens |
输出 | 0.002 | - | 元/千tokens | |||
Qwen3 | Qwen3-4B 如开启思考模式计费详情请查看深度思考 |
推理服务 | 输入 | 0.0003 | - | 元/千tokens |
输出 | 0.0012 | - | 元/千tokens | |||
Qwen3 | Qwen3-1.7B 如开启思考模式计费详情请查看深度思考 |
推理服务 | 输入 | 0.0003 | - | 元/千tokens |
输出 | 0.0012 | - | 元/千tokens | |||
Qwen3 | Qwen3-0.6B 如开启思考模式计费详情请查看深度思考 |
推理服务 | 输入 | 0.0003 | - | 元/千tokens |
输出 | 0.0012 | - | 元/千tokens | |||
Qwen2.5 | Qwen2.5-7B-Instruct | 推理服务 | 输入 | 0.0005 | 0.0002 | 元/千tokens |
输出 | 0.001 | 0.0004 | 元/千tokens | |||
GLM-4-32B-0414 | GLM-4-32B-0414 | 推理服务 | 输入 | 0.001 | 0.0018 | 元/千tokens |
输出 | 0.004 | 0.0018 | 元/千tokens | |||
BLOOMZ-7B | BLOOMZ-7B 即将下线 |
推理服务 | 输入 | 0.004 | 0.0008 | 元/千tokens |
输出 | 0.004 | 0.0008 | 元/千tokens | |||
Meta-Llama-3-8B | Meta-Llama-3-8B | 推理服务 | 输入 | 0.004 | 0.0008 | 元/千tokens |
输出 | 0.004 | 0.0008 | 元/千tokens | |||
Meta-Llama-3-70B | Meta-Llama-3-70B | 推理服务 | 输入 | 0.035 | 0.0025 | 元/千tokens |
输出 | 0.035 | 0.0025 | 元/千tokens | |||
Llama-2-7B-Chat | Llama-2-7B-Chat 即将下线 |
推理服务 | 输入 | 0.004 | 0.0008 | 元/千tokens |
输出 | 0.004 | 0.0008 | 元/千tokens | |||
Llama-2-13B-Chat | Llama-2-13B-Chat 即将下线 |
推理服务 | 输入 | 0.006 | 0.0008 | 元/千tokens |
输出 | 0.006 | 0.0008 | 元/千tokens | |||
Llama-2-70B-Chat | Llama-2-70B-Chat 即将下线 |
推理服务 | 输入 | 0.035 | 0.0025 | 元/千tokens |
输出 | 0.035 | 0.0025 | 元/千tokens | |||
ChatGLM2-6B-32K | ChatGLM2-6B-32K 即将下线 |
推理服务 | 输入 | 0.004 | 0.0008 | 元/千tokens |
输出 | 0.004 | 0.0008 | 元/千tokens | |||
AquilaChat-7B | AquilaChat-7B 即将下线 |
推理服务 | 输入 | 0.004 | 0.0008 | 元/千tokens |
输出 | 0.004 | 0.0008 | 元/千tokens | |||
Mixtral-8x7B-Instruct | Mixtral-8x7B-Instruct 即将下线 |
推理服务 | 输入 | 0.035 | 0.0008 | 元/千tokens |
输出 | 0.035 | 0.0008 | 元/千tokens | |||
SQLCoder-7B | SQLCoder-7B 即将下线 |
推理服务 | 输入 | 0.004 | 0.0008 | 元/千tokens |
输出 | 0.004 | 0.0008 | 元/千tokens | |||
CodeLlama-7B-Instruct | CodeLlama-7B-Instruct 即将下线 |
推理服务 | 输入 | 0.004 | 0.0008 | 元/千tokens |
输出 | 0.004 | 0.0008 | 元/千tokens | |||
XuanYuan-70B-Chat-4bit | XuanYuan-70B-Chat-4bit 即将下线 |
推理服务 | 输入 | 0.035 | 0.0025 | 元/千tokens |
输出 | 0.035 | 0.0025 | 元/千tokens | |||
Qianfan-BLOOMZ-7B-compressed | Qianfan-BLOOMZ-7B-compressed 即将下线 |
推理服务 | 输入 | 0.004 | 0.0008 | 元/千tokens |
输出 | 0.004 | 0.0008 | 元/千tokens | |||
Qianfan-Chinese-Llama-2-7B | Qianfan-Chinese-Llama-2-7B 即将下线 |
推理服务 | 输入 | 0.004 | 0.0008 | 元/千tokens |
输出 | 0.004 | 0.0008 | 元/千tokens | |||
Qianfan-Chinese-Llama-2-13B | Qianfan-Chinese-Llama-2-13B | 推理服务 | 输入 | 0.006 | 0.0018 | 元/千tokens |
输出 | 0.006 | 0.0018 | 元/千tokens | |||
Qianfan-Chinese-Llama-2-70B | Qianfan-Chinese-Llama-2-70B 即将下线 |
推理服务 | 输入 | 0.035 | - | 元/千tokens |
输出 | 0.035 | - | 元/千tokens | |||
Yi-34B-Chat | Yi-34B-Chat 即将下线 |
推理服务 | 输入 | 0.02 | 0.0018 | 元/千tokens |
输出 | 0.02 | 0.0018 | 元/千tokens | |||
Gemma-7B-it | Gemma-7B-it 即将下线 |
推理服务 | 输入 | 0.004 | 0.0008 | 元/千tokens |
输出 | 0.004 | 0.0008 | 元/千tokens |
备注信息:
- DeepSeek-V3 批量推理即将于6月13日价格上调,恢复至输入0.0008元/千tokens,输出0.00032元/千tokens。保持预置服务4折。
按量包付费
量包名称 | 量包额度(Tokens) | 服务速率限制 | 有效期 | 原价(元) | 折扣率 | 折后价(元) |
---|---|---|---|---|---|---|
ERNIE-X1-32K-Preview 系列预置服务共享量包 |
1亿 | TPM = 500K RPM = 1,500 |
6个月 | 350 | 90% | 315 |
5亿 | TPM = 800K RPM = 1,500 |
6个月 | 1,750 | 85% | 1,487.5 | |
10亿 | TPM = 1,200K RPM = 1,500 |
6个月 | 3,500 | 80% | 2,800 | |
ERNIE-4.0-8K 系列预置服务共享量包 |
1000万 | TPM = 800K RPM = 10K |
6个月 | 450 | 90% | 405 |
5000万 | TPM = 800K RPM = 10K |
6个月 | 2,250 | 80% | 1,800 | |
1亿 | TPM =1040K RPM = 10K |
12个月 | 4,500 | 80% | 3,600 | |
5亿 | TPM = 5200K RPM = 10K |
12个月 | 22,500 | 75% | 16,875 | |
10亿 | TPM = 10400K RPM = 10K |
12个月 | 45,000 | 70% | 31,500 | |
ERNIE-3.5-8K 系列预置服务共享量包 |
5,000万 | TPM = 800K RPM = 10K |
6个月 | 55 | 92% | 50.60 |
1亿 | TPM = 800K RPM = 10K |
12个月 | 110 | 90% | 99 | |
5亿 | TPM = 800K RPM = 10K |
12个月 | 550 | 80% | 440 | |
10亿 | TPM =1040K RPM = 10K |
12个月 | 1,100 | 80% | 880 | |
50亿 | TPM = 5200K RPM = 10K |
12个月 | 5,500 | 75% | 4,125 | |
100亿 | TPM =10400K RPM = 10K |
12个月 | 11,000 | 70% | 7,700 | |
ERNIE-4.0-Turbo-8K 系列预置服务共享量包 |
1,000万 | TPM = 800K RPM = 10K |
6个月 | 300 | 90% | 270 |
5,000万 | TPM = 800K RPM = 10K |
6个月 | 1,500 | 80% | 1,200 | |
1亿 | TPM =1040K RPM = 10K |
12个月 | 3,000 | 80% | 2,400 | |
5亿 | TPM = 5200K RPM = 10K |
12个月 | 15,000 | 75% | 11,250 | |
10亿 | TPM =10400K RPM = 10K |
12个月 | 30,000 | 70% | 21,000 | |
ERNIE-3.5-128K 系列预置服务共享量包 |
1亿 | TPM = 400K RPM = 5K |
12个月 | 110 | 90% | 99 |
5亿 | TPM = 400K RPM = 5K |
12个月 | 550 | 80% | 440 | |
10亿 | TPM = 800K RPM = 5K |
12个月 | 1,100 | 80% | 880 | |
50亿 | TPM = 4000K RPM = 5K |
12个月 | 5,500 | 75% | 4,125 | |
ERNIE-Lite-Pro-128K 系列预置服务共享量包 |
1亿 | TPM = 800K RPM = 10K |
12个月 | 25 | 90% | 22.5 |
10亿 | TPM = 800K RPM = 10K |
12个月 | 250 | 85% | 212.50 | |
50亿 | TPM = 800K RPM = 10K |
12个月 | 1,250 | 80% | 1,000 | |
ERNIE-Speed-Pro-128K 系列预置服务共享量包 |
1亿 | TPM = 800K RPM = 10K |
12个月 | 37.5 | 90% | 33.75 |
10亿 | TPM = 800K RPM = 10K |
12个月 | 375 | 85% | 318.75 | |
50亿 | TPM = 800K RPM = 10K |
12个月 | 1,875 | 80% | 1,500 | |
ERNIE-4.0-Turbo-128K 系列预置服务共享量包 |
1亿 | TPM = 400K RPM = 5K |
12个月 | 3,000 | 90% | 2,700 |
5亿 | TPM = 400K RPM = 5K |
12个月 | 15,000 | 80% | 12,000 | |
10亿 | TPM = 800K RPM = 5K |
12个月 | 30,000 | 80% | 24,000 |
按TPM付费
模型名称 | 版本名称 | 单位规格 | 预付费单价 | 后付费单价 | ||
---|---|---|---|---|---|---|
原价 | 活动价 | 原价 | 活动价 | |||
ERNIE 4.0 | ERNIE-4.0-8K | TPM = 10000 RPM = 33 |
¥27,000 | ¥12,960 | ¥55 | ¥27 |
ERNIE-4.0-8K-Preview | TPM = 10000 RPM = 33 |
¥27,000 | ¥12,960 | ¥55 | ¥27 | |
ERNIE-4.0-8K-Preview-0518 | TPM = 10000 RPM = 33 |
¥27,000 | ¥12,960 | ¥55 | ¥27 | |
ERNIE 4.0 Turbo | ERNIE-4.0-Turbo-8K | TPM = 10000 RPM = 33 |
¥12,000 | ¥6,480 | ¥25 | ¥14 |
ERNIE-4.0-Turbo-128K | TPM = 10000 RPM = 2 |
¥12,000 | ¥6,480 | ¥10 | ¥0.50 | |
ERNIE 3.5 | ERNIE-3.5-8K | TPM = 10000 RPM = 33 |
¥4,250 | ¥237.60 | ¥25 | ¥14 |
ERNIE-3.5-8K-Preview | TPM = 10000 RPM = 33 |
¥4,250 | ¥237.60 | ¥10 | ¥0.50 | |
ERNIE-3.5-128K | TPM = 10000 RPM = 2 |
¥17,000 | ¥237.60 | ¥40 | ¥0.50 | |
ERNIE-3.5-128K-Preview | TPM = 10000 RPM = 2 |
¥17,000 | ¥237.60 | ¥40 | ¥0.50 | |
ERNIE Speed | ERNIE-Speed-Pro-128K | TPM = 10000 RPM = 2 |
¥164.70 | ¥82.35 | ¥0.34 | ¥0.17 |
ERNIE-Speed-8K | TPM = 10000 RPM = 33 |
¥1,900 | ¥81 | ¥5 | ¥0.20 | |
ERNIE-Speed-128K | TPM = 10000 RPM = 2 |
¥7,600 | ¥81 | ¥20 | ¥0.20 | |
ERNIE Lite | ERNIE-Lite-Pro-128K | TPM = 10000 RPM = 2 |
¥109.80 | ¥54.90 | ¥0.23 | ¥0.11 |
ERNIE-Lite-8K | TPM = 10000 RPM = 33 |
¥1,200 | ¥54 | ¥3 | ¥0.12 | |
ERNIE Character | ERNIE-Character-Fiction-8K | TPM = 10000 RPM = 33 |
¥1,900 | ¥1,900 | ¥5 | ¥5 |
ERNIE-Character-8K | TPM = 10000 RPM = 33 |
¥1,900 | ¥1,900 | ¥5 | ¥5 | |
ERNIE Novel | ERNIE-Novel-8K | TPM = 10000 RPM = 33 |
¥27,000 | ¥12,960 | ¥55 | ¥27 |
ERNIE Tiny | ERNIE-Tiny-8K | TPM = 10000 RPM = 33 |
¥400 | ¥400 | ¥1 | ¥1 |
图像理解
模型名称 | 版本名称 | 服务内容 | 子项 | 在线推理 | 批量推理 | 单位 |
---|---|---|---|---|---|---|
Qianfan-Llama-VL-8B | Qianfan-Llama-VL-8B | 推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.005 | 0.002 | 元/千tokens | |||
DeepSeek-VL2 | DeepSeek-VL2 | 推理服务 | 输入 | 0.00099 | - | 元/千tokens |
输出 | 0.00099 | - | 元/千tokens | |||
DeepSeek-VL2-Small | DeepSeek-VL2-Small | 推理服务 | 输入 | 0.0005 | - | 元/千tokens |
输出 | 0.0005 | - | 元/千tokens | |||
Qwen2.5-VL-7B-Instruct | Qwen2.5-VL-7B-Instruct | 推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.005 | 0.002 | 元/千tokens | |||
Qwen2.5-VL-32B-Instruct | Qwen2.5-VL-32B-Instruct | 推理服务 | 输入 | 0.008 | - | 元/千tokens |
输出 | 0.024 | - | 元/千tokens | |||
InternVL2_5-38B-MPO | InternVL2_5-38B-MPO | 推理服务 | 输入 | 0.008 | - | 元/千tokens |
输出 | 0.024 | - | 元/千tokens | |||
Fuyu-8B | Fuyu-8B 即将下线 |
推理服务 | - | 限时免费 | - |
备注信息:
- Fuyu-8B:限时免费,每个账号每天包含500次调用额度(按调用总次数统计,包括但不限于调用成功的次数)。如需扩容,请使用算力单元发布该模型。
深度思考
按量后付费
模型名称 | 版本名称 | 服务内容 | 子项 | 在线推理 | 批量推理 | 单位 |
---|---|---|---|---|---|---|
ERNIE X1 Turbo | ERNIE-X1-Turbo-32K | 推理服务 | 输入 | 0.001 | 0.0004 | 元/千tokens |
输出 | 0.004 | 0.0016 | 元/千tokens | |||
ERNIE X1 | ERNIE-X1-32K ERNIE-X1-32K-Preview |
推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.008 | 0.0032 | 元/千tokens | |||
DeepSeek-R1 | DeepSeek-R1 | 推理服务 | 输入 | 0.004 | 0.0008 | 元/千tokens |
输出 | 0.016 | 0.0032 | 元/千tokens | |||
DeepSeek-R1-Distill-Qianfan-70B | DeepSeek-R1-Distill-Qianfan-70B | 推理服务 | 输入 | 0.002 | 0.008 | 元/千tokens |
输出 | 0.008 | 0.0032 | 元/千tokens | |||
DeepSeek-R1-Distill-Qianfan-8B | DeepSeek-R1-Distill-Qianfan-8B | 推理服务 | 输入 | 0.001 | 0.0004 | 元/千tokens |
输出 | 0.004 | 0.00016 | 元/千tokens | |||
DeepSeek-R1-Distill-Qianfan-Llama-70B | DeepSeek-R1-Distill-Qianfan-Llama-70B | 推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.008 | 0.0032 | 元/千tokens | |||
DeepSeek-R1-Distill-Qianfan-Llama-8B | DeepSeek-R1-Distill-Qianfan-Llama-8B | 推理服务 | 输入 | 0.001 | 0.0004 | 元/千tokens |
输出 | 0.004 | 0.00016 | 元/千tokens | |||
DeepSeek-R1-Distill-Llama-70B | DeepSeek-R1-Distill-Llama-70B | 推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.008 | 0.0032 | 元/千tokens | |||
DeepSeek-R1-Distill-Llama-8B | DeepSeek-R1-Distill-Llama-8B | 推理服务 | 输入 | 0.001 | 0.0004 | 元/千tokens |
输出 | 0.004 | 0.00016 | 元/千tokens | |||
DeepSeek-R1-Distill-Qwen-32B | DeepSeek-R1-Distill-Qwen-32B | 推理服务 | 输入 | 0.0015 | 0.0006 | 元/千tokens |
输出 | 0.006 | 0.0024 | 元/千tokens | |||
DeepSeek-R1-Distill-Qwen-14B | DeepSeek-R1-Distill-Qwen-14B | 推理服务 | 输入 | 0.0006 | 0.00024 | 元/千tokens |
输出 | 0.0024 | 0.00096 | 元/千tokens | |||
DeepSeek-R1-Distill-Qwen-7B | DeepSeek-R1-Distill-Qwen-7B | 推理服务 | 输入 | 0.0005 | 0.0002 | 元/千tokens |
输出 | 0.002 | 0.0008 | 元/千tokens | |||
DeepSeek-R1-Distill-Qwen-1.5B | DeepSeek-R1-Distill-Qwen-1.5B | 推理服务 | 输入 | 0.0003 | 0.00012 | 元/千tokens |
输出 | 0.0012 | 0.00048 | 元/千tokens | |||
GLM-Z1-32B-0414 | GLM-Z1-32B-0414 | 推理服务 | 输入 | 0.002 | 0.0018 | 元/千tokens |
输出 | 0.008 | 0.0018 | 元/千tokens | |||
GLM-Z1-Rumination-32B-0414 | GLM-Z1-Rumination-32B-0414 | 推理服务 | 输入 | 0.005 | 0.0018 | 元/千tokens |
输出 | 0.02 | 0.0018 | 元/千tokens | |||
Qwen3 | Qwen3-235B-A22B 如未启用思考模式计费详情请查看文本生成 |
推理服务 | 输入 | 0.004 | - | 元/千tokens |
输出 | 0.012 | - | 元/千tokens | |||
Qwen3 | Qwen3-30B-A3B 如未启用思考模式计费详情请查看文本生成 |
推理服务 | 输入 | 0.0015 | - | 元/千tokens |
输出 | 0.006 | - | 元/千tokens | |||
Qwen3 | Qwen3-32B 如未启用思考模式计费详情请查看文本生成 |
推理服务 | 输入 | 0.002 | - | 元/千tokens |
输出 | 0.008 | - | 元/千tokens | |||
Qwen3 | Qwen3-14B 如未启用思考模式计费详情请查看文本生成 |
推理服务 | 输入 | 0.001 | - | 元/千tokens |
输出 | 0.004 | - | 元/千tokens | |||
Qwen3 | Qwen3-8B 如未启用思考模式计费详情请查看文本生成 |
推理服务 | 输入 | 0.0005 | - | 元/千tokens |
输出 | 0.002 | - | 元/千tokens | |||
Qwen3 | Qwen3-4B 如未启用思考模式计费详情请查看文本生成 |
推理服务 | 输入 | 0.0003 | - | 元/千tokens |
输出 | 0.0012 | - | 元/千tokens | |||
Qwen3 | Qwen3-1.7B 如未启用思考模式计费详情请查看文本生成 |
推理服务 | 输入 | 0.0003 | - | 元/千tokens |
输出 | 0.0012 | - | 元/千tokens | |||
Qwen3 | Qwen3-0.6B 如未启用思考模式计费详情请查看文本生成 |
推理服务 | 输入 | 0.0003 | - | 元/千tokens |
输出 | 0.0012 | - | 元/千tokens | |||
QWQ-32B | QWQ-32B | 推理服务 | 输入 | 0.002 | 0.0008 | 元/千tokens |
输出 | 0.006 | 0.0024 | 元/千tokens |
备注信息:
Qwen3 系列模型思考模式下输出限时优惠,将于5月16日00:00恢复原价。
- Qwen3-235B-A22B 限时优惠价0.012元/千tokens,原价0.04元/千tokens
- Qwen3-30B-A3B 限时优惠价0.006元/千tokens,原价0.015元/千tokens
- Qwen3-32B 限时优惠价0.008元/千tokens,原价0.02元/千tokens
- Qwen3-14B 限时优惠价0.004元/千tokens,原价0.01元/千tokens
- Qwen3-8B 限时优惠价0.002元/千tokens,原价0.005元/千tokens
- Qwen3-4B 限时优惠价0.0012元/千tokens,原价0.003元/千tokens
- Qwen3-1.7B 限时优惠价0.0012元/千tokens,原价0.003元/千tokens
- Qwen3-0.6B 限时优惠价0.0012元/千tokens,原价0.003元/千tokens
DeepSeek R1 批量推理,将于6月13日价格上调,保持预置服务4折
1、输入:0.0016元/千tokens
2、输出:0.0064元/千tokens
按量包付费
量包名称 | 量包额度(Tokens) | 服务速率限制 | 有效期 | 原价(元) | 折扣率 | 折后价(元) |
---|---|---|---|---|---|---|
DeepSeek-V3 系列预置服务共享量包 |
1亿 | TPM = 300K RPM = 1,500 |
3个月 | 350 | 90% | 315 |
5亿 | TPM = 500K RPM = 1,500 |
3个月 | 1,750 | 85% | 1,487.5 | |
10亿 | TPM = 800K RPM = 1,500 |
3个月 | 3,500 | 80% | 2,800 | |
DeepSeek-R1 系列预置服务共享量包 |
1亿 | TPM = 300K RPM = 1,500 |
3个月 | 700 | 90% | 630 |
5亿 | TPM = 500K RPM = 1,500 |
3个月 | 3,500 | 85% | 2,975 | |
10亿 | TPM = 800K RPM = 1,500 |
3个月 | 7,000 | 80% | 5,600 |
图像生成
模型 | 服务内容 | 单价 | 规格 |
---|---|---|---|
irag-1.0 | 推理服务 | 0.14元/张 | 1024x1024 |
FLUX.1-schnell | 推理服务 | 限时0.002元/张 | - |
Stable-Diffusion-XL | 推理服务 | 0.02元/秒,具体计算逻辑,参考下表。 | 768x768、576x1024、1024x576,3秒/张 * ¥0.02元/秒=¥0.06元/张 |
768x1024、1024x768、1024x1024,4秒/张 * ¥0.02元/秒=¥0.08元/张 | |||
1536x1536、1152x2048、2048x1152,6秒/张 * ¥0.02元/秒=¥0.12元/张 | |||
1536x2048、2048x1536、2048x2048,8秒/张 * ¥0.02元/秒=¥0.16元/张 |
图像编辑
模型 | 服务内容 | 单价 | 单位 |
---|---|---|---|
ernie-irag-edit | 推理服务 | 0.14 | 元/张 |
向量
模型名称 | 服务内容 | 子项 | 单价 | 单位 |
---|---|---|---|---|
Embedding-V1 | 推理服务 | 输入 | 0.0005 | 元/千tokens |
bge-large-zh | 推理服务 | 输入 | 0.0005 | 元/千tokens |
bge-large-en | 推理服务 | 输入 | 0.0005 | 元/千tokens |
tao-8k | 推理服务 | 输入 | 0.0005 | 元/千tokens |
重排序
模型名称 | 服务内容 | 子项 | 单价 | 单位 |
---|---|---|---|---|
bce-reranker-base | 推理服务 | 输入 | 0.0005 | 元/千tokens |
模型内置工具价格
联网搜索
按次使用量后付费
基于用户query,大模型自动判断是否触发联网搜索查询相关文献。如果触发联网搜索,则基于搜索结果进行总结回答。如果不触发联网搜索,大模型直接回答。
触发联网搜索包括两部分费用:
- 按次收费:如果触发搜索,会收取一次联网搜索费用,单次价格见下面表格。
- 联网搜索search_tokens费用:联网搜索会将检索到的内容输入给大模型,导致输入模型tokens增加,在推理接口返回的
usage.prompt_tokens_details.search_tokens
当中体现。
服务内容 | 单价 | 单位 |
---|---|---|
搜索增强 | 0.004 | 元/次 |
按次量包预付费
搜索增强支持使用量包。使用ERNIE-4.0-8K、ERNIE-3.5-8K、ERNIE-4.0-Turbo-8K、ERNIE-3.5-128K系列预置服务触发搜索增强时,如已购买搜索增强量包,则会优先抵扣量包,量包耗尽或过期后恢复至按次计费。
当前规格及计费如下所示:
次数 | 有效期 | 原价 | 折扣率 | 折后价 |
---|---|---|---|---|
10000次 | 6个月 | ¥80 | 95% | ¥76 |
50000次 | 6个月 | ¥400 | 95% | ¥380 |
阅读助手插件
按次使用量后付费
基于plugins入参和用户query,模型自动判断是否调起插件。如果触发插件,则基于文档内容总结回复。如果不触发,大模型直接回答。
触发插件回复包含两部分费用:
- 按次收费:如果触发插件,会收取一次插件费用,单次价格见下面表格。
- plugin_tokens费用:触发阅读助手插件后,插件会读取需要阅读的文档/网页内容,并对用户的prompt进行一定扩写,导致输入模型的token增加,在推理接口返回的
usage.prompt_tokens_details.plugin_tokens
插件 | 服务内容 | 单价 |
---|---|---|
阅读助手插件 | 推理服务 | ¥0.01元/每次 |
算力单元价格
购买算力单元限时5折起优惠,活动时间:2024年11月13日~2025年6月30日。
当您通过购买算力单元部署服务时,付费信息选择分为以下两种方式:
预付费
预付费购买的算力单元,按月计费,购买成功后开始计时。具体价格如下:
资源类型 | 规格 | 原单价(元/月) | 折后价(元/月) |
---|---|---|---|
AI加速卡Ⅰ型 | 1个算力单元 | 15,000 | (5折后) 7,500 |
AI加速卡Ⅴ型 | 1个算力单元 | 9,000 | (5折后) 4,500 |
AI加速卡Ⅵ型 | 1个算力单元 | 9,000 | (5折后) 4,500 |
AI加速卡Ⅶ型 | 1个算力单元 | 15,000 | (5折后) 7,500 |
CPU | 1个算力单元 | 3,900 | (5折后) 1,950 |
预付费购买的算力单元支持开启/关闭自动续费功能,您可在千帆产品控制台按需设置。
使用中状态的预付费算力单元支持变配(仅升配)功能,您可在千帆产品控制台按需使用。资源变配可能会带来额外的消费,计费规则如下:
- 公式:(新配置单价- 旧配置单价)* 原订单剩余时长(大于24小时,向下取整;小于24小时,向上取整)
- 例如:剩余时间为5天时发起扩容,扩容当天不收费,只收取剩余5天的扩容费用;剩余时间为8小时时,扩容收取当天全天的费用;
后付费
后付费购买的算力单元,按分钟计费,按小时出账。使用时长小于15分钟按15分钟收费,超过15分钟按照实际使用时长收费。具体价格如下:
资源类型 | 规格 | 原单价(元/分钟) | 折后价(元/分钟) |
---|---|---|---|
AI加速卡Ⅰ型 | 1个算力单元 | 0.52 | (5折后) 0.26 |
AI加速卡Ⅴ型 | 1个算力单元 | 0.32 | (5折后) 0.16 |
AI加速卡Ⅵ型 | 1个算力单元 | 0.32 | (5折后) 0.16 |
AI加速卡Ⅶ型 | 1个算力单元 | 0.52 | (5折后) 0.26 |
CPU | 1个算力单元 | 0.17 | (5折后) 0.085 |
后付费购买的算力单元支持设置定时释放时间,默认处于关闭状态,您可在千帆产品控制台按需设置。
使用中状态的后付费算力单元支持变配(升配/降配)功能,您可在千帆产品控制台按需使用。后付费算力单元根据使用时长后付费,变配成功后,价格会根据新配置自动变更。
价格费用举例
算力单元的开始时间以服务部署成功时间为准。
示例1:预付费购买1个月的AI加速卡Ⅰ型算力单元
单副本算力单元数为2,副本数自定义为2,则最终需要购买的算力单元总数为2*2=4个,购买一个月的总价格为:
1(月) x
2(单副本算力单元) x
2(副本数) x
15,000(元/月x 1副本 x 1算力单元) = 60,000 元
活动期间,购买AI加速卡算力单元享有5折优惠,所以折后价为30,000元。
微调模型按token后付费价格
平台部分基座模型,其微调以后的模型,支持发布为按token后付费的服务,其付费规格如下:
SFT基础模型 | 模型版本 | 原价 | 折扣价 |
---|---|---|---|
ERNIE Speed | ERNIE-Speed-8K | 输入:0.012元/千tokens 输出:0.024元/千tokens |
输入:0.004元/千tokens 输出:0.008元/千tokens |
ERNIE Lite | ERNIE-Lite-8K-0308 | 输入:0.009元/千tokens 输出:0.018元/千tokens |
输入:0.003元/千tokens 输出:0.006元/千tokens |
ERNIE Lite | ERNIE-Lite-8K-0922 | 0.024元/千tokens | 0.008元/千tokens |
ERNIE Lite | ERNIE-Lite-8K-0725 | 0.024元/千tokens | 0.008元/千tokens |
ERNIE Lite | ERNIE-Lite-4K-0704 | 0.024元/千tokens | 0.008元/千tokens |
ERNIE Lite | ERNIE-Lite-4K-0516 | 0.024元/千tokens |
0.008元/千tokens |
Llama-2 | Qianfan-Chinese-Llama-2-7B | 0.012元/千tokens | 0.004元/千tokens |
Llama-2 | Qianfan-Chinese-Llama-2-7B-32K | 0.012元/千tokens | 0.004元/千tokens |
Llama-2 | Qianfan-Chinese-Llama-2-13B | 0.018元/千tokens | 0.006元/千tokens |
ChatGLM | chatglm2-6b | 0.012元/千tokens | 0.004元/千tokens |
ChatGLM | chatglm2-6b-32k | 0.012元/千tokens | 0.004元/千tokens |
Baichuan2 | Baichuan2-7B-Chat | 0.012元/千tokens | 0.004元/千tokens |
Baichuan2 | Baichuan2-13B-Chat | 0.018元/千tokens | 0.006元/千tokens |
SQLCoder-7B | sqlcoder-7b | 0.012元/千tokens | 0.004元/千tokens |
CodeLlama | CodeLlama-7b-Instruct | 0.012元/千tokens | 0.004元/千tokens |
BLOOMZ-7B | BLOOMZ-7B | 0.012元/千tokens | 0.004元/千tokens |
重要说明:
- SFT微调模型发布为按token后付费的服务,不支持选择算力单元数量,只支持小流量体验使用
- 支持SFT微调模型按token后付费的资源有限,当资源被占满时,用户将无法发布
- 1个智能云账户只能发布一个SFT微调模型按token后付费服务