资讯 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

预置模型服务输入和输出限制

以下模型在本平台已经提供接口访问方式,无需用户部署模型即可访问。

ERNIE系列模型

  • 模型版本说明:

    • -preview:表示预览版接口,指向最新版本的模型。preview接口滚动升级不会提前通知用户,用户可以在文档上查看当前最新指向日期。
    • -MMDD:带日期版本接口,模型不再更新,会定期退役,退役下线前会通知用户。
    • 主线接口:不带日期版本为主线接口,主线接口模型版本滚动升级,在模型版本升级之前会提前通知用户。
    • 抢占式接口:抢占式接口版本与主线版本保持一致
  • ERNIE模型有默认输出长度和最大输出长度,可以通过入参max_output_tokens控制输出长度,取值范围见下述表格,-表示不支持max_output_tokens入参。
  • 接口地址统一前缀为https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop, 拼接上接口地址后缀就是完整接口地址
模型 输入字符 最大输入Tokens 默认最大输出Tokens 输出区间 接口地址后缀 接口文档
ERNIE-4.0-Turbo-8K 20000 5120 1024 [2, 2048] /chat/ernie-4.0-turbo-8k 查看
ERNIE-4.0-8K-Preview 20000 5120 1024 [2, 2048] /chat/ernie-4.0-8k-preview 查看
ERNIE-4.0-8K-Preview-0518 20000 5120 1024 [2, 2048] /chat/completions_adv_pro 查看
ERNIE-4.0-8K-0329 20000 5120 1024 [2, 2048] /chat/ernie-4.0-8k-0329 查看
ERNIE-4.0-8K(指向0329) 20000 5120 1024 [2, 2048] /chat/completions_pro 查看
ERNIE-4.0-8K-0104 20000 5120 1024 [2, 2048] /chat/ernie-4.0-8k-0104 查看
ERNIE-4.0-8K(抢占式) 20000 5120 1024 [2, 2048] /chat/completions_pro_preemptible 查看
ERNIE-3.5-8K-Preview(指向0524) 20000 5120 1024 [2, 2048] /chat/ernie-3.5-8k-preview 查看
ERNIE-3.5-8K-0329 20000 5120 1024 [2, 2048] /chat/ernie-3.5-8k-0329 查看
ERNIE-3.5-8K(指向0329) 20000 5120 1024 [2, 2048] /chat/completions 查看
ERNIE-3.5-8K-0205 20000 5120 1024 [2, 2048] /chat/ernie-3.5-8k-0205 查看
ERNIE-3.5-8K-1222(05月30日退役) 20000 5120 1024 [2, 2048] /chat/ernie-3.5-8k-1222 -
ERNIE-3.5-4K-0205(05月30日退役) 8000 2048 1024 [2, 2048] /chat/ernie-3.5-4k-0205 -
ERNIE-3.5-8K(抢占式) 20000 5120 1024 [2, 2048] /chat/completions_preemptible 查看
ERNIE-3.5-128K(预览版) 516096 126976 4096 [2, 4096] /chat/ernie-3.5-128k 查看
ERNIE-Speed-8K 24000 6144 1024 [2, 2048] /chat/ernie_speed 查看
ERNIE-Speed-128K(预览版) 516096 126976 4096 [2, 4096] /chat/ernie-speed-128k 查看
ERNIE-Speed-AppBuilder-8K 11200 7168 1024 - /chat/ai_apaas 查看
ERNIE-Lite-8K(指向0308) 24000 6144 1024 [2, 2048] /chat/ernie-lite-8k 查看
ERNIE-Lite-8K-0922 11200 7168 1024 [2, 1024] /chat/eb-instant 查看
ERNIE-Tiny-8K 24000 6144 1024 [2, 2048] /chat/ernie-tiny-8k 查看
ERNIE-Character-8K 24000 6144 1024 [2, 1024] /chat/ernie-char-8k 查看
ERNIE-Functions-8K 24000 6144 1024 [2, 2048] /chat/ernie-func-8k 查看

开源模型

序号 模型 输入字符 输出Tokens 接口地址后缀 接口文档
1 bloomz7b1 4800 1500 /chat/bloomz_7b1 查看
2 llama2-7b 4800 1500 /chat/llama_2_7b 查看
3 llama2-13b 4800 1024 /chat/llama_2_13b 查看
4 llama2-70b 4800 500 /chat/llama_2_70b 查看
5 chatglm2_6b_32k 32500 1024 /chat/chatglm2_6b_32k 查看
6 aquilachat_7b 8000 1024 /chat/aquilachat_7b 查看
7 qianfan_chinese_llama_2_7b 4800 1500 /chat/qianfan_chinese_llama_2_7b 查看
8 qianfan_bloomz_7b_compressed 4800 1500 /chat/qianfan_bloomz_7b_compressed 查看
9 stable-diffusion-xl-base-1.0 1024 - /text2image/sd_xl 查看
10 fuyu-8b 8000 768 /image2text/fuyu_8b 查看
11 gemma-7b-it 11200 1000 /chat/gemma_7b_it 查看
12 Yi-34B-Chat 8000 768 /chat/yi_34b_chat 查看
13 Mixtral-8x7B-Instruct-v0.1 11200 500 /chat/mixtral_8x7b_instruct 查看
14 Qianfan-Chinese-Llama-2-13B-v1 8000 1000 /chat/qianfan_chinese_llama_2_13b 查看
15 sqlcoder-7b 8000 1000 /completions/sqlcoder_7b 查看
16 CodeLlama-7b-Instruct 8000 1000 /completions/codellama_7b_instruct 查看
17 xuanyuan_70b_chat 11200 1000 /chat/xuanyuan_70b_chat 查看
18 ChatLaw-v2 8000 768 /chat/chatlaw 查看
19 Llama-3-8b 8000 1000 /chat/llama_3_8b 查看
20 Llama-3-70b 8000 1000 /chat/llama_3_70b 查看

向量模型

序号 模型 输入字符 输入Tokens 最大批次 接口地址后缀 接口文档
1 Embedding-V1 1000 384 16 /embeddings/embedding-v1 查看
2 bge-large-zh 2000 512 16 /embeddings/bge_large_zh 查看
3 bge-large-en 2000 512 16 /embeddings/bge_large_en 查看
4 tao-8k 28000 8192 1(只支持1) /embeddings/tao_8k 查看

重排模型

序号 模型 query长度 documents长度 documents批次 接口地址后缀 接口文档
1 bce-reranker-base 1600字符,400tokens 4096字符,1024tokens 64 /reranker/bce_reranker_base 查看

计费

计费参考:https://cloud.baidu.com/doc/WENXINWORKSHOP/s/hlrk4akp7