资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

获取模型版本详情

接口描述

本接口用于获取模型版本详情,如模型版本名称、描述、创建时间、输入输出模式、输入输出模式限制等。

权限说明

调用本文API,需符合以下权限要求,权限介绍及分配,请查看角色与权限控制列表账号创建与权限分配。需具有以下任一权限:

  • 完全控制千帆大模型平台的权限:QianfanFullControlAccessPolicy
  • 只读访问千帆大模型平台的权限:QianfanReadAccessPolicy
  • 完全控制千帆大模型平台模型调优的权限:QianfanModelTuningFullControlAccessPolicy
  • 只读访问千帆大模型平台模型调优的权限:QianfanModelTuningReadAccessPolicy

鉴权说明

调用本文API,使用“基于安全认证AK/SK”进行签名计算鉴权,即使用安全认证中的Access Key ID 和 Secret Access Key进行鉴权,具体鉴权认证机制参考HTTP调用鉴权说明

请求结构

POST /v2/model?Action=DescribeModel HTTP/1.1
Host: qianfan.baidubce.com
Authorization: authorization string
Content-Type: application/json

{
   "modelId":"amv-g73jxxxzpz"
}

请求头域

除公共头域外,无其它特殊头域。

请求参数

  • Query参数
名称 类型 必填 描述
Action string 方法名称,固定值DescribeModel
  • Body参数
名称 类型 必填 描述
modelId string 模型版本ID,示例:amv-g73j3faikzpz,通过以下方式获取该字段值:
· 方式一,通过调用新建我的模型版本接口,返回的modelId字段获取
· 方式二,在控制台-我的模型-点击某模型详情,在版本列表中查看
image.png

响应头域

除公共头域外,无其它特殊头域。

响应参数

名称 类型 描述
requestId string 请求ID
result object 模型版本相关信息

result说明

名称 类型 描述
modelId string 模型版本ID
status string 状态,说明:
· Ready:已就绪
· Creating:创建中
· Fail:创建失败
modelName string 模型版本名称
model string 基础模型版本名称
sourceInfo object 模型版本来源回溯信息
description string 模型版本描述,说明:
· 当有模型版本描述时,才返回该字段;
· 如果无模型版本描述,不返回此字段
createTime string 模型版本创建时间
modifyTime string 模型版本修改时间
modelApplicationType string 输入输出模式,说明:
· chat:对话模式
· completion:续写模式
tokenLimitations object 输入输出长度限制
isSupportDeploy bool 是否支持部署
isSupportModelComp bool 是否支持压缩
isSupportEvaluation bool 是否支持评估
resourceType string[] 资源类型,返回如下:
· CPU I型:CPU-1-1
· 加速卡I型:GPU-1-1、GPU-1-2、GPU-1-4、GPU-1-8
· 加速卡II型:GPU-2-1
· 加速卡III型:GPU-3-1
· 加速卡VI型:GPU-4-1、GPU-4-2
· 加速卡V型:GPU-5-1、GPU-5-2
· 加速卡VI型:GPU-6-1、GPU-6-2
· 加速卡VII型:GPU-7-1、GPU-7-2、GPU-7-4、GPU-7-8
advancedSettings object 量化压缩配置
modelCompConfigs modelCompConfig[] 模型压缩可选配置列表

sourceInfo说明

名称 类型 描述
sourceType string 模型版本来源类型,不同类型对应不同的数据结构,说明:
· Train:大模型训练产生
· Acceleration:模型加速产生
· Import:外部导入模型
· PlatformPreset:平台预置模型版本
trainTaskId string 大模型训练任务id
accelerationTaskId string 模型版本加速任务id
importModelVersionBosUrl string 导入模型版本bos地址

tokenLimitations说明

名称 类型 描述
trivial object modelApplicationType非reranker类型的模型上下文限制
reranker object modelApplicationType为reranker类型的模型上下文限制

trivial说明

名称 类型 描述
inputTokens int 输入tokens限制
outputTokens int 输出tokens限制
characterLimit int 字符数限制

reranker说明

名称 类型 描述
queryTokens int query的tokens限制
queryCharacterLimit int query的字符数限制
documentTokens int document的tokens限制
documentCharacterLimit int document的字符数限制

advancedSettings说明

名称 类型 描述
samplingStrategy string 压缩时的采样策略,说明:
(1)当导入HuggingFace模型,且推理引擎为vLLM,该参数有效,
(2)可选值如下:
· 多项式采样:multinomialSampling
· 束搜索:beamSearch
· 贪心搜索:greedySearch
numBeams int 束数量,说明:
(1)当导入HuggingFace模型,该参数有效
(2)取值范围为2-15
topLogprobs int logits中topk的值,范围为1~20

modelCompConfig说明

名称 类型 描述
strategy string 模型压缩策略,说明:
· Quantization:量化压缩策略
· Sparsity:稀疏化压缩策略
sparsityRatio float 稀疏比例,strategy为Sparsity时返回
weight string 量化压缩配置,说明:
(1)只有当strategy为Quantization时返回该字段
(2)说明:
· W8A8C4:EB模型
· W8A8C8:EB模型
· W8A8C16:EB模型
· W8A16C16:HF模型
· W4A16C16:HF模型

请求示例

# 替换下列示例中的Authorization值、x-bce-date值
curl -i --location 'https://qianfan.baidubce.com/v2/model?Action=DescribeModel' \
--header 'Authorization: bce-auth-v1/f0ee7axxxx/2023-09-19T13:42:13Z/180000/host;x-bce-date/9a8cfb8eexxxxxxxxcae374525543' \ 
--header 'x-bce-date: 2023-09-19T13:37:10Z' \
--header 'Content-Type: application/json' \ 
--data '{
    "modelId":"amv-g73jxxxzpz"
}'

响应示例

HTTP/1.1 200 OK
{
    "requestId": "6ba7b810-9dad-11d1-80b4-00c04fd430c8",
    "result": {
        "modelSetId": "am-txtetnsfq9sb",
        "modelSetName": "chatglm32k_v10",
        "modelId": "amv-sxw7atka4jk0",
        "modelName": "V2",
        "model": "LLaVA-v1.6-13B",
        "description": "clc_test_publish_chatglm32k_v10",
        "sourceInfo": {
            "sourceType": "Train",
            "trainTaskId": "task-xxxx"
        },
        "status": "Ready",
        "endpointType": "chat",
        "ioTokens": "",
        "createTime": "2023-12-15T16:30:06+08:00",
        "modifyTime": "2024-01-04T16:10:45+08:00",
        "isSupportDeploy": true,
        "isSupportModelComp": false,
        "isSupportEvaluation": true,
        "resourceType": [
            "GPU-1-1",
            "GPU-2-1",
            "GPU-3-1",
            "GPU-4-1",
            "GPU-5-1",
            "GPU-6-1"
        ],
        "advancedSettings": {
            "strategy": "Quantization",
            "weight": "W8A8C4-PTQ",
            "samplingStrategy": "multinomialSampling",
            "contextLength": 8,
            "shards": 1,
            "topLogprobs": 5
        },
        "modelCompConfigs": {
            "strategy": "Sparsity",
            "sparsityRatio": 0.5
        }
    }
}

错误码

若请求错误,服务器将返回的JSON文本包含以下参数:

名称 描述
requestId 请求ID
code 错误码
message 错误描述信息,帮助理解和解决发生的错误

例如错误返回:

{
    "requestId":"6ba7b810-xxxx0c04fd430c8",
    "code":"AccessDenied",
    "message":"Access denied."
}

更多其他错误码,也可以查看错误码说明

上一篇
获取导入模型平台预置高级配置
下一篇
获取模型版本的高级配置