资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

创建模型压缩任务

接口描述

本接口用于创建模型压缩任务。

权限说明

调用本文API,需符合以下权限要求,权限介绍及分配,请查看角色与权限控制列表账号创建与权限分配。需具有以下任一权限:

  • 完全控制千帆大模型平台的权限:QianfanFullControlAccessPolicy
  • 完全控制千帆大模型平台模型调优的权限:QianfanModelTuningFullControlAccessPolicy

鉴权说明

调用本文API,使用“基于安全认证AK/SK”进行签名计算鉴权,即使用安全认证中的Access Key ID 和 Secret Access Key进行鉴权,具体鉴权认证机制参考HTTP调用鉴权说明

请求结构

POST /v2/model?Action=CreateModelCompTask HTTP/1.1
Host: qianfan.baidubce.com
Authorization: authorization string
Content-Type: application/json

{
    "name":"demo",
    "description": "test",
    "sourceModelId": "amv-d1zx1iwdarfr",
    "modelSetId": "am-adbuasyfaf",
    "config": {
        "strategy": "Quantization",
        "weight": "int8-ptq"
    }
}

请求头域

除公共头域外,无其它特殊头域。

请求参数

  • Query参数
名称 类型 必填 描述
Action string 方法名称,固定值CreateModelCompTask
  • Body参数
名称 类型 必填 描述
name string 模型压缩任务名称
description string 模型压缩任务描述
sourceModelId string 待加速模型版本ID, 模型版本ID需满足以下要求:
根据模型版本ID,调用获取模型版本详情接口,查看返回字段isSupportModelComp值,必须为true,对应的模型版本ID可以为该字段sourceModelId的值;如果为false,对应的模型版本ID不能为该字段sourceModelId的值
config object 模型压缩策略配置信息
modelSetId string 压缩后的模型版本所属模型id,可以通过以下任一方式获取该字段值:
· 方式一:通过调用获取我的模型列表接口,返回的modelSetId字段获取
· 方式二:通过调用新建我的模型接口,创建不带版本的空模型,返回的result字段获取

config说明

名称 类型 必填 描述
strategy string 模型压缩策略,可选值如下:
· Quantization:量化压缩策略
· Sparsity:稀疏化压缩策略
weight string 量化压缩配置,说明:
(1)当strategy为Quantization时,该字段必填
(2)可选值:
· INT8-PTQ
· W8A16C16
· W4A16C16

响应头域

除公共头域外,无其它特殊头域。

响应参数

名称 类型 描述
requestId string 请求ID
result string 模型压缩任务id

请求示例

# 替换下列示例中的Authorization值、x-bce-date值
curl -i --location 'https://qianfan.baidubce.com/v2/model?Action=CreateModelCompTask'\
--header 'Authorization: bce-auth-v1/f0ee7axxxx/2023-09-19T13:42:13Z/180000/host;x-bce-date/9a8cfb8ee58a8f44a21a5xxxx74525543'\ 
--header 'x-bce-date: 2023-09-19T13:37:10Z'\
--header 'Content-Type: application/json'\ 
--data '{
    "name":"demo",
    "description": "test",
    "sourceModelId": "amv-d1zx1iwdarfr",
    "modelSetId": "am-adbuasyfaf",
    "config": {
        "strategy": "Quantization",
        "weight": "int8-ptq"
    }
}'

响应示例

{
    "requestId": "6ba7b810-9dad-11d1-80b4-00c04fd430c8",
    "result":  "amva-abcxxxx15t"
}

错误码

若请求错误,服务器将返回的JSON文本包含以下参数:

名称 描述
requestId 请求ID
code 错误码
message 错误描述信息,帮助理解和解决发生的错误

例如错误返回:

{
    "requestId":"6ba7b810-xxxxc04fd430c8",
    "code":"AccessDenied",
    "message":"Access denied."
}

更多其他错误码,也可以查看错误码说明

上一篇
模型精调
下一篇
查看模型压缩任务列表