资讯 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

图像生成

注意:本文档已下线,内容不再更新,如需调用图像生成相关API,请查看应用开发者中心-API参考-图像生成调用说明。

本文介绍了图像生成 V2版本相关API及使用。

功能介绍

调用本接口,可根据用户输入的文本或图片生成图片。

支持模型列表

支持模型列表请参考开始使用-模型列表-图像生成

在线调试

平台提供了 API在线调试平台-示例代码 ,用于帮助开发者调试接口,平台集成快速检索、查看开发文档、查看在线调用的请求内容和返回结果、复制和下载示例代码等功能,简单易用,更多内容请查看API在线调试介绍

鉴权说明

调用本文API,需使用API Key鉴权方式。使用API Key鉴权调用API流程,具体调用流程,请查看认证鉴权

请求结构

POST /v2/images/generations HTTP/1.1
Host: qianfan.baidubce.com
Authorization: authorization string

{
    "model": "irag-1.0",
    "prompt": "画一只小狗"
  }

请求头域

公共头域外,无其它特殊头域。

请求参数

名称 类型 必填 描述
model string 用于生图的模型,说明:
(1)预置服务,可选值请参考开始使用-模型列表-图像生成页,表格中model入参列模型
(2)平台训练模型或预置模型,可以通过查看服务详情获取该字段值,详情请查看千帆控制台-在线推理:model值为服务详情中对应的API名称,如下图所示:
image.png
prompt string 所需生成图片的描述,
(1)irag-1.0说明如下
· 可支持中文、英文
· 长度不超过220个字符
(2)flux.1-schnell:最大为512,可支持英文
refer_image string 参考图图片链接,可基于该图进行参考生成,说明:
(1)图片限制说明:
· 大小:10MB以内
· 格式:支持PNG、JPG、JPEG、WEBP、BMP、ICO
· 长宽比例不超过不超过4倍
· 长或宽不低于128像素值
(2)仅支持irag-1.0
(3)支持以下:
· 传入图片链接
· 图片的Base64编码,传入 Base64 编码格式时,传入的格式需为:data:image/<图片格式>;base64,<Base64编码>
user string 终端用户的唯一标识符
n int 生成图片数量,说明:
· 默认值为1
· 取值范围为1-4
· 单次生成的图片较多及请求较频繁可能导致请求超时
size string 支持自定义输出图片分辨率:
· 最小尺寸为512x512
· 最大尺寸为2048x2048
默认输出分辨率为1024x1024,建议输出分辨率为:
· 适用头像: ["768x768", "1024x1024", "1536x1536", "2048x2048"]
· 适用文章配图 :["1024x768", "2048x1536"]
· 适用海报传单:["768x1024", "1536x2048"]
· 适用电脑壁纸:["1024x576", "2048x1152"]
· 适用海报传单:["576x1024", "1152x2048"]
说明:用户可在512x512-2048x2048之间入参图片输出分辨率,建议长宽比不要过大,分辨率尽可能在1024x1024左右,出图更清晰。输出分辨率过大或长宽比过大,会导致图片出图效果差
steps int 采样步数,说明:
(1)采样步数(steps)数值越大,效果更精细,运行时间更长,取值范围为1-50
(2)仅支持flux.1-schnell
seed int 随机种子,说明:
(1) 不设置时,自动生成随机数,取值范围 [0, 4294967295]
(2)仅支持flux.1-schnell
guidance float 指导密度值,说明:用于在图像生成过程中调整模型的创造性与文本指导的紧密度。较高的值会使得生成的图像更忠于文本提示,但可能减少多样性;较低的值则允许更多创造性,增加图像变化。
(1)默认值为3.5,取值范围0-30
(2)仅支持flux.1-schnell

响应头域

除公共头域外,无其它特殊头域。

响应参数

名称 类型 描述
created int 时间戳
data list(object) 生成的图片列表

data说明

名称 类型 描述
url string 图片链接,有效期24h

请求示例

curl --location 'https://qianfan.baidubce.com/v2/images/generations' \
--header 'Content-Type: application/json' \
--header 'Authorization: Bearer bce-v3/ALTAK-*********/614fb**********' \
--data '{
    "model": "irag-1.0",
    "prompt": "画一只小狗"
  }'
import requests
import json

def main():
    url = "https://qianfan.baidubce.com/v2/images/generations"
    
    payload = json.dumps({
    "model": "irag-1.0",
    "prompt": "画一只小狗"
  })
    headers = {
        'Content-Type': 'application/json',
        'Authorization': 'Bearer bce-v3/ALTAK-*********/614fb**********'
    }
    
    response = requests.request("POST", url, headers=headers, data=payload)
    
    print(response.text)
    

if __name__ == '__main__':
    main()

响应示例

{
    "id": "as-p5vuu9vgsn",
    "created": 1735264326,
    "data": [
        {
            "url": "http://qianfan-modelbuilder-img-gen.bj.bcebos.com/irag-1.0/6c6093***cc5729de8/img-2039170e-7799-483a-75c4-5ad316ff3a8a.png?authorization=bce-auth-v1%2F5d****56ffa2"
        }
    ]
}

错误码

如果请求错误,服务器返回的JSON文本包含以下参数。

名称 描述
code 错误码
msg 错误描述信息,帮助理解和解决发生的错误
type 错误类型

更多相关错误码,请查看推理服务V2版本错误码说明