资讯 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

AI作画-画面扩展

接口描述

AI 作画-画面扩展,可根据用户输入的图片,自动进行画面扩展。涉及2个接口,分别为:提交请求、查询结果。

  • 扩展后画布宽度支持160~3000px,高度支持210~3000px,与原图尺寸无关。
  • 在处理坐标位置时,lefttoprightbottom通常用于定义一个矩形区域在二维空间中的边界。以下是这些坐标的具体含义:
字段 说明
left 左,以扩展图左上角为中心点,矩形左边缘的x坐标的绝对值,即原图左侧距离画布左侧边距离。
top 上,以扩展图左上角为中心点,矩形上边缘的y坐标的绝对值,即原图上端距离画布上端边距离。
right 右,以扩展图左上角为中心点,矩形右边缘的x坐标的绝对值,即原图右侧距离画布左侧边距离。
bottom 下,以扩展图左上角为中心点,矩形下边缘的y坐标的绝对值,即原图下端距离画布上端边距离。

以画面配置(left:512,top:624,right:1024,bottom:912)为例,画布尺寸1024x1024,扩展前后效果示例图如下: cff0c1044c42eb25690cb8786e03d227_9.jpg 扩展前

760eab764448cdf1bc7e6b413ac7ba110823eeb72a794f474c2a786a510d502e.jpg 扩展后

扩展后.jpg

画面扩展-提交请求-接口说明

请求示例

HTTP方法: POST

请求URL: https://aip.baidubce.com/rpc/2.0/brain/v1/wenxin/image/expand/gen

URL参数:

参数
access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取

Header如下:

参数
Content-Type application/json

请求参数

POST 方式调用

注意:要求使用 JSON 格式的结构体来描述一个请求的具体内容。

参数 是否必选 类型 描述
url string 参考图完整 url,url 长度不超过 1024 字节,url 对应的图片需 base64 编码,大小不超过 10M,最短边至少 15px,最长边最大8192px,支持 jpg/jpeg/png/bmp 格式。
image_num integer 生成图片数量,默认一张,支持生成 1-8 张
width integer 图片宽度,支持160~3000px
height Integer 图片高度,支持210~3000px,当高度尺寸在210~440px之间时,自定义暗水印(text_content字段)可能无法被成功添加,建议有自定义暗水印需求时,输出高度设置为440px以上。
prompt string 扩展区域的文本描述,限制 200 字以内
text_content string 1~50个字符,支持英文、数字及常用特殊字符。若不传该参数则默认为Text-to-Image-内容ID-AI,示例:Text-to-Image-131870381_0_finaI.png-Al;若传该参数,则相应水印内容自动添加至Text-to-Image后方,示例:Text-to-Image-ABCD-131870381_0_finaI.png-Al
left Integer 左,以扩展图左上角为中心点,矩形左边缘的x坐标的绝对值,即原图左侧距离画布左侧边距离。
top Integer 上,以扩展图左上角为中心点,矩形上边缘的y坐标的绝对值,即原图上端距离画布上端边距离。
right Integer 右,以扩展图左上角为中心点,矩形右边缘的x坐标的绝对值,即原图右侧距离画布左侧边距离。
bottom Integer 下,以扩展图左上角为中心点,矩形下边缘的y坐标的绝对值,即原图下端距离画布上端边距离。

请求示例

{
	"width": 1024,
	"height": 1024,
	"image_num": 3,
	"url": "http://creative-static.cdn.bcebos.com/public/TTI/carousel/9.jpg",
	"left": 512,
	"top": 624,
	"right": 1024,
	"bottom": 912,
	"prompt": "无",
	"text_content": "baidu1"
}

返回说明

JSON 格式

注意:若输入为 UTF-8 编码(通过指定 charset 参数),则返回内容为 UTF-8 编码

返回参数

参数 类型 描述
log_id long 请求唯一标识码
data object 返回数据
primary_task_id long 生成图片任务long类型 id,与“task_id”参数输出相同,该 id 可用于查询任务状态
task_id string 生成图片任务string类型 id,与“primary_task_id”参数输出相同,该 id 可用于查询任务状态
error_msg string 错误提示信息,失败才返回,成功不返回
error_detail object[] 提示词和参考图审核不通过原因明细,审核失败才返回,审核成功不返回
├─msg string 不合规项描述信息
├─words object[] 送检文本命中词库的关键词
error_code number 错误提示码,失败才返回,成功不返回

返回示例

{
    "data": {
        "primary_task_id": 1824362700265781971,
        "task_id": "1824362700265781971"
    },
    "log_id": 1824362700265781971
}

画面扩展-查询结果-接口说明

请求示例

HTTP方法: POST

请求URL: https://aip.baidubce.com/rpc/2.0/brain/v1/wenxin/image/expand/query

URL参数:

参数
access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取

Header如下:

参数
Content-Type application/json

请求格式

POST 方式调用

注意:要求使用 JSON 格式的结构体来描述一个请求的具体内容。

请求参数

参数 是否必选 类型 描述
task_id long或string 从提交请求的提交接口的返回值中获取,可使用task_id 查询总任务

请求示例

{
 "task_id":  1824362700265781971
}

返回格式

JSON 格式

返回参数

参数 是否必选 类型 描述
log_id long 请求唯一标识码
data object 返回数据
├─task_id long 任务 Id
├─task_status string 计算总状态。有 INIT(初始化),WAIT(排队中), RUNNING(生成中), FAILED(失败), SUCCESS(成功)四种状态,只有 SUCCESS 为成功状态
├─task_progress_detail number 图片生成总进度,0为未处理完,0-1之间的小数为生成进度, 1为处理完成
├─task_progress number 图片生成总进度,进度包含2种,0为未处理完,1为处理完成
├─sub_task_result_list object[] 子任务生成结果列表
├─sub_task_status string 单风格图片状态。有 INIT(初始化),WAIT(排队中), RUNNING(生成中), FAILED(失败), SUCCESS(成功)四种状态,只有 SUCCESS 为成功状态
├─sub_task_progress_detail number 单任务图片生成进度,0为未处理完,0-1之间的小数为生成中, 1为处理完成
├─sub_task_progress number 单任务图片生成进度,进度包含2种,0为未处理完,1为处理完成
├─sub_task_error_code string 单风格任务错误码。0:正常;501:文本黄反拦截;201:模型生图失败
├─final_image_list object [] 单风格任务产出的最终图列表
├─img_url string 图片所在 BOS http 地址,默认 30 天失效
├─height integer 图片像素信息-高度
├─width integer 图片像素信息-宽度
├─img_approve_conclusion string 图片机审结果,"block":输出图片违规;"review": 输出图片疑似违规;"pass": 输出图片未发现问题;

返回示例

{
    "data": {
        "task_progress_detail": 1,
        "task_progress": 1,
        "task_status": "SUCCESS",
        "sub_task_result_list": [
            {
                "final_image_list": [
                    {
                        "width": 1024,
                        "img_url": "http://bj.bcebos.com/v1/ai-picture-creation/watermark/239833182_0_final.png?authorization=bce-auth-v1%2FALTAKBvI5HDpIAzJaklvFTUfAz%2F2024-08-16T08%3A29%3A13Z%2F86400%2F%2Fdae424e75ba6faa9ef7285947c8df4adbc48ec936776bff6c29e9530cc08ed62",
                        "img_approve_conclusion": "pass",
                        "height": 1024
                    }
                ],
                "sub_task_progress_detail": 1,
                "sub_task_progress": 1,
                "sub_task_error_code": 0,
                "sub_task_status": "SUCCESS"
            }
        ],
        "task_id": 1824362700265781971
    },
    "log_id": 1824362776382441905
}

错误码

错误码 错误信息 描述
282000 internal error 输入特殊表情字符或服务器内部错误,请调整输入文本再次请求, 如果持续出现此类错误,请在控制台提交工单联系技术支持团队
216303 任务超时,请重新尝试 当等待时间超过默认配置时间或者自定义超时时间,查询任务结果时报超时错误,默认超时时间为5分钟。若您按照默认并发2调用遇到了超时报错问题,可以增加多次重试逻辑以重新提交超时任务,或通过自定义超时时间进行灵活调整;若仍对您的业务造成较大影响,请通过客户经理或提交工单联系我们
282004 文本敏感信息拦截/图片敏感信息拦截 请求中包含敏感词、非法参数、字数超限,或上传违规参考图,请检查后重新尝试
282003 miss required request parameter 缺少必要参数
17 online flow control 日配额流量超限
18 Open api qps request limit reached QPS 超限额
216100 invalid parameter 无效参数 参数不满足格式要求
216201 image format error 参考图不满足格式要求
216205 input oversize 参考图尺寸不满足要求
4 请求超限 错误信息为中文的“请求超限”指所有用户提交的 AI 作画总数超限制
13 QPS 超限 错误信息为中文的“QPS 超限”指单个用户使用提交请求接口的 QPS 超限
15 并发超限 错误信息为中文的“并发超限”指单个用户使用 AI 作画的并发超限
17 用量超限 错误信息为中文的“用量超限”指单个用户使用 AI 作画的用量超限
上一篇
AI视频混剪
下一篇
AI作画-画面描述生成