资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

Python SDK调用图像Images教程

本文介绍了如何通过千帆ModelBuilder Python SDK,实现根据用户输入的文本生成图片。通过本文,你将了解如何通过SDK调用Stable-Diffusion-XL模型API生成图像。

实现效果

例如,希望根据文本生成图像,使用Stable-Diffusion-XL模型API可以实现此功能。

  • 用户提示词:A Ragdoll cat with a bowtie
  • 调用Stable-Diffusion-XL模型API后,可以展示生成的图像,如下图所示:

image.png

前期准备

在开始本教程操作步骤之前,需要完成以下准备工作:

  • 确保已完成注册百度智能云账号。注意:为保障服务稳定运行,账户最好不处于欠费状态。
  • 确保已安装了Python,SDK支持 Python >= 3.7版本
  • 平台已默认开通API调用权限,无需申请授权。

步骤一:安装SDK

说明:如果已安装SDK,此步骤可跳过。

使用以下命令安装SDK和相关依赖

pip install qianfan

# 安装依赖
pip install pillow

步骤二:查看示例代码

例如,本文希望调用Stable-Diffusion-XL模型API能力。

(1)复制示例代码。

点击查看Stable-Diffusion-XL文档,并点击复制示例代码,代码如下。

import os
import qianfan
from PIL import Image
import io

# 使用安全认证AK/SK鉴权,通过环境变量方式初始化;替换下列示例中参数,安全认证Access Key替换your_iam_ak,Secret Key替换your_iam_sk
os.environ["QIANFAN_ACCESS_KEY"] = "your_iam_ak"
os.environ["QIANFAN_SECRET_KEY"] = "your_iam_sk"

t2i = qianfan.Text2Image()
resp = t2i.do(prompt="A Ragdoll cat with a bowtie.", with_decode="base64",model="Stable-Diffusion-XL")
img_data = resp["body"]["data"][0]["image"]

img = Image.open(io.BytesIO(img_data))
img.show(img)

(2)将代码复制到本地环境,如下图所示。

image.png

步骤三:修改示例代码

需要修改初始化相关值、prompt等值,如下所示:

image.png

参数名称
修改前的值
修改后的值
QIANFAN_ACCESS_KEY your_iam_ak · 示例:ALTAKRG****HTRtGVgO
· 如何获取该参数值:
百度智能云控制台-用户账户-安全认证页,查看Access Key、Secret Key。
image.png
QIANFAN_SECRET_KEY your_iam_sk · 示例:c05e36c**da79f8
· 如何获取该参数值:
百度智能云控制台-用户账户-安全认证页,查看Access Key、Secret Key。
image.png
prompt A Ragdoll cat with a bowtie. 设置用户希望图片包含的元素prompt提示词,本文示例无需修改此参数值
with_decode base64 是否自动decode,如果不指定将返回原始的based64 encoded二进制数据,本文示例无需修改此参数值

修改相关参数后,如下图所示。

image.png

步骤四:运行代码

运行代码,调用成功后,展示生成的图片,如下图所示。

image.png

上一篇
Python SDK调用对话Chat V1教程
下一篇
Go SDK调用对话Chat V1教程