短文本在线合成（TTS）

更新时间：2024-12-11

简介

短文本在线合成组件（TTS）提供高度拟人、流畅自然的语音合成服务，将文本朗读出来，基础音库性价比更高，精品音库听感更逼真。

基本用法

下面是一个简单的例子来指导你开始使用这个组件

import os
import appbuilder

# 请前往千帆AppBuilder官网创建密钥，流程详见：https://cloud.baidu.com/doc/AppBuilder/s/Olq6grrt6#1%E3%80%81%E5%88%9B%E5%BB%BA%E5%AF%86%E9%92%A5
os.environ["APPBUILDER_TOKEN"] = '...'
tts = appbuilder.TTS()
cwd = os.getcwd()

# 使用baidu-tts模型, 默认返回MP3格式
inp = appbuilder.Message(content={"text": "欢迎使用语音合成"})
out = tts.run(inp)
mp3_sample_path = os.path.join(cwd,"sample.mp3")
with open(mp3_sample_path, "wb") as f:
    f.write(out.content["audio_binary"])
print("成功将文本转语音，mp3格式文件已写入：{}".format(mp3_sample_path))

# 使用paddlespeech-tts模型，目前只支持返回WAV格式
wav_sample_path = os.path.join(cwd,"sample.wav")
inp = appbuilder.Message(content={"text": "欢迎使用语音合成"})
out = tts.run(inp, model="paddlespeech-tts", audio_type="wav")
with open(wav_sample_path, "wb") as f:
    f.write(out.content["audio_binary"])
print("成功将文本转语音，wav格式文件已写入：{}".format(wav_sample_path))

参数说明

run 函数接收的参数定义:

message (obj: Message): 待转为语音的文本. 举例: Message(content={"text": "欢迎使用百度语音"})
如果使用baidu-tts模型，text最大文本长度为1024 GBK编码长度, 如果使用paddlespeech-tts模型, text最大文本长度是510个字符.
model (str, 可选): 默认是baidu-tts模型，可选值：paddlespeech-tts、baidu-tts
speed(int, 可选): 语音语速，默认是5中等语速，取值范围在0~15之间，如果使用paddlespeech-tts模型，参数自动失效
pitch(int, 可选): 语音音调，默认是5中等音调，取值范围在0~15之间，如果使用paddlespeech-tts模型，参数自动失效
volume(int, 音量): 语音音量，默认是5中等音量，取值范围在0~15之间，如果使用paddlespeech-tts模型，参数自动失效
person(int, 可选): 语音人物特征，默认是0(度小美),可选值: 1(度小宇) 、0(度小美)、 3(度逍遥-基础)、 4(度丫丫)、 5003(度逍遥-精品)、 5118(度小鹿) 、106(度博文)、 110(度小童)、 111(度小萌)、 103(度米朵)、 5(度小娇), 如果选择模型为paddlespeech-tts，参数自动失效
audio_type(str, 可选): 音频文件格式，默认是mp3, 如果使用paddlespeech-tts模型，参数只能设为wav
timeout (float, 可选): HTTP超时时间
retry (int, 可选)： HTTP重试次数

返回参数说明:

message (obj: Message): 文本转语音结果. 举例: Message(content={"audio_binary": b"xxx", "audio_type": "mp3"})