资讯 社区 文档 控制台
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术
AR与VR
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
信息服务
智能园区

接口说明

接口说明

语音合成

接口描述

基于该接口,开发者可以轻松的获取语音合成能力

请求说明

  • 合成文本长度必须小于1024字节,如果本文长度较长,可以采用多次请求的方式。文本长度不可超过限制

举例,要把一段文字合成为语音文件:

void tts(aip::Speech client)
{
    std::ofstream ofile;
    std::string file_ret;
    std::map<std::string, std::string> options;
    options["spd"] = "9";

    // 合成成功的二进制数据写入文件中
    ofile.open("./test.mp3", std::ios::out | std::ios::binary);

    // 不带可选参数调用
    Json::Value result = client.text2audio("百度语音合成测试", aip::null, file_ret);

    // 带可选参数调用, 参数参考参数列表中的可选参数
    // Json::Value result = client.text2audio("百度语音合成测试", options, file_ret);

    // 如果file_ret为不为空则说明合成成功,返回mp3文件内容回结果
    if (!file_ret.empty())
    {
        ofile << file_ret;
    } else {
        // 服务端合成错误
        std::cout << result.toStyledString();
    }

}
参数 类型 描述 是否必须
tex String 合成的文本,文本长度必须小于1024GBK字节,建议每次请求文本不超过120字节,约为60个汉字或者字母数字。
请注意计费统计依据:120个GBK字节以内(含120个)记为1次计费调用;每超过120个GBK字节则多记1次计费调用。
cuid String 用户唯一标识,用来区分用户,
填写机器 MAC 地址或 IMEI 码,长度为60以内
spd String 语速,取值0-9,默认为5中语速
pit String 音调,取值0-9,默认为5中语调
vol String 音量,取值0-15,默认为5中音量(取值为0时为音量最小值,并非为无声)
per String 普通发音人选择:度小美=0(默认),度小宇=1,,度逍遥(基础)=3,度丫丫=4
per String 精品发音人选择:度逍遥(精品)=5003,度小鹿=5118,度博文=106,度小童=110,度小萌=111,度米朵=103,度小娇=5

返回样例

返回Json::value对象。 如果合成成功,error_code为Json::nullValue, 下行数据为二进制语音文件数据。 如果合成出现错误,则会填充除data属性外的其它属性。

返回失败:

// 失败返回
{
    "err_no":500,
    "err_msg":"notsupport.",
    "sn":"abcdefgh",
    "idx":1
}