开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
语音技术

    简介

    简介

    百度语音合成服务,基于HTTP请求的REST API接口,将文本转换为可以播放的音频文件

    合成的文件格式为 mp3,pcm(8k及16k),wav(16k),具体见aue参数。 若您需要其它格式,音频文件的转换方法请参考“语音识别工具”=>“音频文件转码”一节

    本文档描述了使用语音合成服务REST API的方法。

    • 多音字可以通过标注自行定义发音。格式如:重(chong2)报集团。
    • 目前只有中英文混合这一种语言,优先中文发音。示例: " I bought 3 books” 发音 “three”; “ 3 books are bought” 发音 “three”; “我们买了 3 books” 发音“三”

    语音合成示例代码: https://github.com/Baidu-AIP/speech-demo/tree/master/rest-api-tts

    接口更新说明

    日期 更新内容 更新前的历史状态
    2020-07-21 新增2个精品音库,在线合成音库总数扩充到11个,满足更多应用场景 在线合成音库总数为11个
    2019-07-12 增加精品音库per接口,在线合成音库总数扩充到9个,满足更多应用场景 只有基础音库per接口
    2018-07-14 添加 aue 参数,可以下载wav和pcm格式
    只能下载mp3格式
    2018-07-14 tex参数兼容一次urlencode, 推荐两次urlencode
    tex参数 urlencode一次,会出现如“+”等特殊字符不能正确发音
    2018-07-14 使用POST方式提交,合成限制2048个汉字。使用GET方式提交(不推荐),
    拼接的url长度不超过1000个字符。注意:过长的文本将需要更多的请求耗时。
    如果对时间敏感,请请自行按照标点切割,可以采用多次请求的方式。
    tex参数限制512个汉字

    浏览器跨域

    目前合成接口支持浏览器跨域。 跨域demo示例: https://github.com/Baidu-AIP/SPEECH-TTS-CORS 由于获取token的接口不支持浏览器跨域。因此需要您从服务端获取或者每隔30天手动输入更新。

    上一篇
    产品定价
    下一篇
    调用流程示例