开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
语音合成
基于业内领先的深度学习技术,提供高度拟人、流畅自然的语音合成服务,支持在线、离线多种调用方式,满足泛阅读、订单播报、智能硬件等场景的语音播报需求
产品列表
应用场景
技术特色
使用方式
支持交流
相关推荐
应用场景
阅读听书
资讯播报
订单播报
智能硬件
阅读听书
语音合成技术赋予阅读听书APP朗读听书能力,解放用户双手和双眼。多种特色音库让每一个故事都能找到合适的音色,为用户带来更极致的阅读体验
合作案例
七猫
掌阅
得间
熊猫
看书
技术特色
支持多语言多音色
支持中文、英文、中英文混读合成,提供基础音库和精品音库共14种音库供您选择,让您的产品拥有个性化的声音
语速音调可调节
支持多种参数配置,可根据场景需求对发音人的语速、音调、音量进行灵活设置,满足个性化需求
支持多音字标注
中文多音字可通过标注拼音、音调自行定义发音,例如“轻舟已过万重(chong2)山”、“脑筋急转(zhuan3)弯”
集成方式灵活丰富
提供REST API接口、离线SDK、在线SDK,充分满足不同场景下的语音合成需求,提供流畅自然的合成体验
使用方式
在线API接口
提供基于HTTP请求的REST API接口,适用于可发起网络请求的设备,将文本转换为可以播放的音频文件
在线语音合成SDK
提供Android/iOS在线语音合成SDK,适用于网络环境稳定场景下的手机、智能硬件设备快速集成
离线语音合成SDK
提供Android/iOS离线语音合成SDK,无网弱网环境也能为手机、智能硬件提供稳定流畅的合成体验
支持交流
新手指南
找到适合您业务的AI技术能力,快速创建应用,开始便捷的开发之旅
技术文档
针对使用API或SDK的开发者,提供百度语音合成技术开发文档
SDK下载
提供离线合成SDK、在线合成SDK,满足不同网络环境下的语音合成需求
即可获得语音合成能力
点击下方的立即使用,让您的产品“开口说话”
立即使用
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
行业能力
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
AI公众号
关注AI公众号
获取AI资讯,体验AI能力