产品服务
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
数据智能
知识图谱
硬件产品与服务
定制化训练平台
深度学习开放平台
硬件产品
软硬一体化的远场语音开发套件
硬件与软件开源的机器人视觉产品方案
软硬一体化的人脸识别开发套件
百度嵌入式软硬件一体人脸抓拍机
硬件赋能
快速赋能移动设备及智能手机
零代码生成高性能端计算模型
高性能计算卡参考方案&软件工具包
端云一体的多模态人机交互解决方案
EdgeCloud端云协同平台
为抓拍机厂商提供端云对接协议及产品推广
可视化配置,实现抓拍机管理与业务系统集成
硬件合作
开放评测认证让您的产品加入AI生态
开放与芯片合作,让AI深度走入终端设备
可视化训练模型服务平台,获取高精度定制图像识别、声音识别、文本分类服务
自助定制专属模板,实现海量单据卡证的结构化识别
智能对话系统开发平台,让产品快速拥有对话交互能力
自助训练专属模型,提升业务场景语音识别效果
集合代码环境、算法算力和数据集的线上一站式开发平台
提供深度学习系列公开课与商业案例
源于产业实践的开源深度学习平台
零代码生成高性能端计算模型
基于真实样本的超大规模的开放数据集
合作伙伴
面向AI技术应用落地的重点行业,共同实现客户价值
飞桨为企业和教育合作伙伴提供系统化的资源和服务
合作伙伴与百度AI携手,提供更丰富的AI服务
AI加速器
AI市场
资讯
社区
语音合成
基于业界领先的深度神经网络技术,提供高度拟人、流畅自然的语音合成服务,让您的应用、设备开口说话,更具个性
功能介绍
功能演示
应用场景
特色优势
使用方式
相关推荐
功能介绍
提供多种发音人
提供基础音库和精品音库共9种发音人供您选择,适用于泛阅读、订单播报、智能硬件等应用场景,即将推出更多特色发音人
语速、音调可调节
支持多种参数配置,可根据场景需求对发音人的语速、音调、音量进行灵活设置,满足个性化需求
支持多音字标注
中文多音字可通过标注拼音、音调自行定义发音,例如“轻舟已过万重(chong2)山”、“脑筋急转(zhuan3)弯”
多种调用方式,满足多场景需求
提供REST API接口、离在线融合SDK、纯离线SDK,满足不同网络环境下的语音合成需求,提供流畅自然的合成体验
功能演示
应用场景
泛阅读
订单播报
智能硬件
泛阅读
通过阅读类APP阅读小说或新闻时,使用语音合成技术为用户提供多种发音人的朗读功能,释放双手和双眼,获得更极致的阅读体验
合作案例
特色优势
支持多语言多音色
支持中文、英文、中英文混读合成,提供基础音库和精品音库共9种发音人供您选择,让您的应用拥有个性化的声音
丰富的场景应用
支持纯在线、纯离线、离在线融合三种应用方式,支持在有网、无网、弱网环境下的合成播报,满足不同的场景需求
方便快捷的集成方式
提供REST API接口,方便可发起网络请求的设备进行合成;提供Android、iOS SDK,轻巧简便,便于手机、智能硬件快速集成
使用方式
在线API接口
提供基于HTTP请求的REST API接口,将文本转换为可以播放的音频文件。
离在线融合SDK
提供Android/iOS离在线融合SDK,可以根据网络环境的变化自动进行在线合成与离线合成的切换,弱网环境也可继续使用
离线SDK
提供Android、iOS端离线SDK,可直接在设备终端进行语音合成。无需网络即可实时响应,提供稳定一致、流畅自然的合成体验
即刻获得语音AI能力
上手快速简单,请点击下方的立即使用
立即使用