百度语音
提供业界领先的多场景语音技术,输出语音识别和语音合成能力
成为您应用的耳朵与嘴
产品功能
依托自然语言处理能力,可将声音与文字信息进行相互转换,可用于智能交互、深度问答、内容建模、用户画像建模、语义分析等场景
应用场景
智能导航
自驾出行时,结合地图指示全程语音导航,方便安全
业务痛点:驾驶过程中,频繁查看地图会增加驾驶风险
如何解决:利用语音合成技术,将导航内容进行语音播报,摆脱导航对于双眼的束缚,有效保障交通安全,降低事故风险
主要服务:语音合成
合作案例:
百度地图
应用场景
文学阅读
利用百度语音合成技术将小说文学作品进行有情感的朗读,多种设置,流畅清晰,解放双眼,畅听世界
业务痛点:阅读文章时,长时间占用眼睛和双手,造成双眼疲劳,且无法同时进行其他事情
如何解决:利用百度语音合成技术,对小说文学作品、新闻资讯报道等进行高质量的朗读,摆脱阅读对双眼双手的束缚
主要服务:语音合成
合作案例:
iReader
iReader
应用场景
应用助手
语音输入代替键盘输入,提升搜索效率
业务痛点:儿童和老人使用拼音输入较为不便,生僻字拼音输入较为复杂
如何解决:手机百度可以通过用户语音输入搜索关键词,直接匹配出相应搜索结果,利用百度语音识别技术进行搜索的效率是拼音输入搜索的1.83倍
主要服务:语音识别
合作案例:
手机百度
智能导航
文学阅读
应用助手
产品优势
使用方式灵活
支持Android、iOS以及全平台的REST API方式调用,提供多垂类识别,多语言、多音色合成
效果表现优秀
提供基于百度大脑的业界顶级声学模型和语音模型,效果行业领先,为业务产品营造顺畅体验
离线在线融合模式
根据当前用户网络状况,自动判断使用本地引擎还是云端引擎进行处理,可以兼顾速度及流量消耗
使用指南
1
新手入门
2
创建应用
3
获取密钥
4
生成签名
5
启动开发
立即获取免费API Key
现在试用,获取免费API Key,免费调用各项开放能力API