产品服务
语音技术
图像技术
人脸与人体识别
视频技术
AR与VR
自然语言处理
数据智能
知识图谱
软硬一体产品
专项解决方案
定制化训练平台
深度学习开放平台
内置离线识别SDK,5分钟快速搭建人脸识别业务应用
硬件开源,软件开放,为机器人打造软硬一体的视觉方案
看得准、听得懂、说得明、交互好的一体化服务机器人
快速完成用户身份核实,确保真人且为本人
在复杂环境下自动识别特定人员及异常行为
针对准入场景,提供行业定制的全流程方案
辅助坐席人员实时了解客户意图,推荐话术应答
参会人邀请注册、刷脸签到、与会人统计管理平台
通过语音交互提供百度搜索结果,增强搜索能力
人脸注册、人脸捕获、会员识别整套解决方案
提供自研的数据仓库、日志分析、数据挖掘等方案
可视化训练模型服务平台,获取高精度定制图像识别、声音识别服务
自助定制专属模板,实现海量单据卡证的结构化识别
智能对话系统开发平台,让产品快速拥有对话交互能力
集合代码环境、算法算力和数据集的线上一站式开发平台
提供深度学习系列公开课与商业案例
最符合中国开发者需要的深度学习框架
基于真实样本的超大规模的开放数据集
AI加速器
AI市场
资讯
社区
【有声阅读案例】语音合成助力网文有声阅读
发布日期:2018-02-05 10:21:37浏览量:683次
相关标签 语音合成 行业案例

客户简介

万读文学成立于2016年,是行业增速最快的精品网络文学阅读平台,在业内赢得广泛关注。公司技术产品团队来自清华/百度系,内容编辑团队来自阿里、网易,核心渠道推广团队拥有多年自媒体推广经验,累计为千万用户提供优质阅读体验。

 

核心诉求

现代社会人们拥有的完整的阅读时间越来越少,更多是利用碎片化时间:奔赴地铁途中、地铁上、电梯间,在这些场景中一大半都无法集中精力阅读屏幕上的文字。识别文字并精准转化为语音并用最接近人声的效果朗读出来成了最书友们最迫切的需求。但现在市面上有很多语音识别和合成软件并不能准确识别语义并精确分词,朗读效果并不好。

 

 解决方案

百度语音合成服务:采用离在线融合技术,根据当前网络状况,自动判断使用本地引擎或者云端引擎,进行语音合成。基于大数据的情感语音合成技术,适用于小说阅读广播播报智能家居等多个场景,让应用开口说话。

为了兼容wifi4G和离线的不同场景,为开发者提供离在线融合SDK,并实时判断当前网络环境,自动匹配使用离线还是在线合成引擎。并且基于各类产品的开发平台,提供包括JavaPHPPythonC#Node.js7种语言。支持中文普通话播报、中英文混读播报,音色支持男声和女声。

应用示例

Step1:用户启动APP进入小说阅读页,点击顶部菜单栏中的耳机icon,开启语音朗读功能;

Step2:开启后从当前页面第一句开始朗读,通过句号、问号等标点断句,当前阅读的句子用高亮底色标出,便于用户在查看屏幕时最快跟上朗读进度。

Step3:在百度语音提供的4种音色中选取了甜美女声和稳重男声,用户可根据喜好切换,切换后立即生效。

Step4:睡前听书场景下,提供设置定时关闭语音朗读功能,设置15分钟、30分钟等4个时间段提供用户选择。

 

 合作成果

1. 万读文学在添加百度语音合成功能后,实现了听书的阅读模式,有效提高了阅读体验,并提高了用户单次使用的时长;

2. 百度语音合成技术的识别精确率达99%,同其他语音合成产品相比更能准确表达小说原文含义,也更接近人声效果;

3. 为网络文学行业提供了新的阅读方式,解放用户双手的同时,更高效的利用书友的碎片化时间。

 

客户感言


     小飞博士  万读CEO

 “万读”作为2017年快速崛起的移动阅读平台,获得业界广泛关注。为满足用户核心阅读体验需求和百度语音开展合作,累计为数百万APP用户提供语音听书功能,赢得用户一致好评。 

 

语音技术产品详细介绍:语音识别语音合成语音唤醒

语音技术社区交流:http://ai.baidu.com/forum/topic/list/166