核心诉求
现代社会人们拥有的完整的阅读时间越来越少,更多是利用碎片化时间:奔赴地铁途中、地铁上、电梯间,在这些场景中一大半都无法集中精力阅读屏幕上的文字。识别文字并精准转化为语音并用最接近人声的效果朗读出来成了最书友们最迫切的需求。但现在市面上有很多语音识别和合成软件并不能准确识别语义并精确分词,朗读效果并不好。
解决方案
百度语音合成服务:采用离在线融合技术,根据当前网络状况,自动判断使用本地引擎或者云端引擎,进行语音合成。基于大数据的情感语音合成技术,适用于小说阅读、广播播报、智能家居等多个场景,让应用开口说话。
为了兼容wifi、4G和离线的不同场景,为开发者提供离在线融合SDK,并实时判断当前网络环境,自动匹配使用离线还是在线合成引擎。并且基于各类产品的开发平台,提供包括Java、PHP、Python、C#、Node.js等7种语言。支持中文普通话播报、中英文混读播报,音色支持男声和女声。
具体实现方式如下:
Step1:用户启动APP进入小说阅读页,点击顶部菜单栏中的耳机icon,开启语音朗读功能;
Step2:开启后从当前页面第一句开始朗读,通过句号、问号等标点断句,当前阅读的句子用高亮底色标出,便于用户在查看屏幕时最快跟上朗读进度。
Step3:在百度语音提供的4种音色中选取了甜美女声和稳重男声,用户可根据喜好切换,切换后立即生效。
Step4:睡前听书场景下,提供设置定时关闭语音朗读功能,设置15分钟、30分钟等4个时间段提供用户选择。