语音识别正式上线辅助工具模块【音频转码】【拼音相似度比较】,方便您可以更方便地接入语音识别服务,并提高语音识别效果,欢迎使用!
1.音频文件转码
在使用百度语音识别接口时,建议的音频格式为:pcm文件、16bit 位深的单声道、采样率16K。如果上传其它格式,则会在服务器端转码成pcm,调用接口的耗时会增加。
为方便用户对音频文件进行转化,我们提供了音频文件转码小工具,让用户方便获取合适的音频文件,从而提高识别效率。
【开发帮助文档】http://ai.baidu.com/docs#/ASR-Tool/1f9b114d
2.拼音相似度比较
为提高通讯录、歌曲名称等专有名词的语音识别准确率,我们提供了拼音相似度比较的工具。通过模糊匹配方法,在一组候选词中找出与搜索词读音最为接近的词组。
以通讯录为例,将通讯录中的联系人作为一组候选词,如:"张三", "张散", "张丹", "张成", "李四", "李奎"等;当用户的搜索词被识别为“张山”时,我们发现“张三”的发音与之最为相似,因此,可以将搜索结果调整为“张三”。
【开发帮助文档】http://ai.baidu.com/docs#/ASR-Tool/e83a09f2
【成功案例参考】
智能设备行业案例:智伴-语音技术让孩子拥有"智能伙伴"
视频行业案例:语音识别助爱奇艺优化搜索体验
游戏行业案例:语音识别提升逍遥西游万家在线交流沉浸感
请登录后评论
TOP
切换版块
貌似是restapi的吧.