产品服务
语音技术
图像技术
人脸与人体识别
视频技术
AR与VR
自然语言处理
数据智能
知识图谱
软硬一体产品
专项解决方案
定制化训练平台
深度学习开放平台
内置离线识别SDK,5分钟快速搭建人脸识别业务应用
硬件开源,软件开放,为机器人打造软硬一体的视觉方案
看得准、听得懂、说得明、交互好的一体化服务机器人
快速完成用户身份核实,确保真人且为本人
在复杂环境下自动识别特定人员及异常行为
针对准入场景,提供行业定制的全流程方案
辅助坐席人员实时了解客户意图,推荐话术应答
参会人邀请注册、刷脸签到、与会人统计管理平台
通过语音交互提供百度搜索结果,增强搜索能力
人脸注册、人脸捕获、会员识别整套解决方案
提供自研的数据仓库、日志分析、数据挖掘等方案
可视化训练模型服务平台,获取高精度定制图像识别、声音识别服务
自助定制专属模板,实现海量单据卡证的结构化识别
智能对话系统开发平台,让产品快速拥有对话交互能力
集合代码环境、算法算力和数据集的线上一站式开发平台
提供深度学习系列公开课与商业案例
最符合中国开发者需要的深度学习框架
基于真实样本的超大规模的开放数据集
AI加速器
AI市场
资讯
社区
语音识别辅助工具上线:音频转码、拼音相似度比较
发布日期:2018-02-06 10:26:15浏览量:844次
相关标签 语音识别 上线公告

尊敬的百度AI开放平台用户:

语音识别正式上线辅助工具模块【音频转码】【拼音相似度比较】,方便您可以更方便地接入语音识别服务,并提高语音识别效果,欢迎使用!

1.音频文件转码

在使用百度语音识别接口时,建议的音频格式为:pcm文件、16bit 位深的单声道、采样率16K如果上传其它格式,则会在服务器端转码成pcm,调用接口的耗时会增加。

为方便用户对音频文件进行转化,我们提供了音频文件转码小工具,让用户方便获取合适的音频文件,从而提高识别效率。

【开发帮助文档】http://ai.baidu.com/docs#/ASR-Tool/1f9b114d

 

2.拼音相似度比较

为提高通讯录、歌曲名称等专有名词的语音识别准确率,我们提供了拼音相似度比较的工具。通过模糊匹配方法,在一组候选词中找出与搜索词读音最为接近的词组。

以通讯录为例,将通讯录中的联系人作为一组候选词,如:"张三",  "张散", "张丹", "张成", "李四", "李奎"等;当用户的搜索词被识别为张山时,我们发现张三的发音与之最为相似,因此,可以将搜索结果调整为张三

【开发帮助文档】http://ai.baidu.com/docs#/ASR-Tool/e83a09f2

 

成功案例参考】

智能设备行业案例:智伴-语音技术让孩子拥有"智能伙伴"

视频行业案例:语音识别助爱奇艺优化搜索体验

游戏行业案例:语音识别提升逍遥西游万家在线交流沉浸感

 

百度AI语音识别技术将持续为您提供优质服务,立即使用

语音技术社区交流平台:http://ai.baidu.com/forum/topic/list/166