语音识别结果和期望不符而且随机
浼藉攼馃崜 发布于2019-04 浏览:1530 回复:6
0
收藏

我用的是wav文件,只把样例中的API_KEY和SECRET_KEY 和所要识别的文件和识别文件的格式改为wav,其他没有做改动,运行的是asrjson.py,结果与期望不符而且多次尝试结果还不一样。

我是什么地方没有修改吗?

求助

收藏
点赞
0
个赞
共6条回复 最后由用户已被禁言回复于2022-04
#7用户已被禁言回复于2019-05
#5 FCE_Carlife回复
2018年12月开发的,请问这个文档已更新为16K的这个文档指的是哪个?有没有开发指导文档
展开

这个是api的,官方demo在这里,https://github.com/Baidu-AIP/speech-demo android 在sdk里。

0
#6用户已被禁言回复于2019-05
#5 FCE_Carlife回复
2018年12月开发的,请问这个文档已更新为16K的这个文档指的是哪个?有没有开发指导文档
展开

https://ai.baidu.com/docs#/FAQ/top

0
#5FCE_Carlife回复于2019-05
#4 用户已被禁言回复
之前是多久?8K是老接口,以前有,但目前文档已更新为16K,之后8k接口会关闭,建议尽快更新为16K。
展开

2018年12月开发的,请问这个文档已更新为16K的这个文档指的是哪个?有没有开发指导文档

0
#4用户已被禁言回复于2019-05
#3 FCE_Carlife回复
语音识别的语音输入为8k采样率,是否会影响语音识别率和搜索模型下的词库应用? 之前提交工单,百度回复是不影响,所以已经开发结束,但是发现声音较小时候识别不到 ,不知道是否这个采样率问题
展开

之前是多久?8K是老接口,以前有,但目前文档已更新为16K,之后8k接口会关闭,建议尽快更新为16K。

0
#3FCE_Carlife回复于2019-05

语音识别的语音输入为8k采样率,是否会影响语音识别率和搜索模型下的词库应用?

之前提交工单,百度回复是不影响,所以已经开发结束,但是发现声音较小时候识别不到 ,不知道是否这个采样率问题

0
#2用户已被禁言回复于2019-04

检查下音频文件的格式。格式支持:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。推荐pcm 采样率 :16000 固定值。 编码:16bit 位深的单声道。

可以用官网的音频文件测试下效果。https://ai.baidu.com/docs#/ASR-API/top

0
TOP
切换版块