语音识别 不正确
啦啦活 发布于2017-10-12 浏览:2224 回复:1
0
收藏
快速回复

我使用的服务是:语音识别接口

调用的接口是:REST API


先说下我的问题 

我采集PCM格式的语音数据,并保存在本地的TXT文件中。通过对应的PYTHON脚本上传到百度语音识别接口

提示 :

"err_msg":"speech quality error.","err_no":3301,"sn":"890493694001507791927"}

当我将语音数据 通过软件转成WAV格式,然后保存在在TXT中,这时候上传 就能正确识别了。(这里还是同样的脚本,同样的参数,Content-Type: audio/pcm; rate=8000还是PCM

{"corpus_no":"6475918377016957288","err_msg":"success.","err_no":0,"result":["你好开灯,"],"sn":"274345766781507792243"}


问题:

两个文件中的语音数据是一样的,为啥一个能识别一个不能?

可以看出转换成WAV的语音数据和之前的PCM数据 除了多了表头 完全一样。(这里还是同样的脚本,同样的参数,Content-Type: audio/pcm; rate=8000还是PCM)


收藏
点赞
0
个赞
共1条回复 最后由fujiayi1984回复于2017-10-16
#2fujiayi1984回复于2017-10-16

啦啦活:

我使用的服务是:语音识别接口

调用的接口是:REST API


先说下我的问题 

我采集PCM格式的语音数据,并保存在本地的TXT文件中。通过对应的PYTHON脚本上传到百度语音识别接口

提示 :

"err_msg":"speech quality error.","err_no":3301,"sn":"890493694001507791927"}

当我将语音数据 通过软件转成WAV格式,然后保存在在TXT中,这时候上传 就能正确识别了。(这里还是同样的脚本,同样的参数,Content-Type: audio/pcm; rate=8000还是PCM

{"corpus_no":"6475918377016957288","err_msg":"success.","err_no":0,"result":["你好开灯,"],"sn":"274345766781507792243"}


问题:

两个文件中的语音数据是一样的,为啥一个能识别一个不能?

可以看出转换成WAV的语音数据和之前的PCM数据 除了多了表头 完全一样。(这里还是同样的脚本,同样的参数,Content-Type: audio/pcm; rate=8000还是PCM)


回复啦啦活:请看下原始pcm的问题。可能rate或者编码造成的

0
TOP
切换版块