我使用的服务是:语音识别接口
调用的接口是:REST API
先说下我的问题
我采集PCM格式的语音数据,并保存在本地的TXT文件中。通过对应的PYTHON脚本上传到百度语音识别接口
提示 :
"err_msg":"speech quality error.","err_no":3301,"sn":"890493694001507791927"}
当我将语音数据 通过软件转成WAV格式,然后保存在在TXT中,这时候上传 就能正确识别了。(这里还是同样的脚本,同样的参数,Content-Type: audio/pcm; rate=8000还是PCM
{"corpus_no":"6475918377016957288","err_msg":"success.","err_no":0,"result":["你好开灯,"],"sn":"274345766781507792243"}
问题:
两个文件中的语音数据是一样的,为啥一个能识别一个不能?
可以看出转换成WAV的语音数据和之前的PCM数据 除了多了表头 完全一样。(这里还是同样的脚本,同样的参数,Content-Type: audio/pcm; rate=8000还是PCM)
收藏
点赞
0
个赞
请登录后评论
TOP
切换版块
啦啦活:
我使用的服务是:语音识别接口
调用的接口是:REST API
先说下我的问题
我采集PCM格式的语音数据,并保存在本地的TXT文件中。通过对应的PYTHON脚本上传到百度语音识别接口
提示 :
"err_msg":"speech quality error.","err_no":3301,"sn":"890493694001507791927"}
当我将语音数据 通过软件转成WAV格式,然后保存在在TXT中,这时候上传 就能正确识别了。(这里还是同样的脚本,同样的参数,Content-Type: audio/pcm; rate=8000还是PCM
{"corpus_no":"6475918377016957288","err_msg":"success.","err_no":0,"result":["你好开灯,"],"sn":"274345766781507792243"}
问题:
两个文件中的语音数据是一样的,为啥一个能识别一个不能?
可以看出转换成WAV的语音数据和之前的PCM数据 除了多了表头 完全一样。(这里还是同样的脚本,同样的参数,Content-Type: audio/pcm; rate=8000还是PCM)
回复啦啦活:请看下原始pcm的问题。可能rate或者编码造成的