语音识别到底需要啥样的音频文件?
whg4585 发布于2019-07 浏览:3669 回复:2
0
收藏

本地的音频文件全部不能识别,无论是pcm、wav、mp3哪种格式的文件,无论是网上下的,还是自己合成的,都不能

用百度语音合成的音频文件,反过来用语音识别技术却识别不了!这让我很奇怪

有点奇葩的是百度语音合成的音频,自己识别不了,但用其它平台的识别技术却能识别出来

什么鬼?

测试环境:win10+python3

收藏
点赞
0
个赞
共2条回复 最后由用户已被禁言回复于2022-04
#22用户已被禁言回复于2022-04

https://www.516ys.com/search.php?page=1&searchword=%E6%9E%9C%E6%95%A2%E8%85%BE%E9%BE%99%E5%9B%BD%E9%99%85%E7%94%B5%E6%8A%95%E5%A8%B1%E4%B9%90%E5%9C%BA%E7%9B%B4%E8%90%A5%E7%BD%91B2024%C2%B7CN%E5%BE%90%E5%B7%9E%E6%AF%95%E4%B8%9A%E7%94%9F%EF%BC%A5%EF%BC%B1%EF%BC%8A&searchtype= https://www.cifnews.com/search?keyword=%E7%9A%87%E5%AE%B6%E5%9B%BD%E9%99%85%E6%B3%A8%E5%86%8C%E3%80%90%E5%AE%98%E7%BD%91%E2%86%92TL262%C2%B7%EF%BC%A3%EF%BC%AF%EF%BC%AD%E3%80%91%E6%B1%95%E5%B0%BE%E8%8A%82%E7%9B%AE%E7%BB%84%EF%BC%BD%EF%BC%9F https://www.duitang.com/search/?kw=%E7%BC%85%E7%94%B8%E9%87%91%E9%BC%8E%E9%99%88%E5%BC%BA%E5%AE%98%E7%BD%91B2024%C2%B7CN%E5%AE%9D%E9%B8%A1%E9%AB%98%E6%A0%A1%EF%BC%A2&type=article http://www.jicheng.net.cn/searching/?k=%E9%BE%99%E6%BA%90%E5%AE%A2%E6%9C%8D%E7%94%B5%E8%AF%9D%E7%BC%85%E7%94%B8%E7%9B%B4%E8%90%A5%E7%BD%91TL262%C2%B7C%EF%BC%AFM%E6%8A%9A%E9%A1%BA%E5%8D%AB%E8%A7%86%EF%BC%9A https://ai.baidu.com/search/%E7%8E%89%E5%92%8C%E5%A8%B1%E4%B9%90app%E3%80%90TL262%C2%B7%EF%BC%A3%EF%BC%AF%EF%BC%AD%E6%AC%A2%E8%BF%8E%E6%82%A8%E3%80%91%E4%BF%9D%E5%AE%9A%E7%94%B5%E8%A7%86%E5%8F%B0%EF%BC%B1%EF%BC%B9/doc/1

0
#2用户已被禁言回复于2019-07

文档中明确写道:

格式支持:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。推荐pcm 采样率 :16000 固定值。 编码:16bit 位深的单声道。

百度服务端会将非pcm格式,转为pcm格式,因此使用wav、amr会有额外的转换耗时。

这里也提供了官方示例供测试使用 https://ai.baidu.com/docs#/ASR-API/top

 

文档中同样也有说明,语音合成的音频文件为非自然人发音,无法保证被准确识别。

 

建议您下载官方示例音频文件,如果有正确的返回结果则说明您的代码没有问题,以后只许提供符合标准的音频文件即可;

如果报错请反馈。

0
TOP
切换版块