语音识别时MP3音质太差WAV又说音频文件过大?
天下归心419 发布于2018-11-08 18:58 浏览:54 回复:2
0
收藏

{'err_msg': 'content len too long.', 'err_no': 3310, 'sn': ''}

{'err_msg': 'speech quality error.', 'err_no': 3301, 'sn': '3290828911541673885'}

玩我呢?几分钟的音频就不行了?音质差算怎么回事?文件过大又咋了?还不行是吧?

收藏
点赞
0
个赞
共2条回复 最后由goJhou回复于2018-11-12 14:00
#3goJhou回复于2018-11-12 14:00:16

身为研发请不要把责任推给接口。接口文档明确规定音频时长不得大于60s,你不遵循协议,谁会理所应当服务你?

耳背的人也需要你放大音量才能听清。就哪怕你跟人去对话也要遵循这一点吧?你话说给谁听的,你说给自己听还指望系统能分析吗

 

朋友,同为研发,请多翻文档。

0
#2荒墨丶迷失回复于2018-11-12 10:40:06

文档上有很清楚的描述?不知道看清楚了没?

百度语音识别通过 REST API 的方式给开发者提供一个通用的 HTTP 接口。 上传需要完整的录音文件,录音文件时长不超过60s。

音频时长不超过60s,请将音频时长截取为60s以下。

格式支持:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。推荐pcm 采样率 :16000 固定值。 编码:16bit 位深的单声道。

百度服务端会将非pcm格式,转为pcm格式,因此使用wav、amr会有额外的转换耗时。

2
TOP
切换版块