错误码
更新时间:2020-11-30
错误码列表
错误码 | 用户输入/服务端 | 含义 | 一般解决方法 |
---|---|---|---|
3300 | 用户输入错误 | 输入参数不正确 | 请参考技术文档及demo,核对输入参数 |
3301 | 用户输入错误 | 音频质量过差或没有清晰语音 | 请上传包含语音的清晰音频 |
3302 | 用户输入错误 | 鉴权失败 | token字段校验失败。请使用正确的API_KEY 和 SECRET_KEY生成。或并发、调用量超出限额。或音频采样率不正确(可尝试更换为16k采样率)。 |
3303 | 服务端问题 | 百度服务器后端繁忙 | 有可能是原始音频质量过差。可以将api返回结果和原始音频反馈至工单、论坛或者QQ群 |
3304 | 用户请求超限 | 用户的请求并发超限 | 请降低识别api请求频率(账号内所有应用APPID共用并发限额) |
3305 | 用户请求超限 | 用户的日调用量(日请求量)超限 | 请开通付费,购买调用量资源(账号内所有应用APPID共用调用量限额) |
3307 | 服务端问题 | 语音服务器后端识别出错问题 | 有可能是原始音频质量过差。可以将api返回结果和原始音频反馈至论坛或者QQ群 |
3308 | 用户输入错误 | 音频过长 | 音频时长不超过60s或音频base64后超过2MB,请将音频时长截取为更短的音频 |
3309 | 用户输入错误 | 音频数据问题 | 服务端无法将音频转为pcm格式,可能是长度问题,音频格式问题等。 请将输入的音频时长截取为60s以下,并核对下音频的编码,采样率16000,单声道,小端序,16bits |
3310 | 用户输入错误 | 输入的音频文件过大 | 语音文件共有3种输入方式: json 里的speech 参数(base64后); 直接post 二进制数据;callback参数里url。 分别对应三种情况:json超过10M;直接post的语音文件超过10M;callback里回调url的音频文件超过10M |
3311 | 用户输入错误 | 采样率rate参数不在选项里 | 目前rate参数仅支持16000,填写其他值即会有此错误。 |
3312 | 用户输入错误 | 音频格式format参数不在选项里 | 目前格式仅仅支持pcm、wav、amr、m4a,如填写mp3即会有此错误 |
3313 | 服务端问题 | 语音服务器解析超时 | 请将api返回结果反馈至工单、论坛或者QQ群 |
3314 | 用户输入错误 | 音频长度过短 | 音频长度的len参数不能小于等于4 |
3315 | 服务端问题 | 语音服务器处理超时 | 请将api返回结果反馈至工单、论坛或者QQ群 |
3316 | 用户输入错误 | 音频转为pcm失败 | 使用pcm格式,或者确认wav和amr的采样率16000,单声道。 wav文件需要是pcm编码,小端序,16bits |
错误码常见问题及具体分析
3300 错误
短语音识别api使用的是HTTP POST方法, BODY里直接放置json, Content-Type头部为 application/json。 并非常见的浏览器表单请求(application/x-www-form-urlencoded或者multipart/x-www-form-urlencoded)。
必填字段:format rate channel 请勿漏填。此外 (speech, len) 及 (url, callback) 这两组参数必须二选一,如果都填,默认处理第一组。并确认音频时长截取为60s以下且音频文件base64后小于2MB。
3309错误
wav和amr的音频,服务端会自动转为pcm,这个过程中导致转码出错。请确认下format及rate参数与音频一致,并确认音频时长截取为60s以下。
3301 错误
识别结果实际为空。可能是音频质量过差,不清晰,或者是空白音频。 有时也可能是pcm填错采样率。如16K采样率的pcm文件,填写的rate参数为8000。
错误反馈
- 结果含有错误码:请提供: 1. 原始音频 2. 返回的完整json 3. 调用的时间点 4. 识别的参数
- 识别结果与期望不符: 请提供 : 1.原始音频 2. 返回的完整json 3.期望结果 4. 识别的参数 5. 是否偶发
- 调用官方的rest sdk demo报错: 如果是rest sdk的报错,请提供完整报错信息。如果是上述两项,请按上面的说明。
识别效果优化
自定义词库
自定义词库在您网页申请的应用内设置(具体位置参见下图)。
自定义词库适合短句,保证词库中一模一样的短句可以被识别出,词库中的分词优先级较高。 原始音频的采用率需为16K。
最好在1万行以内。
副作用:如果用户的测试集中包含大量非自定义词表的query,整体上准确率下降。
举例
词库定义了1个短句: 1 . 摆渡船来了 百度内部处理的可能的分词结果: 摆渡船 来 了
以下录音的结果
- 原始音频:摆渡船来了 =>识别结果: 摆渡船来了 【保证结果】
- 原始音频:摆渡船来了么 =>识别结果: 百度传来了么 【可能结果,不保证】
- 原始音频:摆渡船来 => 识别结果: 百度传来 【可能结果,不保证】
- 原始音频:百度传来了喜讯 => 识别结果: 摆渡船传来了喜讯 【不保证,词库内的分词优先级高】
反馈渠道
- ai.baidu.com 底部查找QQ群
- 网页里的应用发送工单
- 论坛