常见问题
更新时间:2023-02-01
demo 及 SDK反馈
- SDK及DEMO BUG反馈格式:
- 现象描述 调用我们的xxx方法之后,报错。
- 输入参数:(DEMO中含有“反馈”两个字的日志)
- 输出结果:
- 音频文件: 通过OUT_FILE参数获取录音音频;
- 用户日志:先清空日志,之后调用我们的某个方法结束。请提供给我们之中的完整日志。
- 手机信息: 手机型号, android、ios版本号等信息
FAQ
1.3300错误码怎么办?
- 语音识别api使用的是HTTP POST方法, BODY里直接放置json, Content-Type头部为 application/json。 并非常见的浏览器表单请求(application/x-www-form-urlencoded或者multipart/x-www-form-urlencoded)。
- 必填字段:format rate channel cuid token cuid token cuid token cuid token,请勿漏填。此外 (speech, len) 及 (url, callback) 这两组参数必须二选一,如果都填,默认处理第一组。
- 必填字段如format rate channel cuid token,请勿漏填。此外 (speech, len) 及 (url, callback) 这两组参数必须二选一,如果都填,默认处理第一种,并确认音频时长截取为60s以下。
2.3309错误码怎么办?
- wav和amr的音频,服务端会自动转为pcm,这个过程中导致转码出错。请确认下format及rate参数与音频一致,并确认音频时长截取为60s以下。
3.3301错误码怎么办?
- 识别结果实际为空。可能是音频质量过差,不清晰,或者是空白音频。
- 有时也可能是pcm填错采样率。如16K采样率的pcm文件,填写的rate参数为8000。
4.行业与场景限制
- 根据工信部《综合整治骚扰电话专项行动方案》、《关于推进综合整治骚扰电话专项行动的工作方案》,相关能力不得用于商业营销类、恶意骚扰类和违法犯罪类骚扰电话类场景,也不支持在贷款、理财、信用卡、股票、基金、债券、保险、售房租房、医疗机构、保健食品、人力资源服务、旅游等场景的骚扰电话营销行为。
5. 商务合作的流程是怎样的?
- 请在Speech官网底部点击“商务合作”,详细描述您的需求。或者在百度云提交工单申请合作。
6. 一句话说完后,如何控制不自动停止识别?/ 为何我静音一段时间后,自动停止了识别?
- 关闭VAD即可。
7. 离线可以支持识别任意词识别(听写识别)吗?
- 我们推荐使用在线识别,离线识别仅支持命令词识别。如果您有强烈、明确的离线任意词识别的场景,请详细描述您的需求,在官网底部点击“商务合作”,我们会有专人联系。
8. 觉得识别不准确怎么办?
- 请对类似的语音做多次尝试,并整理录音文件、识别的日志(带sn)、期望的识别结果以及实际的识别结果文件,在QQ群或通过百度云工单提交给我们。
9. 为何我的App进入后台后,自动停止了识别/唤醒?
- 3.0.5.6 版本进入后台后不再打断唤醒/识别
- iOS后台唤醒会出现很多问题导致产品可用性不能满足上线要求,同时为了规避各程序间的冲突,sdk会主动停止唤醒。
具体问题如:
- 与siri冲突,长按home键会被siri把录音能力夺取
- 顶部出现红条
- 无法唤起任何应用,即使程序自己都无法唤起
-
程序被系统杀死的问题无解,即便通过类似hack(比如某些程序后台播放音频)的方式保证存活率,也会导致播放和录音冲突
鉴于以上考虑,程序切到后台会自动停止唤醒功能。
10.如何同时集成语音识别和语音合成?两个.a名字是一样的,内容一样么?
- 内容不一样,同时集成只需将.a换个名字重新导入即可。同名的资源文件内容是一样的。
11.集成到自身工程之后,启动报错“vad: start error”
- 一般是因为资源文件没有正确引入。请参考demo工程资源文件的引入办法,并且在代码中检查获得资源文件的指针不为nil。
12. 识别时报错:“Server app name unknown”
- 请确认填写了正确的 api_key, secret_key, app_id,且在官网正确绑定了包名。
- 请确认您的应用的并发和日配额没有超限。