资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

常见问题

demo 及 SDK反馈

  1. SDK及DEMO BUG反馈格式:
  2. 现象描述 调用我们的xxx方法之后,报错。
  3. 输入参数:(DEMO中含有“反馈”两个字的日志)
  4. 输出结果:
  5. 音频文件: 通过OUT_FILE参数获取录音音频;
  6. 用户日志:先清空日志,之后调用我们的某个方法结束。请提供给我们之中的完整日志。
  7. 手机信息: 手机型号, android、ios版本号等信息

FAQ

1.语音识别结果与音频内容不匹配

  • 语音识别返回结果与音频内容不匹配,例如:“嗨嗨嗨”、“嗯嗯嗯嗯嗯”、“什么”等错误返回。
  • 解决方法:排查音频采样率、声道、格式等参数是否符合接口规范。如与要求不符,需要用工具对音频进行转码,转码工具跳转

2.3300错误码怎么办?

  • 语音识别api使用的是HTTP POST方法, BODY里直接放置json, Content-Type头部为 application/json。 并非常见的浏览器表单请求(application/x-www-form-urlencoded或者multipart/x-www-form-urlencoded)。
  • 必填字段:format rate channel cuid token cuid token cuid token cuid token,请勿漏填。此外 (speech, len) 及 (url, callback) 这两组参数必须二选一,如果都填,默认处理第一组。
  • 必填字段如format rate channel cuid token,请勿漏填。此外 (speech, len) 及 (url, callback) 这两组参数必须二选一,如果都填,默认处理第一种,并确认音频时长截取为60s以下。

3.3309错误码怎么办?

  • wav和amr的音频,服务端会自动转为pcm,这个过程中导致转码出错。请确认下format及rate参数与音频一致,并确认音频时长截取为60s以下。

4.3301错误码怎么办?

  • 识别结果实际为空。可能是音频质量过差,不清晰,或者是空白音频。
  • 有时也可能是pcm填错采样率。如16K采样率的pcm文件,填写的rate参数为8000。

5.行业与场景限制

  • 根据工信部《综合整治骚扰电话专项行动方案》、《关于推进综合整治骚扰电话专项行动的工作方案》,相关能力不得用于商业营销类、恶意骚扰类和违法犯罪类骚扰电话类场景,也不支持在贷款、理财、信用卡、股票、基金、债券、保险、售房租房、医疗机构、保健食品、人力资源服务、旅游等场景的骚扰电话营销行为。

6. 商务合作的流程是怎样的?

  • 请在Speech官网底部点击“商务合作”,详细描述您的需求。或者在百度云提交工单申请合作。

7. 一句话说完后,如何控制不自动停止识别?/ 为何我静音一段时间后,自动停止了识别?

  • 关闭VAD即可。

8. 离线可以支持识别任意词识别(听写识别)吗?

  • 我们推荐使用在线识别,离线识别仅支持命令词识别。如果您有强烈、明确的离线任意词识别的场景,请详细描述您的需求,在官网底部点击“商务合作”,我们会有专人联系。

9. 觉得识别不准确怎么办?

  • 请对类似的语音做多次尝试,并整理录音文件、识别的日志(带sn)、期望的识别结果以及实际的识别结果文件,在QQ群或通过百度云工单提交给我们。

10. 为何我的App进入后台后,自动停止了识别/唤醒?

  • 3.0.5.6 版本进入后台后不再打断唤醒/识别
  • iOS后台唤醒会出现很多问题导致产品可用性不能满足上线要求,同时为了规避各程序间的冲突,sdk会主动停止唤醒。

具体问题如:

  • 与siri冲突,长按home键会被siri把录音能力夺取
  • 顶部出现红条
  • 无法唤起任何应用,即使程序自己都无法唤起
  • 程序被系统杀死的问题无解,即便通过类似hack(比如某些程序后台播放音频)的方式保证存活率,也会导致播放和录音冲突

    鉴于以上考虑,程序切到后台会自动停止唤醒功能。

11.如何同时集成语音识别和语音合成?两个.a名字是一样的,内容一样么?

  • 内容不一样,同时集成只需将.a换个名字重新导入即可。同名的资源文件内容是一样的。

12.集成到自身工程之后,启动报错“vad: start error”

  • 一般是因为资源文件没有正确引入。请参考demo工程资源文件的引入办法,并且在代码中检查获得资源文件的指针不为nil。

13. 识别时报错:“Server app name unknown”

  • 请确认填写了正确的 api_key, secret_key, app_id,且在官网正确绑定了包名。
  • 请确认您的应用的并发和日配额没有超限。
上一篇
EasyDL语音自训练平台
下一篇
常用音频处理工具