资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

常见问题

常见问题

商务合作的流程是怎样的?

请在Speech官网底部点击“商务合作”,详细描述您的需求。或者在百度云提交工单申请合作。

如何同时集成语音识别和语音合成?两个.a名字是一样的,内容一样么?

内容不一样,同时集成只需将.a换个名字重新导入即可。同名的资源文件内容是一样的。

合成的库文件和资源文件很大,如何减少SDK大小?

  • 请参考资源占用描述,实际占用用户手机空间是很低的
  • 如果不需要离线功能,可以移除所有离线发音人资源文件
  • 离线发音人的资源可以安装后再下载

如何获得合成的音频数据

请参考Demo中的synthesizerNewDataArrived方法。注意合成的数据是逐段返回的,如果需要完整的音频,开发者自行拼接数据即可。

如何管理AudioSession

请开发者参考 BDS_SYNTHESIZER_PARAM_ENABLE_AVSESSION_MGMTBDS_SYNTHESIZER_PARAM_AUDIO_SESSION_CATEGORY_OPTIONS配置说明。如果无法达成预期效果,建议收取合成的音频数据,自行播放。

如何实现后台播放、如何实现锁屏界面的播放

SDK内部不会对后台、锁屏相关功能做任何控制,建议开发者自行收取合成音频数据,播放音频的同时来实现相关功能。

如何反馈使用问题

在反馈问题之前,请开发者务必在Demo测试并复现。 通过各个渠道反馈问题时,请务必详细描述以下信息:

问题描述:(具体问题,稳定复现/概率)
SDK 版本:(是否已经切换到最新版本)
是否已在Demo中复现:请务必在Demo中复现遇到的错误。无法在Demo复现的问题相对难以定位原因。
 
若能在Demo中复现,请描述:
SDK:(SDK类型,版本号)
初始化引擎代码:(在线引擎、离线引擎代码片段)
APPID:
复现逻辑:(如何复现)
完整日志:(附上开启Debug模式的,从启动到结束的完整日志)