在机器人对话中,有个语音输入类型,文档说明是说最终会转化为文字?
那么问题是,我的音频文件如何传输给到api接口?
语音识别转换为文本
如果源文件是语音,那可以用ASR+UNIT
UNIT识别的是文本,所以如果是语音,需要转文本之后才能传给UNIT识别。对话接口中的部分语音参数也是指的转文本之后的数据。最好直接就传入最终确定的文本给UNIT。
语音识别转换为文本
如果源文件是语音,那可以用ASR+UNIT
UNIT识别的是文本,所以如果是语音,需要转文本之后才能传给UNIT识别。对话接口中的部分语音参数也是指的转文本之后的数据。最好直接就传入最终确定的文本给UNIT。