我的源文件为aac和m4a格式,怎么使用百度语音
ihuige666 发布于2018-11 浏览:2524 回复:4
0
收藏

后台识别,采用java开发,目前使用样本pcm可以识别,但是我的源文件为aac和m4a格式,调用报错

{
"err_msg": "speech quality error.",
"sn": "59959631061543287524",
"err_no": 3301
}

应该是要把 aac或者 m4a 转成pcm在调用百度,请问这个转换有没有java版本的sdk?

收藏
点赞
0
个赞
共4条回复 最后由用户已被禁言回复于2022-04
#5goJhou回复于2018-11
#4 ihuige666回复
ffmpeg必须要安装后,指令转码吗? 我想要的是程序自动转,不能人工转吧?  
展开

ffmpeg是开源的编解码库。你完全可以融合到自己的程序中

0
#4ihuige666回复于2018-11

ffmpeg必须要安装后,指令转码吗?

我想要的是程序自动转,不能人工转吧?

 

0
#3goJhou回复于2018-11

文档中心->语音识别->语音识别工具->音频文件转码,内容讲述的就是用ffmpeg进行转码,可以学习一下

http://ai.baidu.com/docs#/ASR-Tool-convert/top

0
#2goJhou回复于2018-11

格式支持:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。

推荐pcm 采样率 :16000 固定值。 编码:16bit 位深的单声道。

非pcm的,wav、amr格式会在服务端先转成pcm格式,所以推荐本地转换。

音频格式转换库有很多开源的比如说ffmpeg、安卓有MediaCodec。转换不属于sdk功能,请自行搜索

0
TOP
切换版块