后台识别,采用java开发,目前使用样本pcm可以识别,但是我的源文件为aac和m4a格式,调用报错
{
"err_msg": "speech quality error.",
"sn": "59959631061543287524",
"err_no": 3301
}
应该是要把 aac或者 m4a 转成pcm在调用百度,请问这个转换有没有java版本的sdk?
收藏
点赞
0
个赞
请登录后评论
TOP
切换版块
ffmpeg是开源的编解码库。你完全可以融合到自己的程序中
ffmpeg必须要安装后,指令转码吗?
我想要的是程序自动转,不能人工转吧?
文档中心->语音识别->语音识别工具->音频文件转码,内容讲述的就是用ffmpeg进行转码,可以学习一下
http://ai.baidu.com/docs#/ASR-Tool-convert/top
格式支持:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。
推荐pcm 采样率 :16000 固定值。 编码:16bit 位深的单声道。
非pcm的,wav、amr格式会在服务端先转成pcm格式,所以推荐本地转换。
音频格式转换库有很多开源的比如说ffmpeg、安卓有MediaCodec。转换不属于sdk功能,请自行搜索