REST API识别率很差
fielding34 发布于2018-02-13 15:06 浏览:241 回复:5
1
收藏
REST API语音识别率很低,由于限制一分钟以内的语音,有时还会出现截取不同长度语音(60s以内)最终识别的结果会差异非常大。 
 
比如下面这个语音长度是37s, 对比下微软和百度的识别结果。这个是我文件的问题,还是的确差距就这么大?
 
语音: http://suo.im/2KA8XY
 
百度: 
{'corpus_no': '6521929199116847801', 'err_no': 0, 'result': ['对于搞笑看这条虚线对于经济未来温和走强的,这个也有一定的弹性,追着这个情况下,我们觉得,站在全年的角度问题在做交易,说你在做一个,年内交易行三五年的力量和这个高等级是具备的交易和评价,那么从长期配置趋势教育来讲,长春现在也觉得如果你是保险没有什么钱,'], 'err_msg': 'success.', 'sn': '156966057211518504973'}
 
 
微软: 
在网上的时候所以对于单纯从生日曲线陡峭化的角度来看这条曲线对于经济未来的温和走强的这个也有一定的弹性所以在这个情况下。我们觉得站在全年的角度上来看如果你是在做交易还说你在做一个眼泪交易的话35年的利润占和这个高等级是具备着坚固的交易和病假条那么从长期配置趋势交易来讲上面长短现在也绝对是一个建筑师表如果你是保险那我觉得没有什么可是这样用钱完全没问题了。"
收藏
点赞
1
个赞
共5条回复 最后由chu8129回复于2018-02-24 15:19
#6chu8129回复于2018-02-24

对比讯飞之后。。。默默回来看社区有没有解决办法。。。相同的音频

0
#5fielding34回复于2018-02-23

上面这段我还没用微软的测试过,但应该不会这么差。 我想知道是否是因为我操作有问题,还是的确百度不适合识别此类的音频?

0
#4fielding34回复于2018-02-23

比如说这段音频 http://suo.im/9m9cG

百度识别结果是: “所以我现在觉得”

期望结果是: “3%,4%左右的券都有,但是考虑到其他资产的隐含收益率上升都很快,配置一个一年期以内的债券都有6%以上的收益,对于我们来说不是一个特别值得考虑的机会。另外,货币基金是个中性,当然后面如果担心后面经济恶化,或者担心19年有剧烈波动,现在配一些货币也没有问题。如果你配一年期以内的债券,对于很多机构来说和配货币其实区别不大,只要信用有一定的保障的前提,收益要更高。”

这个识别结果基本没有办法用,不知道为什么会丢失这么多内容?

0
#3fielding34回复于2018-02-23

不是个例,整体识别都很低,否则我也不会用微软的去测试了。 

0
#2fujiayi1984回复于2018-02-14

请先建立测试集,然后给下期望结果,百度的结果和微软的结果。

一两个文件可能是个例

0
TOP
切换版块