在语音识别的基础上做说话人识别,有感兴趣的同志吗
我是CT派 发布于2018-05-08 16:21 浏览:271 回复:8
0
收藏
想在长语音识别的基础上加个说话人识别,请教一下大佬们有没有建议!感兴趣的可以一起做哈
收藏
点赞
0
个赞
共8条回复 最后由我是CT派回复于2018-09-18 17:21
#9我是CT派回复于2018-09-18 17:21:30

搁置了好久。。感觉没什么原理,由于读取文件方式不同,一句话先做语音识别,再进行说话人识别,受网络影响比较慢,只是走通了流程,使用还是受限于某些因素。目前说话人识别也是调用的第三方服务。

0
#8hefeitest回复于2018-08-02 22:35:30

同好奇怎么区分的,原理都没说清楚

0
#7果断叫小黑回复于2018-07-12 22:47:47

期待,好奇是如何区别每个人的

0
#6阿萨德去23123回复于2018-07-11 08:37:59

期待!

0
#5hefeitest回复于2018-07-10 11:57:12

看大神进度

0
#4我是CT派回复于2018-06-25 13:34:12

还有个问题,不知百度有没有评估过 百度语音rest API 和增加了远场语音长语音识别的安卓SDK 两者的识别率哪个更高呢?

0
#3我是CT派回复于2018-06-22 14:20:29

现在已经在百度安卓语音识别的基础上加了说话人识别,语音识别和说话人识别是异步进行的,因为前者是流式的,后者是文件识别,由于每句话音频截取的不够精确(是根据语音识别返回的时间参数计算截取的每句话音频),所以效果还不是很好。所以我想根据VAD检测来精确截取每句话的音频,语音识别中有VAD检测,不知demo里的VAD检测可不可以调用,如何调用呢?不然我还得另找呢。

0
#2fujiayi1984回复于2018-05-30 15:11:32

不知道目前进度如何,是不是差一个程序员?

0
TOP
切换版块