在语音识别的基础上做说话人识别,有感兴趣的同志吗
我是CT派 发布于2018-05-08 浏览:1964 回复:10
0
收藏
想在长语音识别的基础上加个说话人识别,请教一下大佬们有没有建议!感兴趣的可以一起做哈
收藏
点赞
0
个赞
共10条回复 最后由wangwei8638回复于2019-04-23
#11wangwei8638回复于2019-04-23

志玲为您导航就是这方面的应用吧,需要对大量个人语音进行训练

0
#10小小白羊01回复于2019-04-23
#9 我是CT派回复
搁置了好久。。感觉没什么原理,由于读取文件方式不同,一句话先做语音识别,再进行说话人识别,受网络影响比较慢,只是走通了流程,使用还是受限于某些因素。目前说话人识别也是调用的第三方服务。
展开

你好!你调用的第三方的说话人识别效果怎么样啊?

0
#9我是CT派回复于2018-09-18

搁置了好久。。感觉没什么原理,由于读取文件方式不同,一句话先做语音识别,再进行说话人识别,受网络影响比较慢,只是走通了流程,使用还是受限于某些因素。目前说话人识别也是调用的第三方服务。

0
#8hefeitest回复于2018-08-02

同好奇怎么区分的,原理都没说清楚

0
#7果断叫小黑回复于2018-07-12

期待,好奇是如何区别每个人的

0
#6阿萨德去23123回复于2018-07-11

期待!

0
#5hefeitest回复于2018-07-10

看大神进度

0
#4我是CT派回复于2018-06-25

还有个问题,不知百度有没有评估过 百度语音rest API 和增加了远场语音长语音识别的安卓SDK 两者的识别率哪个更高呢?

0
#3我是CT派回复于2018-06-22

现在已经在百度安卓语音识别的基础上加了说话人识别,语音识别和说话人识别是异步进行的,因为前者是流式的,后者是文件识别,由于每句话音频截取的不够精确(是根据语音识别返回的时间参数计算截取的每句话音频),所以效果还不是很好。所以我想根据VAD检测来精确截取每句话的音频,语音识别中有VAD检测,不知demo里的VAD检测可不可以调用,如何调用呢?不然我还得另找呢。

0
#2fujiayi1984回复于2018-05-30

不知道目前进度如何,是不是差一个程序员?

1
TOP
切换版块