首页
版块
访问AI主站
登录
百度账号登录
Github账号登录
注册
发帖
我是CT派
1帖子
·
8回复
49
积分
积分商城
0
获赞
Ta的动态
Ta的帖子
Ta的回复
语音识别android 报错
Ta的回复 :没找到啊。。这个问题解决不了,日志都没法用呀
15
长语音识别如何获得每句话的说话开始和结束时间点
Ta的回复 :在音量回调里加获取时间?
2
长语音识别的调用
Ta的回复 :看了呀,可是没什么用欸,为什么你们的长语音识别的临时识别结果不显示time呢?
4
语音识别android 报错
Ta的回复 :非常感谢!
15
在语音识别的基础上做说话人识别,有感兴趣的同志吗
Ta的回复 :现在已经在百度安卓语音识别的基础上加了说话人识别,语音识别和说话人识别是异步进行的,因为前者是流式的,后者是文件识别,由于每句话音频截取的不够精确(是根据语音识别返回的时间参数计算截取的每句话音频),所以效果还不是很好。所以我想根据VAD检测来精确截取每句话的音频,语音识别中有VAD检测,不知demo里的VAD检测可不可以调用,如何调用呢?不然我还得另找呢。
10
在语音识别的基础上做说话人识别,有感兴趣的同志吗
Ta的回复 :还有个问题,不知百度有没有评估过 百度语音rest API 和增加了远场语音长语音识别的安卓SDK 两者的识别率哪个更高呢?
10
在语音识别的基础上做说话人识别,有感兴趣的同志吗
Ta的回复 :搁置了好久。。感觉没什么原理,由于读取文件方式不同,一句话先做语音识别,再进行说话人识别,受网络影响比较慢,只是走通了流程,使用还是受限于某些因素。目前说话人识别也是调用的第三方服务。
10
原帖已删除
Ta的回复 :百度的免费使用确实很强。但是百度对录音文件的识别有60s的限制,讯飞的没有时长的限制。百度对语气的识别没有讯飞的好,比如问句。讯飞会有问号,感叹号之类的。
0
切换版块
操作指南
常见问答
平台公告
经验交流
技术专区
文字识别
人脸识别
语音技术
PaddlePaddle
EasyDL
BML
EasyData
AI Studio
UNIT
人体分析
图像搜索
图像识别
内容审核
自然语言处理
机器人视觉
视频技术
增强现实
知识图谱
智能创作
智能呼叫中心
文心
EdgeBoard
DuerOS
EasyEdge
度目硬件
百度AI市场
Doris
AI赛事
百度之星大赛
AI Studio人工智能竞赛
语言与智能技术竞赛
千言数据集
集思广益
共享工具
头脑风暴
成果展示
智能客服