邀测 | 实时语音识别与音频文件转写
chrisberg923 发布于2019-12-30 浏览:2975 回复:21
0
收藏
最后编辑于2020-12-21

尊敬的百度AI开放平台开发者:

 

11月28日,百度大脑宣布语音能力引擎日均调用量已经超过100亿次,应用规模业界第一,为开发者提供了覆盖云、端、芯的全栈全场景语音开放能力,推动智能语音技术在各行业落地应用。

 

百度AI开放平台现在向所有开发者开放了实时语音识别和音频文件转写的邀测接口,希望更多的开发者体验测试,可以直接在介绍页面点击”合作咨询”进行申请权限。

 

 

实时语音识别

 

基于Deep Peak2的端到端建模,将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、视频添加字幕、会议等场景

产品优势:支持时间戳,支持多种设备及操作系统

适用场景:实时语音输入,视频直播添加字幕,演讲、会议、课堂音频识别

详情了解:https://ai.baidu.com/tech/speech/realtime_asr

 

音频文件转写

 

将批量上传的音频文件识别为文字,12小时内返回识别结果。适合录音质检、会议内容总结、音频内容分析等场景

产品优势:支持时间戳,批量音频快速识别

适用场景:视频添加字幕,演讲、会议、课堂异步转写分析

详情了解:https://ai.baidu.com/tech/speech/aasr

 

 

同时欢迎各路大神测试了解,发布经验分享贴有几率获得百度AI神秘小礼物,希望各位大佬踊跃报名。

收藏
点赞
0
个赞
共21条回复 最后由chrisberg923回复于2020-12-21
#22chrisberg923回复于2020-12-21
#21 wangwei8638回复
测试一下

欢迎大神测试~

0
#21wangwei8638回复于2020-12-19

测试一下

0
#15chrisberg923回复于2020-04-16
#14 138*****237回复
超级好!我用它做了matlab课程设计的一部分,很棒!

666

0
#14138*****237回复于2020-04-16

超级好!我用它做了matlab课程设计的一部分,很棒!

0
#13chrisberg923回复于2020-03-13
#12 控迷闯天涯回复
是不是限制调用量呢?

目前不同账号不同接口有不同的调用量限制,免费调用量供测试调通接口是没有问题的、

0
#12控迷闯天涯回复于2020-03-11

是不是限制调用量呢?

0
#11chrisberg923回复于2020-02-24
#9 wangwei8638回复
实时语音识别与普通语音识别有何区别

实时语音识别实现的是一边说话一遍转文字,区别于api上传整个音频文件获得结果。

0
#10chrisberg923回复于2020-02-24
#9 wangwei8638回复
实时语音识别与普通语音识别有何区别

可以申请的,请在页面提交合作资讯,或者官方交流群联系群管理员。

0
#9wangwei8638回复于2020-02-20

实时语音识别与普通语音识别有何区别

0
#8wangwei8638回复于2020-02-20
#5 chrisberg923回复
目前仅有api,还没有进行封装,目前有 Java Python C++ 的demo,欢迎来申请测试。
展开

可以申请吗

0
#7chrisberg923回复于2020-01-13
#6 金宇1001回复
想要试下音频文件转写,请问哪有有python的demo啊? 还有必须把音频文件上传到网络上吗?  找了半天也没找到哪里适合上传,有推荐的地方吗?
展开

音频文件转写有python的demo。必须把音频文件上传到网络,推荐百度云的对象存储。如果需要测试,请在合作咨询中说明业务场景等信息。

0
#6金宇1001回复于2020-01-13

想要试下音频文件转写,请问哪有有python的demo啊?

还有必须把音频文件上传到网络上吗?  找了半天也没找到哪里适合上传,有推荐的地方吗?

0
#5chrisberg923回复于2020-01-10
#4 记忆是lj回复
实时语音识别是还没有集成sdk,无法通过maven仓库使用吧?

目前仅有api,还没有进行封装,目前有 Java Python C++ 的demo,欢迎来申请测试。

0
#4记忆是lj回复于2020-01-09

实时语音识别是还没有集成sdk,无法通过maven仓库使用吧?

0
#3chrisberg923回复于2020-01-06
#2 sy_qijia回复
有没有不发音的占时字符?

您好,你咨询的是语音识别还是语音合成呢?可以详细描述下吗?

0
#2sy_qijia回复于2020-01-05

有没有不发音的占时字符?

0
TOP
切换版块