【新品上线】音频文件转写正式商用 小时包超划算
置顶
chrisberg923 发布于2020-09-11 浏览:5207 回复:74
3
收藏
最后编辑于2021-08-11

 

音频文件转写接口支持上传批量长音频进行异步转写,目前正式上线了小时包和后付费的功能。我们具体来了解下吧。

 

【产品功能】

1,精准识别率——基于Deep Peak2端到端建模,多采样率多场景声学建模,近场中文普通话识别准确率达98%

2,批量音频快速识别——批量音频上传,12小时内返回结果。(近期将会上线vip用户极速返回功能)

3,时间戳——返回结果包含时间戳信息,展示文字对应的起止时间,方便进行二次开发

4,语种——支持中文普通话和英语识别

 

【应用场景】

1,会议访谈——将会议、访谈的长时间录音批量识别为文字,便于进行内容记录、总结,提升音频内容记录效率

2,视频字幕——将视频中的音频进行语音识别,自动切分无语音部分,对每句话标记时间戳,通过时间戳生成对应字幕,提升配置字幕效率

3,内容分析——将大量对话录音识别为文字,并对内容进行持续分析与监控,及时发现风险、违规内容,发掘潜在营销机会

 

【产品价格】

按小时包预付费
用户购买小时包后即可直接使用,小时包购买之日起一年内有效,具体价格如下:

按调用时长后付费
系统按用户实际使用,每小时出账单实时扣费,账户内需保留足量余额,具体价格如下:

产品介绍:https://ai.baidu.com/tech/speech/aasr

demo下载:https://platform.bj.bcebos.com/sdk/asr/speech_python_demo.zip

 

最终解释权归百度大脑AI开放平台所有

 

收藏
点赞
3
个赞
共74条回复 最后由sun_jipeng回复于2021-08-11
#75sun_jipeng回复于2021-08-11

时间戳不对,时长实际30秒,结果只有14秒

0
#74小墨讲历史回复于2021-04-15

调用时长怎么计算的,是按音频时长算的吗

0
#71chrisberg923回复于2021-01-14
#70 wangwei8638回复
声道分离能区分什么

比如典型的呼叫中心场景,双声道的音频实际一个声道是一侧的语音数据,这类音频可以通过声道将音频文件中的角色进行分离。

0
#70wangwei8638回复于2021-01-14
#68 chrisberg923回复
目前还不支持声纹分离,支持按声道进行分离,返回结果包含左右两个声道的识别内容。
展开

声道分离能区分什么

0
#69chrisberg923回复于2021-01-14
#66 wangwei8638回复
一个音频文件最长支持多长时间?

目前限制音频大小不超过500MB。

0
#68chrisberg923回复于2021-01-14
#67 wangwei8638回复
能否对不同说话人的声音进行识别分类,打标签?

目前还不支持声纹分离,支持按声道进行分离,返回结果包含左右两个声道的识别内容。

0
#67wangwei8638回复于2021-01-13

能否对不同说话人的声音进行识别分类,打标签?

0
#66wangwei8638回复于2021-01-13

一个音频文件最长支持多长时间?

0
#39x六7亿3赛車h坛回复于2020-12-25

不错

0
#38柯含year回复于2020-12-22

不错

0
#24chrisberg923回复于2020-11-27
#23 h27022回复
能否大批量呢?一个一个太慢,比如我一个文件只有几分钟语音,但是有很多个这种文件,我想要转,怎么搞。
展开

可以批量转,需要通过代码增加逻辑。

0
#23h27022回复于2020-11-27

能否大批量呢?一个一个太慢,比如我一个文件只有几分钟语音,但是有很多个这种文件,我想要转,怎么搞。

0
#10深圳九曲范深回复于2020-10-13
#9 ljh0716回复
为啥基本的分词功能都不支持; 就是标注每一个词/字所在句子的时间戳; 现在返回的结果完全不适合做字幕;
展开

可以提交下需求描述

0
#9ljh0716回复于2020-10-13

为啥基本的分词功能都不支持;

就是标注每一个词/字所在句子的时间戳;

现在返回的结果完全不适合做字幕;

1
#8chrisberg923回复于2020-09-21
#7 琥珀之剑一号回复
搞什么玩意,一个音频转写接口,一定要提供url链接,连传base64编码这种都不支持,这让程序自动化怎么进行?难道百度的人工智能是要求手动操作吗?
展开

您好,目前音频文件转写仅支持上传 URL 参数的方式,您可以保存在百度云bos服务器或自有的服务器上,百度可以访问即可。这样做的原因是该接口是异步的转写方式一般音频文件较大,URL的方式对网络状况要求不高,本地音频上传较大文件时容易受网络及计算机本身等因素影响造成上传失败,上传URL的方式也是在传输较大文件时目前比较通用的方式,一般本地上传的方式会对音频文件有极大限制,比如需要小于10mb或5mb甚至1mb。如果您的业务场景必须使用本地文件,可以详细描述一下您的需求,我们会进行整体评估,非常期待您的反馈。

0
#7琥珀之剑一号回复于2020-09-21

搞什么玩意,一个音频转写接口,一定要提供url链接,连传base64编码这种都不支持,这让程序自动化怎么进行?难道百度的人工智能是要求手动操作吗?

0
#6深圳九曲范深回复于2020-09-15

q:498250371   百度云华南服务中心

0
Y
#5yffanshen回复于2020-09-15

赞一个,找我有优惠。

0
#4clinalwestlife回复于2020-09-14

终于上线了

0
Y
#3yffanshen回复于2020-09-14

赞一个,性价比极高,有需要的可以找我哈。

0
TOP
切换版块