实时语音识别_实时语音识别技术-百度AI开放平台

控制台

优惠 618年中钜惠，语音识别低至 1折，立即抢购 >

功能介绍

应用场景

特色优势

产品价格

相关推荐

功能介绍

技术领先识别准确

基于Deep Peak2端到端建模，超过10万小时数据训练，多采样率多场景声学建模，显著提高了普通话以及方言的识别精准度，其中近场中文普通话识别准确率达98%

多语种多方言识别

除中文普通话、英文外，支持粤语、四川话和东北话等方言的识别

智能语言处理

使用大规模数据集训练语言模型，对识别中间结果进行智能纠错，并根据语音的内容理解和停顿智能匹配合适的标点符号，。！？

多种调用方式

支持WebSocket API，支持Android、iOS、Linux SDK，可以在多种操作系统、多种设备终端上调用，快速上手，简单易用

毫秒级实时识别音频流

首包响应时间毫秒级，并实时展示中间文字结果，快速识别音频流

文字识别结果支持时间戳

识别返回的文字结果带有时间戳，展示VAD切分句子开始和结束时间，方便进行功能开发

应用场景

实时语音输入

视频直播字幕

演讲字幕同屏

实时会议记录

课堂音频识别

实时语音输入

语音输入准确高效，解放双手，说话内容实时展示在屏幕上，聊天顺畅

特色优势

识别效果领先

基于Deep Peak2端到端建模，多采样率多场景声学建模，近场中文普通话识别准确率达98%

支持多设备终端

支持WebSocket API方式、Android、iOS、Linux SDK方式调用，可以适用于多种操作系统、多设备终端均可使用

服务稳定高效

企业级稳定服务保障，专有集群承载大流量并发，高效灵活，服务稳定

模型自助优化

中文普通话模型可在语音自训练平台上零代码自助训练，上传文本语料即可有效提升业务词汇的识别准确率5-25%

产品价格

通用场景模型

音视频场景模型

小时包预付费

适用于调用时长可预估的企业

免费时长

10小时

有效期

1年

并发量

50（支持扩容）

服务稳定性

99.9%

技术支持

7*24小时响应

1000小时

1800

元

立即购买

调用时长后付费

适用于不便预估调用时长的企业

免费时长

10小时

并发量

50（支持扩容）

服务稳定性

99.9%

技术支持

7*24小时响应

价格

3

元/小时

开通付费

模型训练

适用于专业领域名词识别不准，需要对语音识别语言模型进行规模训练的客户

上传文本、词汇即可训练

专业评估，精准提升

模型自动上线专属使用

立即训练

定价说明

本产品开通即享免费调用时长，使用完毕后可选择小时包预付费或按小时后付费两种计费方式，产生的计费调用时长优先消耗小时包额度，超出部分按时长计费

收费标准

开始使用识别服务

注册即可领取产品免费体验套餐

立即使用

技术能力

查看全部AI能力

合作咨询

填写您的业务需求，专属客户经理会尽快联系您，提供1对1咨询服务

售后智能助手

智能诊断，快速解决使用问题

更多咨询，请拨打400-920-8999 转 1

体验AI

Web端前往AI能力体验中心

移动端打开百度APP“扫一扫”