【功能升级】实时语音识别，多方言沟通无界更贴心！

控制台

【功能升级】实时语音识别，多方言沟通无界更贴心！

发布日期：2025-05-13 08:36浏览量：12次

为进一步提升语音产品体验，满足多元化场景需求，实时语音识别API近期重大升级！在原有中文普通话、英文精准识别基础上，新增支持粤语、四川话、东北话等方言自动识别能力，覆盖更广泛的地域与人群，让沟通更自由、更高效！

升级亮点抢先看

1、方言识别再扩容，沟通无障碍

新增方言：粤语、四川话、东北话，覆盖华南、西南、东北等区域
支持中英混说场景，一个API即可实现方言与普通话、英文无缝切换，满足跨语种交流需求

2、场景覆盖更全面，应用更广泛

社交娱乐：语音聊天、视频直播，字幕实时展示；
办公协作：实时会议记录、演讲字幕展示，方言内容自动转文字，效率翻倍；
交通出行：方言语音输入，解放双手，安全高效。

3、技术突破，体验升级

采用Deep Peak2端到端建模，超过10万小时数据训练，多采样率多场景声学建模，识别精准度高
实时反馈，毫秒级响应，语音转文字流畅无卡顿
支持动态切换识别语言，无需单独设置，方言识别“随开随用”

如何使用方言识别？

如需体验，需在实时语音识别API请求参数user-使用中文多方言模型（pid:15376）时此参数必填。

详情参考实时语音识别API技术文档：https://ai.baidu.com/ai-doc/SPEECH/jlbxejt2i

百度语音现已推出：短语音识别标准版、短语音识别极速版、实时语音识别、音频文件转写，短文本在线合成、长文本在线合成、流式文本在线合成、定制音库、声音复刻，呼叫中心实时语音通话、呼叫中心语音质检、呼叫中心音频文件转写等多款语音产品，同时提供有声阅读解决方案、呼叫中心语音解决方案、语音数字大屏、智能语音会议、智能语音指令、语音字幕服务等场景化解决方案，满足各类语音场景需求。提供在线API、HTTP SDK、离线SDK、私有化部署、一体机等多种部署方式，接入便捷、稳定可靠。

上一篇：【邀测】图像增强「智能抠图」新品上线

技术能力

查看全部AI能力

合作咨询

填写您的业务需求，专属客户经理会尽快联系您，提供1对1咨询服务

售后智能助手

智能诊断，快速解决使用问题

更多咨询，请拨打400-920-8999 转 1

体验AI

Web端前往AI能力体验中心

移动端打开百度APP“扫一扫”