资讯 文档
【功能升级】实时语音识别,多方言沟通无界更贴心!
发布日期:2025-05-13 08:36浏览量:12次

为进一步提升语音产品体验,满足多元化场景需求,实时语音识别API近期重大升级!在原有中文普通话、英文精准识别基础上,新增支持粤语、四川话、东北话等方言自动识别能力,覆盖更广泛的地域与人群,让沟通更自由、更高效!

 

升级亮点抢先看

1、方言识别再扩容,沟通无障碍
  • 新增方言:粤语、四川话、东北话,覆盖华南、西南、东北等区域
  • 支持中英混说场景,一个API即可实现方言与普通话、英文无缝切换,满足跨语种交流需求
2、场景覆盖更全面,应用更广泛
  • 社交娱乐:语音聊天、视频直播,字幕实时展示;
  • 办公协作:实时会议记录、演讲字幕展示,方言内容自动转文字,效率翻倍;
  • 交通出行:方言语音输入,解放双手,安全高效。
3、技术突破,体验升级
  • 采用Deep Peak2端到端建模,超过10万小时数据训练,多采样率多场景声学建模,识别精准度高
  • 实时反馈,毫秒级响应,语音转文字流畅无卡顿
  • 支持动态切换识别语言,无需单独设置,方言识别“随开随用”

如何使用方言识别?

如需体验,需在实时语音识别API请求参数user-使用中文多方言模型(pid:15376)时此参数必填。
 
详情参考实时语音识别API技术文档:https://ai.baidu.com/ai-doc/SPEECH/jlbxejt2i
 
 
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术