产品服务
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
数据智能
知识图谱
硬件产品与服务
定制化训练平台
深度学习开放平台
硬件产品
软硬一体化的远场语音开发套件
硬件与软件开源的机器人视觉产品方案
软硬一体化的人脸识别开发套件
硬件赋能
快速赋能移动设备及智能手机
零代码生成高性能端计算模型
高性能计算卡参考方案&软件工具包
端云一体的多模态人机交互解决方案
EdgeCloud端云协同平台
为抓拍机厂商提供端云对接协议及产品推广
可视化配置,实现抓拍机管理与业务系统集成
硬件合作
开放评测认证让您的产品加入AI生态
开放与芯片合作,让AI深度走入终端设备
可视化训练模型服务平台,获取高精度定制图像识别、声音识别、文本分类服务
自助定制专属模板,实现海量单据卡证的结构化识别
智能对话系统开发平台,让产品快速拥有对话交互能力
自助训练专属模型,提升业务场景语音识别效果
集合代码环境、算法算力和数据集的线上一站式开发平台
提供深度学习系列公开课与商业案例
源于产业实践的开源深度学习平台
零代码生成高性能端计算模型
基于真实样本的超大规模的开放数据集
AI加速器
AI市场
资讯
社区
远场语音识别
通过麦克风阵列前端处理算法,即使在三至五米的
距离说话也可准确识别
功能介绍
百度语音为开发者提供业界优质的远场语音识别服务,通过麦克风阵列前端处理算法,有效消除噪音,同时对目标说话人声音进行增强,使得智能家居、智能硬件、机器人语音交互等场景下的远场语音也可准确识别
应用场景
机器人语音交互
提供麦克阵列前端算法,解决人机交互中,距离较远带来的识别率较低的问题,让人机对话更加方便
智能家居
通过远场语音识别技术,可以让用户,即使在三至五米的距离,也可对智能家居进行语音操作
技术特色
支持多种麦克风阵列
可支持单通道远场、均匀线性远场、均匀环形阵列远场的识别和唤醒
麦克风阵列波束形成
利用麦克风阵列的空间选择性,对目标说话人语音进行增强,同时抑制或消除噪声、混响等无效语音的干扰
语音增强
有效消除环境噪声,提升输入信号质量