产品服务
语音技术
图像技术
人脸与人体识别
视频技术
AR与VR
自然语言处理
数据智能
知识图谱
硬件产品与服务
定制化训练平台
深度学习开放平台
硬件产品
官方认证的硬件产品与百度AI协同应用
百度推出的软硬一体化服务机器人
软硬一体化的人脸识别开发套件
硬件与软件开源的机器人视觉产品方案
硬件赋能
快速赋能移动设备及智能手机
深度学习在终端设备加速的软硬一体方案
端云协同
为抓拍机厂商提供端云对接协议及产品推广
硬件合作
开放评测认证让您的产品加入AI生态
开放与芯片合作,让AI深度走入终端设备
可视化训练模型服务平台,获取高精度定制图像识别、声音识别服务
自助定制专属模板,实现海量单据卡证的结构化识别
智能对话系统开发平台,让产品快速拥有对话交互能力
集合代码环境、算法算力和数据集的线上一站式开发平台
提供深度学习系列公开课与商业案例
最符合中国开发者需要的深度学习框架
基于真实样本的超大规模的开放数据集
AI加速器
AI市场
资讯
社区
远场语音识别
通过麦克风阵列前端处理算法,即使在三至五米的
距离说话也可准确识别
功能介绍
百度语音为开发者提供业界优质的远场语音识别服务,通过麦克风阵列前端处理算法,有效消除噪音,同时对目标说话人声音进行增强,使得智能家居、智能硬件、机器人语音交互等场景下的远场语音也可准确识别
应用场景
机器人语音交互
提供麦克阵列前端算法,解决人机交互中,距离较远带来的识别率较低的问题,让人机对话更加方便
智能家居
通过远场语音识别技术,可以让用户,即使在三至五米的距离,也可对智能家居进行语音操作
技术特色
支持多种麦克风阵列
可支持单通道远场、均匀线性远场、均匀环形阵列远场的识别和唤醒
麦克风阵列波束形成
利用麦克风阵列的空间选择性,对目标说话人语音进行增强,同时抑制或消除噪声、混响等无效语音的干扰
语音增强
有效消除环境噪声,提升输入信号质量