产品服务
语音识别
语音识别
长语音识别
远场语音识别
语音合成
语音唤醒
视频技术
视频内容分析
视频封面选取
视频比对检索
视频内容审核
文字识别
通用文字识别
网络图片识别
卡片证照识别
营业执照识别
车牌识别
票据识别
表格文字识别
自定义模版识别
图像识别
通用图像分析
细粒度图像识别
人体分析
EasyDL定制化图像识别
人脸识别
人脸检测
人脸对比
人脸查找
人脸采集
图像搜索
相同图片搜索
相似图片搜索
商品图片搜索
内容审核
图像审核
文本审核
视频内容审核
语言处理基础技术
词法分析
依存句法分析
词向量表示
DNN语言模型
词义相似度
短文本相似度
评论观点抽取
情感倾向分析
文章标签
文章分类
理解与交互技术UNIT
机器翻译
数据智能
推荐引擎
网站统计
移动统计
百度智客
舆情平台
舆情API
保险风险识别
理赔反欺诈
司南营销分析
司南户外分析
客情分析
商情分析
增强现实
知识理解
实体标注
知识图谱schema
PaddlePaddle
PaddlePaddle训练营
开放数据集
室外场景理解
视频精彩片段
阅读理解
信息抽取
虚拟现实
解决方案
人脸核身
人脸会场签到
人脸会员识别
人脸闸机
智能安防视频分析
智能电销
机器人导航和视觉
服务机器人
DuerOS智慧家庭
DuerOS智能语音助理
AR智能营销
大数据基础套件(鲁班)
案例与场景
客户案例
应用场景
开发资源
文档中心
SDK下载
教学视频
常见问题
合作伙伴
寻找生态伙伴
生态伙伴计划
优秀伙伴展示
AI加速器
资讯
社区
控制台
语音技术
文字识别
人脸识别
图像审核
图像识别
图像搜索
自然语言
UNIT
知识图谱
直接进入
远场语音识别
通过麦克风阵列前端处理算法,即使在三至五米的
距离说话也可准确识别
立即使用
技术文档
功能介绍
百度语音为开发者提供业界优质的远场语音识别服务,通过麦克风阵列前端处理算法,有效消除噪音,同时对目标说话人声音进行增强,使得智能家居、智能硬件、机器人语音交互等场景下的远场语音也可准确识别
应用场景
机器人语音交互
提供麦克阵列前端算法,解决人机交互中,距离较远带来的识别率较低的问题,让人机对话更加方便
主要服务:
远场语音识别
语音合成
语音唤醒
智能家居
通过远场语音识别技术,可以让用户,即使在三至五米的距离,也可对智能家居进行语音操作
主要服务:
远场语音识别
语音合成
语音唤醒
技术特色
支持多种麦克风阵列
可支持单通道远场、均匀线性远场、均匀环形阵列远场的识别和唤醒
麦克风阵列波束形成
利用麦克风阵列的空间选择性,对目标说话人语音进行增强,同时抑制或消除噪声、混响等无效语音的干扰
语音增强
有效消除环境噪声,提升输入信号质量
常见问题:
语音识别、合成接口每天调用限额是多少,如何申请提高限额?