产品服务
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
数据智能
知识图谱
硬件产品与服务
定制化训练平台
深度学习开放平台
硬件产品
软硬一体化的远场语音开发套件
硬件与软件开源的机器人视觉产品方案
软硬一体化的人脸识别开发套件
百度嵌入式软硬件一体人脸抓拍机
硬件赋能
快速赋能移动设备及智能手机
零代码生成高性能端计算模型
高性能计算卡参考方案&软件工具包
端云一体的多模态人机交互解决方案
EdgeCloud端云协同平台
为抓拍机厂商提供端云对接协议及产品推广
可视化配置,实现抓拍机管理与业务系统集成
硬件合作
开放评测认证让您的产品加入AI生态
开放与芯片合作,让AI深度走入终端设备
可视化训练模型服务平台,获取高精度定制图像识别、声音识别、文本分类服务
自助定制专属模板,实现海量单据卡证的结构化识别
智能对话系统开发平台,让产品快速拥有对话交互能力
自助训练专属模型,提升业务场景语音识别效果
集合代码环境、算法算力和数据集的线上一站式开发平台
提供深度学习系列公开课与商业案例
源于产业实践的开源深度学习平台
零代码生成高性能端计算模型
基于真实样本的超大规模的开放数据集
合作伙伴
面向AI技术应用落地的重点行业,共同实现客户价值
飞桨为企业和教育合作伙伴提供系统化的资源和服务
合作伙伴与百度AI携手,提供更丰富的AI服务
AI加速器
AI市场
资讯
社区
语音识别
为您提供高精度的语音识别服务,融合百度领先的自然语言处理技术
支持多场景智能语音交互
功能介绍
百度语音识别为开发者提供业界优质且免费的语音服务,通过场景识别优化,为车载导航,智能家居和社交聊天等行业提供语音解决方案,准确率达到90%以上,让您的应用绘“声”绘色
百度语音,面向广大开发者开放语音识别技术,所采用的离在线融合技术,根据当前网络环境自动判断本地引擎或云端引擎,进行识别
应用场景
社交聊天
社交聊天发送实时语音,支持中文,英文识别,方言支持粤语,四川话。让沟通交流更加准确快捷

合作案例: 陌陌
游戏娱乐
语音聊天转文字,让用户在操作的同时也可看到聊天内容


合作案例: 神武 逍遥西游2
语音输入法
摆脱生僻字和拼音障碍,将所输入文字,直接用语音的方式输入,让输入法更加便捷

合作案例: 百度输入法 魅族输入法
语音搜索
搜索内容直接以语音的方式输入,让搜索更加高效


合作案例: 手机百度 爱奇艺
技术特色
全平台REST API
行业率先推出语音识别REST API,采用HTTP方式请求,可适用于任何平台的
语音识别
离线在线融合模式
SDK可以根据当前网络状况及指令的类型,自动判断使用本地引擎还是云端
引擎进行语音识别
深度语义解析
支持多达35个领域的语义理解,如:交通,社交,娱乐等。还可支持自定义指令集和问答对的设置,让您更准确地
理解用户意图
自定义上传识别词库
开发者可以自行上传词库,训练专属识别模型。提交的语料越多、越全,语音识别的效果提升也会越明显
免费试用