产品服务
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
数据智能
知识图谱
硬件产品与服务
定制化训练平台
深度学习开放平台
硬件产品
官方认证的硬件产品与百度AI协同应用
百度推出的软硬一体化服务机器人
硬件与软件开源的机器人视觉产品方案
软硬一体化的人脸识别开发套件
软硬一体化的远场语音开发套件
硬件赋能
快速赋能移动设备及智能手机
零代码生成高性能端计算模型
高性能计算卡参考方案&软件工具包
EdgeCloud端云协同平台
为抓拍机厂商提供端云对接协议及产品推广
可视化配置,实现抓拍机管理与业务系统集成
硬件合作
开放评测认证让您的产品加入AI生态
开放与芯片合作,让AI深度走入终端设备
可视化训练模型服务平台,获取高精度定制图像识别、声音识别、文本分类服务
自助定制专属模板,实现海量单据卡证的结构化识别
智能对话系统开发平台,让产品快速拥有对话交互能力
自助训练专属模型,提升业务场景语音识别效果
集合代码环境、算法算力和数据集的线上一站式开发平台
提供深度学习系列公开课与商业案例
源于产业实践的开源深度学习平台
零代码生成高性能端计算模型
基于真实样本的超大规模的开放数据集
AI加速器
AI市场
资讯
社区
语音识别
提供业界领先的多场景语音识别技术,让您的应用长上耳朵
产品功能
应用场景
语音输入法
摆脱生僻字和拼音障碍,将所输入文字,直接用语音的方式输入,让输入法更加便捷

合作案例: 百度输入法 魅族输入法
语音搜索
搜索内容直接以语音的方式输入,让搜索更加高效


合作案例: 手机百度 爱奇艺
智能家居
通过远场语音识别技术,可以让用户,即使在三至五米的距离,也可对智能家居进行语音操作
机器人语音交互
提供麦克阵列前端算法,解决人机交互中,距离较远带来的识别率较低的问题,让人机对话更加方便
实时字幕
将直播、视频、现场演讲等音频进行实时的字幕转换,降低理解成本,提升用户体验
主要服务: 长语音识别
语音笔记
可将笔记、总结等,通过语音的方式转为文字,进行记录,大幅提升了用户的录入效率
主要服务: 长语音识别
产品优势
使用方式灵活
支持Android、iOS以及全平台的REST API方式调用,提供多垂类识别
效果表现优秀
提供基于百度大脑的业界顶级语音模型,效果行业领先,为业务产品营造顺畅体验
离线在线融合模式
根据当前用户网络状况,自动判断使用本地引擎还是云端引擎进行处理
可以兼顾速度及流量消耗
免费试用
1
新手入门
2
创建应用
3
获取密钥
4
生成签名
5
启动开发