产品服务
语音技术
图像技术
人脸与人体识别
视频技术
AR与VR
自然语言处理
数据智能
知识图谱
软硬一体产品
定制化训练平台
深度学习开放平台
内置离线识别SDK,5分钟快速搭建人脸识别业务应用
硬件开源,软件开放,为机器人打造软硬一体的视觉方案
看得准、听得懂、说得明、交互好的一体化服务机器人
可视化训练模型服务平台,获取高精度定制图像识别、声音识别服务
自助定制专属模板,实现海量单据卡证的结构化识别
智能对话系统开发平台,让产品快速拥有对话交互能力
集合代码环境、算法算力和数据集的线上一站式开发平台
提供深度学习系列公开课与商业案例
最符合中国开发者需要的深度学习框架
基于真实样本的超大规模的开放数据集
AI加速器
AI市场
资讯
社区
语音识别
提供业界领先的多场景语音识别技术,让您的应用长上耳朵
产品功能
应用场景
语音输入法
摆脱生僻字和拼音障碍,将所输入文字,直接用语音的方式输入,让输入法更加便捷

合作案例: 百度输入法 魅族输入法
语音搜索
搜索内容直接以语音的方式输入,让搜索更加高效


合作案例: 手机百度 爱奇艺
智能家居
通过远场语音识别技术,可以让用户,即使在三至五米的距离,也可对智能家居进行语音操作
机器人语音交互
提供麦克阵列前端算法,解决人机交互中,距离较远带来的识别率较低的问题,让人机对话更加方便
实时字幕
将直播、视频、现场演讲等音频进行实时的字幕转换,降低理解成本,提升用户体验
主要服务: 长语音识别
语音笔记
可将笔记、总结等,通过语音的方式转为文字,进行记录,大幅提升了用户的录入效率
主要服务: 长语音识别
产品优势
使用方式灵活
支持Android、iOS以及全平台的REST API方式调用,提供多垂类识别
效果表现优秀
提供基于百度大脑的业界顶级语音模型,效果行业领先,为业务产品营造顺畅体验
离线在线融合模式
根据当前用户网络状况,自动判断使用本地引擎还是云端引擎进行处理
可以兼顾速度及流量消耗
免费试用
1
新手入门
2
创建应用
3
获取密钥
4
生成签名
5
启动开发