产品服务
语音技术
图像技术
人脸与人体识别
视频技术
AR与VR
自然语言处理
数据智能
知识图谱
软硬一体产品
专项解决方案
定制化训练平台
深度学习开放平台
内置离线识别SDK,5分钟快速搭建人脸识别业务应用
硬件开源,软件开放,为机器人打造软硬一体的视觉方案
看得准、听得懂、说得明、交互好的一体化服务机器人
快速完成用户身份核实,确保真人且为本人
在复杂环境下自动识别特定人员及异常行为
针对准入场景,提供行业定制的全流程方案
辅助坐席人员实时了解客户意图,推荐话术应答
参会人邀请注册、刷脸签到、与会人统计管理平台
提供自研的数据仓库、日志分析、数据挖掘等方案
人脸注册、人脸捕获、会员识别整套解决方案
可视化训练模型服务平台,获取高精度的定制图像识别服务
自助定制专属模板,实现海量单据卡证的结构化识别
智能对话系统开发平台,让产品快速拥有对话交互能力
集合代码环境、算法算力和数据集的线上一站式开发平台
提供深度学习系列公开课与商业案例
最符合中国开发者需要的深度学习框架
基于真实样本的超大规模的开放数据集
AI加速器
AI市场
资讯
社区
通用文字识别
基于业界领先的深度学习技术,依托全网海量优质数据为您提供多场景、多语种、高精度的整图文字检测和识别服务
功能介绍
支持多场景下的文字检测识别,多项ICDAR指标世界第一,支持中、英、葡、法、德、意、西、俄、日、韩、中英混合识别,
整体识别准确率高达90%以上,并提供高精度版,满足您更高的要求
功能演示

提示:可支持PNG、JPG、JPEG、BMP,图片大小不超过4M,长边不大于4096像素,请保证需要识别的部分为图片主体部分

编号 识别结果

应用场景
拍照/涂抹识别
在书摘、笔记、搜索、翻译等移动应用中,实现拍照自动识别文字、涂抹识别指定区域文字,方便用户进行文本录入,提高产品易用性和用户体验

合作案例: 萝卜书摘 百度翻译
内容审核与监管
识别图像和视频中的违规文字内容,进行违规处理和风险管控

 
医疗单据识别
用于医疗行业的单据、票据、病例等资料的自动识别和结构化整理工作,快速实现电子化入库,减少人工输入过程,提高输入效率

合作案例: 泰康保险
金融行业资料电子化
用于企业证照、年报、财报、票据等纸质资料的自动识别,支持结构化录入,节约人力成本,提升处理效率

合作案例: 百度钱包
视频内容分析
识别视频中的字幕、标题、弹幕、画面中的文字信息等内容,用于视频分类和标签提取、视频内容审核、营销分析等多种场景

合作案例: 爱奇艺
技术特色
算法领先
基于百度海量优质数据和算法积累,百度文字识别在ICDAR的比赛中已连续两年获得多项世界第一
简单易用
百度文字识别提供有多种语言的SDK及移动端SDK,详尽的文档帮助您实现快速集成,轻松上手
更高精度版本可选
并且提供了更优秀的通用文字识别(高精度版)供您选择,通过算法的优化和全新的模型,实现了整体接近10%的效果提升
产品定价
本产品为按调用量计费的后付费产品,定价采取分段式阶梯定价方式
免费 / 付费对比
每日免费调用
调用量
QPS配置
售后服务
免费
拥有
受限
不保证并发
5个工作日内响应
付费
拥有
无限
保证并发数10
7*24小时即时响应
API
0<月调用量≤5w
5w<月调用量≤10w
10w<月调用量≤20w
20w<月调用量≤50w
50w<月调用量≤100w
100w<月调用量
普通版
0.005元/次
0.0045元/次
0.004元/次
0.0035元/次
0.003元/次
0.0025元/次
高精度版
0.03元/次
0.024元/次
0.019元/次
0.015元/次
0.012元/次
0.01元/次
注:"w"代表万次,所有调用失败均不计费
如果您有以下需求,欢迎【合作咨询】: 1、享受特殊的大客户价格 2、购买更多的QPS 3、其他付费模式购买
功能介绍
支持多场景下的文字检测识别,在通用文字识别的基础上返回文字在图片中的位置信息,方便用户进行版式的二次处理,并提供高精度版,满足您更高的要求
功能演示

提示:可支持PNG、JPG、JPEG、BMP,图片大小不超过4M,长边不大于4096像素,请保证需要识别的部分为图片主体部分

编号 识别结果 识别结果
left top width height

应用场景
医疗单据识别
用于医疗行业的单据、票据、病例等资料的自动识别,并能够根据文字在图片中的位置进行自定义的结构化整理工作,快速实现电子化入库,减少人工输入过程,提高输入效率

合作案例: 泰康保险
金融行业资料电子化
用于企业证照、年报、财报、票据等纸质资料的自动识别,并能够根据文字在图片中的位置进行自定义的结构化整理工作,节约人力成本,提升处理效率


合作案例: 百度钱包
视频内容分析
识别视频中的字幕、标题、弹幕、画面中的文字信息等内容,并能够根据文字在图片中的位置判断文字类型,用于视频内容分析、视频内容审核、营销分析等多种场景

合作案例: 爱奇艺
交通街景识别
识别道路地面、两侧、及标示牌上的文字信息,提升地图数据生产效率与质量助力高精地图基础数据生产


合作案例: 百度地图
技术特色
算法领先
基于百度海量优质数据和算法积累,百度文字识别在ICDAR的比赛中已连续两年获得多项世界第一
简单易用
百度文字识别提供有多种语言的SDK及移动端SDK,详尽的文档帮助您实现快速集成,轻松上手
更高精度版本可选
并且提供了更优秀的通用文字识别(高精度含位置版)供您选择,通过算法的优化和全新的模型,实现了整体接近10%的效果提升
产品定价
本产品为按调用量计费的后付费产品,定价采取分段式阶梯定价方式
免费 / 付费对比
每日免费调用
调用量
QPS配置
售后服务
免费
拥有
受限
不保证并发
5个工作日内响应
付费
拥有
无限
保证并发数10
7*24小时即时响应
API
0<月调用量≤5w
5w<月调用量≤10w
10w<月调用量≤20w
20w<月调用量≤50w
50w<月调用量≤100w
100w<月调用量
普通版
0.010元/次
0.008元/次
0.0065元/次
0.0055元/次
0.0050元/次
0.0047元/次
高精度版
0.04元/次
0.034元/次
0.029元/次
0.025元/次
0.022元/次
0.02元/次
注:"w"代表万次,所有调用失败均不计费
如果您有以下需求,欢迎【合作咨询】: 1、享受特殊的大客户价格 2、购买更多的QPS 3、其他付费模式购买
功能介绍
支持多场景下的文字检测识别,在通用文字识别的基础上将字库从1w+扩展到2w+,能识别所有常用字和大部分生僻字
功能演示

提示:可支持PNG、JPG、JPEG、BMP,图片大小不超过4M,长边不大于4096像素,请保证需要识别的部分为图片主体部分

编号 识别结果

应用场景
历史资料归档
用于历史资料、著作、古籍等纸质资料的电子化录入,准确识别繁体字和生僻字


合作案例: 萝卜书摘
汉语学习和教育
支持生僻字的拍照识别,用于汉字学习和教育场景;支持繁体字、文言文、生僻字的自动识别,用于汉语词典,作业批改等应用场景

合作案例: 手机百度
产品定价
本产品为按调用量计费的后付费产品,定价采取分段式阶梯定价方式
免费 / 付费对比
每日免费调用
调用量
QPS配置
售后服务
免费
拥有
受限
不保证并发
5个工作日内响应
付费
拥有
无限
保证并发数10
7*24小时即时响应
API
0<月调用量≤5w
5w<月调用量≤10w
10w<月调用量≤20w
20w<月调用量≤50w
50w<月调用量≤100w
100w<月调用量
含生僻字版
0.010元/次
0.008元/次
0.0065元/次
0.0055元/次
0.0050元/次
0.0047元/次
注:"w"代表万次,所有调用失败均不计费
如果您有以下需求,欢迎【合作咨询】: 1、享受特殊的大客户价格 2、购买更多的QPS 3、其他付费模式购买