资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

简介

本文档主要介绍OCR Android SDK的安装和使用。在使用本文档前,您需要先了解Optical Character Recognition(OCR)的基础知识,并已经开通了OCR服务。视频教程请参见 OCR 在线 Android SDK 使用教程

接口能力

远程API能力

SDK提供了下列百度AI开放平台RESTful接口的封装:

接口名称 接口能力简要描述
通用文字识别 识别图片中的文字信息
通用文字识别(高精度版) 更高精度地识别图片中的文字信息
通用文字识别(含位置信息版) 识别图片中的文字信息(包含文字区域的坐标信息)
通用文字识别(高精度含位置版) 更高精度地识别图片中的文字信息(包含文字区域的坐标信息)
通用文字识别(含生僻字版) 识别图片中的文字信息(包含对常见字和生僻字的识别)
网络图片文字识别 识别一些网络上背景复杂,特殊字体的文字
身份证识别 识别身份证正反面的文字信息,并支持端上数据加密
银行卡识别 识别银行卡的卡号并返回发卡行和卡片性质信息,并支持端上数据加密
驾驶证识别 识别机动车驾驶证所有关键字段
行驶证识别 识别机动车行驶证所有关键字段
车牌识别 对小客车的车牌进行识别
营业执照识别 对营业执照进行识别
通用票据识别 对各类票据图片(医疗票据,保险保单等)进行文字识别,并返回文字在图片中的位置信息
增值税发票识别 对增值税普票、专票、卷票、电子发票进行识别
出租车发票识别 识别全国各大城市出租车票
VIN码识别 对车辆挡风玻璃处的车架号码进行识别
火车票识别 对红、蓝火车票进行识别
数字识别 对图片中的数字进行提取和识别
二维码识别 对二维码、条形码中对应的文字内容进行识别
飞机行程单识别 对飞机行程单中的姓名、始发站、目的站、航班号、日期、票价字段进行结构化识别
机动车销售发票识别 对机动车销售发票的号码、代码、日期、价税合计等字段进行结构化识别
车辆合格证识别 对车辆合格证的编号、车架号、排放标准、发动机编号等字段进行结构化识别
试卷分析与识别 可对作业、试卷的版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果
手写文字识别 对手写汉字或手写数字进行识别
护照识别 支持对中国大陆居民护照的资料页进行结构化识别
户口本识别 对户口本的出生地、出生日期、姓名、民族、与户主关系、性别、身份证号码等字段进行识别别
通用机打发票识别 对国家/地方税务局发行的横/竖版通用机打发票的号码、代码、日期、合计金额、类型等字段进行结构化识别
医疗费用明细识别 支持识别全国医疗费用明细识别
网约车行程单识别 对国家/地方税务局发行的横/对各大主要服务商的网约车行程单进行结构化识别
磅单识别 结构化识别磅单的车牌号、打印时间、毛重、皮重、净重、发货单位、收货单位、单号8个关键字段,现阶段仅支持识别印刷体磅单

本地质量控制能力

除了包含远程API调用能力外,安卓SDK中还集成了身份证识别的本地质量控制能力,提供给开发者本地检测身份证的功能。SDK可以先行在本地完成身份证的预判断,然后上传至服务端识别,以达成“自动扫描识别”的功能,使用时可实时检测取景框中是否包含身份证,是否存在模糊、欠/过曝等情况,并提示用户矫正,提高图片采集质量,提升识别准确率。安卓SDK下载

版本更新记录

上线日期 版本号 更新内容
2022.6.9 2.0.1 修复身份证、银行卡的采集质控模块鉴权问题
2022.2.17 2.0.0 升级安全策略,更新鉴权校验规则,需绑定应用签名 MD5 生成鉴权文件进行账号鉴权。使用此版本 SDK 建议前往 文字识别控制台-应用管理 编辑添加 Android 签名 MD5 信息
2022.1.7 1.4.9 更新身份证、银行卡数据加密功能,新增磅单识别、网约车行程单、医疗费用明细识别功能
2021.8.5 1.4.7 新增二维码、飞机行程单、机动车销售发票、车辆合格证、试卷分析与识别、手写识别、护照、户口本、通用机打发票识别功能
2021.2.2 1.4.6 新增增值税发票、出租车发票、VIN码、火车票和数字识别功能
2020.12.3 1.4.5 修复安卓10环境下的闪退问题
2018.2.8 1.4.2 修复高精度通用文字识别调用api错误的问题
2018.2.1 1.4.1 优化和修复了一些引起崩溃的问题;身份证本地扫描新增一个用户手动加和释放模型的类,强烈推荐用户参照demo中手动初始化和释放模型
2017.11.23 1.4.0 新增高精度版通用文字,营业执照,通用票据接口
2017.11.2 1.3.3 修复一个本地代码内存泄露问题,优化代码结构
2017.10.17 1.3.2 修复token对象expireTime时间异常的问题
2017.9.21 1.3.1 修复了一些机型下autofocus fail的错误;添加了请求接口token过期前10秒自动获取新token的逻辑;对demo界面文案做了微调
2017.8.15 1.3.0 增加驾驶证,行驶证,车牌识别功能;修复了一个潜在内存泄露问题;身份证本地质量控制模型升级,加入完整性保证
2017.8.1 1.2.3 ui库输出格式RGB565压缩,身份证识别参数加入压缩质量,对焦实现改为间隔自动对焦,修复了一些问题
2017.7.14 1.2.2 配合添加身份证本地能力升级SDK的安全性,身份证识别支持自动质量控制扫描模式以及默认的拍照识别模式
2017.6.30 1.2.1 1.对SDK的安全性作出优化 2.对本地身份证输入校验功能进行升级,该功能暂时不可用
2017.6.20 1.2.0 ocr_ui库身份证识别升级,交互修改为基于本地模型实现实时扫描判断后自动上传识别身份证
2017.5.18 1.1.0 增加通用文字识别基础版,生僻字,网图接口的SDK接口和demo演示;移除okhttp依赖;支持x86架构CPU;略微优化了demo的交互
2017.4.13 1.0.2 修复部分用户使用ak,sk方式无法获取token的问题
2017.3.23 1.0.1 更新demo获取token失败的错误提示的交互
2017.3.16 1.0.0 在线OCR第一版!
上一篇
C++语言
下一篇
快速入门