资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

概览

如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:

  • 在百度云控制台内 提交工单 ,选择文字识别服务。
  • 如有需要讨论的疑问,欢迎进入 AI社区 与其他开发者们一同交流。

SDK产品概述

OCR离线识别SDK为离线版识别模型,可集成在本地电脑、手机、智能硬件等终端设备。SDK一经授权激活,可完全在无网环境下进行文字识别,所有数据皆在设备本地运行处理,可根据业务需要进行灵活的上层业务开发。
目前控制台已提供的离线SDK有:通用文字识别、车牌识别、身份证识别、数字字母识别、vin识别、办公文档识别等,均可在控制台自助申请试用和购买。
如有其他SDK需求,如快递单识别、驾驶证识别、银行卡识别、护照识别等,以及其他平台版本(如车牌识别Linux版本),可在 合作咨询 联系我们。

适用场景特点

离线SDK适用于有以下特点的场景:

  • 特殊网络环境:无网、弱网、局域网等情况,无法连接公网的环境下。
  • 数据安全要求高:由于行业特点所带来的的数据敏感性,即使可以连接公网也不可请求。
  • 识别速度要求高:由于各地网络线路,机房部署等诸多原因,网络请求速度存在不可控因素。
  • 运行稳定要求高:需要尽可能避免网络抖动、机房故障等影响,进一步控制可用性影响因素。

使用流程

process.png

  1. 申请试用或购买:进行企业认证后即可申请试用或购买,请选择对应的SDK模型
  2. 选择授权方式:试用申请通过后,或购买完成后,可在控制台查看授权总数(授权数量为可以授权激活的的设备数量),并进行单台设备授权或批量设备授权(单台设备授权请点击“添加序列号”,批量设备授权请点击“新建应用”)
  3. 下载SDK并激活:在控制台下载对应模型的SDK,集成到本地设备或应用程序中,进行激活,详情请见授权方式
  4. 进行效果测试:在设备端进行效果测试

视频教程请参见 离线SDK使用教程(视频版)

规格信息

  • 包大小:不同模型SDK包大小不同,平均约100M,集成后的SDK约10-20M左右。
  • 性能:不同模型SDK性能有差异,总体在1s以内。以车牌识别Android环境为例,四核平均耗时57.3ms(测试环境海信H20)
  • 识别结果举例:
    picture1.png

以上指标,由最新版SDK运行在真实设备上,采用真实数据集所得,但算法性能受实际运行设备、实际数据集等情况影响,以上数字仅供参考。

SDK介绍

通用文字识别SDK

检测识别图片中所有文字信息,覆盖多种使用场景,支持识别中、英、俄、西、葡等18种语言内容。可输出文字信息、文字位置以及置信度信息,可以根据业务场景灵活提取所需字符内容。支持拍照识别和视频扫描识别。可集成于PDA、高拍仪、电脑以及手机APP中,常用于文档识别、包装信息识别、工业铭牌识别等场景。

支持系统 描述
Android 支持armv7和armv8架构,兼容android 6.0及以上系统,开发语言为JAVA
Windows Windows x64, 支持Win7、Win10主流windows平台,需AVX 指令集的CPU,支持C++和C#两种开发语言
iOS 仅支持按应用授权,可集成到iOS app上。如需调试专版SDK,可联系商务经理获取,可提交合作咨询,或者提交工单
ARMLinux 支持armv7和armv8架构,适配常见芯片型号,开发语言为c++。专版SDK,需线下获取,如需调试,可联系商务经理获取,如没有商务经理/不知晓联络方式,可提交工单咨询

办公文档识别SDK

面向文档识别场景推出的高级版离线SDK,在通用文字识别SDK的基础上升级文字识别效果,增加版式识别、手写识别能力,支持将图片/PDF转换为Word文档,并保留原版式布局,尤其适用于高拍仪、扫描仪等设备集成。

支持系统 描述
Windows Windows x64, 支持Win7、Win10主流windows平台,需AVX 指令集的CPU,支持C++和C#两种开发语言

车牌识别SDK

识别中国大陆常见机动车车牌信息,支持蓝牌、黄牌、绿牌、港牌等各类车牌。支持拍照识别和视频扫描识别,可同时识别多个车牌。常用于PDA、执法仪、智能相机、停车场闸机等设备,在道路、工厂、小区等场景数字化管理车辆,大幅提升管理效率。

支持系统 描述
Android 支持armv7和armv8架构,兼容android 6.0及以上系统,开发语言为JAVA
ARMLinux 支持armv7和armv8架构,适配常见芯片型号,开发语言为c++
Windows Windows x64, 支持Win7、Win10主流windows平台,需AVX 指令集的CPU,支持C++和C#两种开发语言

身份证识别SDK

结构化识别二代居民身份证正反面所有8个字段,识别准确率超过99%,支持端上质量校验和风险判断,支持拍照识别和视频扫描识别,可集成于手机APP、窗口一体机、人证核验机等设备中。本地识别,数据不上云,有效保护隐私安全。

支持系统 描述
Android 支持armv7和armv8架构,兼容android 6.0及以上系统,开发语言为JAVA
iOS 仅支持按应用授权,可集成到iOS app上。如需调试专版SDK,可联系商务经理获取,可提交合作咨询,或者提交工单
Windows Windows x64, 支持Win7、Win10主流windows平台,需AVX 指令集的CPU,支持C++和C#两种开发语言

数字字母识别SDK

识别图片中所有的数字和字母,自动过滤其他文字内容,快速提取编号信息,毫秒级识别速度。可集成于PDA、工业相机等设备,常用于生产批次管理、零件编号管理等线下作业场景。

支持系统 描述
Android 支持armv7和armv8架构,兼容android 6.0及以上系统,开发语言为JAVA
Windows Windows x64, 支持Win7、Win10主流windows平台,需AVX 指令集的CPU,支持C++和C#两种开发语言

VIN码识别SDK

识别车辆挡风玻璃处的车架号码,可应用于4S店车辆出入库管理、车辆出租管理、车辆维修保养等场景,快速完成车辆信息统计及管理,有效降低人工录入成本,实现车辆管理的自动化。常集成于PDA、手持平板或手机APP中。

支持系统 描述
Android 支持armv7和armv8架构,兼容android 6.0及以上系统,开发语言为JAVA

快递单识别SDK

可识别市面上常见版式的快递面单,包括四通一达/顺丰/京东/邮政/极兔等面单版式,识别快递单上的条形码、单号、收/寄件人信息、三段码等9个关键字段,支持虚拟面单识别。常用于快递驿站手机、PDA、高拍仪、快递柜等设备以及物流中心的分拣机上进行快递面单信息提取入库和分拣管理。

支持系统 描述
Android 支持armv7和armv8架构,兼容android 6.0及以上系统,开发语言为JAVA
Windows Windows x64, 支持Win7、Win10主流windows平台,需AVX 指令集的CPU,支持C++和C#两种开发语言
iOS 仅支持按应用授权,可集成到iOS app上。如需调试专版SDK,可联系商务经理获取,可提交合作咨询,或者提交工单

如有其他SDK需求,可在 [合作咨询](https://ai.baidu.com/consultation/cooperation?referrdoc/OCR/yk3h7y3sc) 联系我们。
上一篇
HTTP-SDK文档
下一篇
试用或购买授权