产品介绍
简介
OCR 私有化部署服务支持将 OCR 识别模型部署至本地服务器或私有云环境,为企业提供 高隐私性 和 强实时性 的内网 API 服务,可供局域网内的设备进行调用。70+ 款标准模型及自定义平台可供选择,可满足 手写/印刷文本、各类卡证票据 等不同类型文字识别需求,同时可提供 自定义/自训练平台 的本地化部署,助您快速搭建企业 AI 中台。
所有模型及平台均可提供 容器化软件部署包,可部署于企业的本地服务器或私有云上,CPU/GPU 环境均可部署,主流显卡均可兼容。同时,支持单机部署、多机部署、集群部署等方式,并提供一键部署工具,可快速安装运行环境、容器及模型服务,最快半小时即可完成安装部署。
部署后可以实现与对应云端 API 能力相同的功能及效果(参数有少量区别,具体请参考相应技术方向的接口文档),适用于政务审批、金融、保险、财务等 数据需与公网隔离 的场景,以及交通车牌识别等 高并发高实时性要求 的场景。
申请使用前也请提前准备好鉴权物理机和服务器资源,这是您运行 OCR 应用服务的基础,详细硬件推荐请点击[了解详情]。同时,强烈建议您调用对应云端接口进行初步测试,确认效果及功能基本可满足需求后再发起私有化申请,以免耽误您的部署时间。
视频教程请参见:OCR 私有化部署操作教程
方案优势
- 纯离线:满足无网、弱网、专网等多种网络需求,满足内部数据与公网隔离的私密性需求
- 纯软件:不与硬件进行捆绑,价格优惠,无需硬件入场审批,充分利用现有机器资源,且可以快速测试、快速交付
- 能力全面:70+ 款标准能力及 2 款自定义/自训练平台的均可支持私有化部署,满足不同业务场景的文档、卡证、票据识别需求
- 识别效果领先:基于业界领先的深度学习技术,提供多场景、多语种、高精度的整图文字检测和识别服务,多项 ICDAR 指标居世界第一
- 毫秒级响应:具备高并发、高吞吐、低时延等能力,且算法卓越,性能强劲,识别速度业界领先,可应对各种实时性业务需求
- 选型灵活:可自由选择不同 QPS 配置,灵活适应各种业务量级的调用需求
- 服务专业:首次部署可提供专属交流群进行远程部署及答疑支持,正式购买后一年内提供免费线上技术支持及模型更新服务
常用能力列表
模型名称 | 模型功能 | 支持部署环境 | 对应云端能力 |
---|---|---|---|
通用场景文字识别 | |||
通用文字识别 | 识别图片中的文字信息及文字区域的坐标信息,支持中文简体、中文繁体、英文识别 | CPU/GPU | 通用文字识别 |
通用文字识别(多语种版) | 识别图片中的文字信息及文字区域的坐标信息,支持 20 种语种识别,包含 中英文混合、英文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语 | GPU | 通用文字识别 |
网络图片文字识别 | 针对网络图片进行专项优化,对艺术字体或背景复杂的文字内容具有更优的识别效果 | GPU | 网络图片文字识别 |
办公文档识别 | 支持对办公类文档版面进行分析,输出图、表、标题、文本的位置,及各版块识别结果,支持中、英两种语言的手写、印刷体混排场景 | GPU | 办公文档识别 |
手写文字识别 | 对手写汉字、英文、数字内容进行识别 | GPU | 手写文字识别 |
表格文字识别 | 对单据或报表中的表格内容进行结构化识别,识别结果默认以 JSON 形式返回,如需返回 Excel,可提供调用脚本进行结果转化 | CPU/GPU | 表格文字识别(同步接口 |
卡证文字识别 | |||
身份证识别 | 对中国大陆二代居民身份证正反面所有8个字段进行结构化识别,支持身份证正反面自动检测及多身份证混贴识别 | CPU/GPU | 身份证识别 |
银行卡识别 | 对银行卡的卡号、有效期进行结构化识别 | CPU/GPU | 银行卡识别 |
营业执照识别 | 对各类版式的营业执照的全部字段进行结构化识别,包含证件编号、社会信用代码、单位名称、地址、法人、类型、成立日期、有效日期、经营范围 | CPU/GPU | 营业执照识别 |
护照识别 | 对中国大陆居民护照的资料页的全部 15 个字段进行结构化识别,包含国家码、姓名、性别、护照号、出生日期、签发日期、有效期至、签发地点等 | CPU/GPU | 护照识别 |
户口本识别 | 对户口本内常住人口登记卡的全部 22 个字段进行结构化识别,包含出生地、出生日期、姓名、民族、与户主关系、性别、身份证号码等 | CPU/GPU | 户口本识别 |
出生医学证明识别 | 对出生证明的全部 23 个字段进行结构化识别,包含出生时间、姓名、性别、出生证编号、父亲姓名、母亲姓名等 | GPU | 出生医学证明识别 |
财务票据文字识别 | |||
混贴票据识别 | 对粘贴在同一张A4纸上的多张不同种类票据进行自动切分并识别,可返回每张票据的位置、种类及票面的结构化识别结果。已支持增值税发票、定额发票、卷票、火车票、出租车票、行程单、机动车销售发票、汽车票、通行费发票、购车发票、二手车发票、网约车行程单、船票等 13 类票据的混贴识别 | CPU/GPU | 混贴票据识别 |
银行回单识别 | 对各大银行的收/付款人户名、账号、开户银行、金额、日期等关键字段进行结构化识别 | CPU | 银行回单识别 |
增值税发票识别 | 对增值税普通发票、专用发票、电子发票的全部关键字段进行结构化识别,发票基本信息、销售方及购买方信息、商品信息、价税信息等;增值税卷票识别需部署单独模型 | CPU/GPU | 增值税发票识别 |
增值税卷票识别 | 对增值税普通卷票的全部关键字段进行结构化识别,发票基本信息、销售方及购买方信息、商品信息、价税信息等 | CPU/GPU | 增值税发票识别 |
火车票识别 | 支持对红、蓝火车票的 13 个关键字段进行结构化识别,包括车票号码、始发站、目的站、车次、日期、票价、席别、姓名、座位号、身份证号、售站、序列号、时间 | CPU/GPU | 火车票识别 |
出租车票识别 | 支持识别全国各大城市出租车票的 16 个关键字段,包括发票号码、代码、车号、日期、总金额、燃油附加费、叫车服务费、省、市、单价、里程、上车时间、下车时间等 | CPU/GPU | 出租车票识别 |
飞机行程单识别 | 支持对飞机行程单的 24 个字段进行结构化识别,包括电子客票号、姓名、始发站、目的站、航班号、日期、时间、票价、身份证号、金额、客票级别、座位等级等。 同时,支持单张行程单上的多航班信息识别 | CPU/GPU | 飞机行程单识别 |
汽车场景文字识别 | |||
车牌识别 | 支持识别中国大陆机动车蓝牌、黄牌(单双行)、绿牌、大型新能源(黄绿)、领使馆车牌、警牌、武警牌(单双行)、军牌(单双行)、港澳出入境车牌、农用车牌、民航车牌的地域编号和车牌号。同时,支持识别图像中的多张车牌,并可提供高拍场景专用识别模型 | CPU/GPU | 车牌识别 |
驾驶证识别 | 支持对机动车驾驶证正页及副页所有15个字段进行结构化识别,包括证号、姓名、性别、国籍、住址、出生日期、初次领证日期、准驾车型、有效期限、发证单位、档案编号等 | CPU/GPU | 驾驶证识别 |
行驶证识别 | 对机动车行驶证主页及副页所有22个字段进行结构化识别,包括号牌号码、车辆类型、所有人、品牌型号、车辆识别代码、发动机号码、核定载人数、质量、尺寸、检验记录等 | CPU/GPU | 行驶证识别 |
机动车销售发票识别 | 支持对机动车销售发票的26个关键字段进行结构化识别,包括发票代码、发票号码、开票日期、购买方信息、销售方信息、车辆信息、价格、税额等 | CPU | 机动车销售发票 |
医疗票据文字识别 | |||
医疗发票识别 | 支持识别全国各地门诊/住院发票的业务流水号、发票号、住院号、病例号、姓名、性别、社保卡号、金额大/小写等关键字段,其中北京/广东/河北/河南/江苏/山东/上海/天津/浙江等地区票据识别效果较佳;支持识别收费项目明细,并可根据不同省市地区返回对应的识别参数 | GPU | 医疗发票识别 |
医疗费用结算单识别 | 支持识别全国医疗费用结算单的姓名、出/入院时间、发票总金额、自费金额、医保支付金额等 6 个关键字段,其中北京地区票据识别效果最佳 | GPU | 医疗费用结算单识别 |
病案首页识别 | 支持识别全国各地病案首页的病案号、姓名、性别、出生日期、身份证号、出/入院科别、住院次数、药物过敏情况等 15 个关键字段,其中北京地区票据识别效果最佳 | GPU | 病案首页识别 |
医疗费用明细识别 | 支持识别全国医疗费用明细的姓名、日期、病人ID、总金额等关键字段,支持识别费用明细项目清单,其中北京地区识别效果最佳 | GPU | 医疗费用明细识别 |
教育场景文字识别 | |||
试卷分析与识别 | 可对作业、试卷的版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果,支持中、英两种语言的手写、印刷体混排场景 | GPU | 试卷分析与识别 |
服务授权
1、授权方式
私有化部署需获取百度授权后方可使用,百度授权 License 需绑定指定服务器,因此需要您在规划用于部署授权服务的物理机/虚拟机上提取机器指纹,并在申请 OCR 私有化部署包时进行上传方可提交模型打包申请,指纹提取工具的下载和使用可点击查看详情。
百度授权 License 需根据业务需求量进行授权,您可根据实际业务中 每秒需识别的图片数量 申请或购买相应 QPS 的服务授权,如服务部署在多台应用服务器上,各应用服务器均分总授权 QPS 数。
鉴权服务与应用服务可部署在同一机器上,也可分离部署,但需保证被采集了指纹的硬件不被替换,则在 License 允许的实例数范围内,可保证多台连通的服务器运行 OCR 模型,在鉴权服务器不变的情况下可更换应用服务器。
注:如鉴权服务部署在虚拟机上,也需保证对应的物理资源不会被动态调整。
2、授权有效期
如您已通过企业认证,即可申请所需 OCR 服务一个月的免费试用期,在 OCR 控制台 — 私有部署管理 页面发起申请即可。
如您需正式购买,则可选择 按年授权 或 永久授权 两种方式:
- 按年授权:自私有化部署包交付日起 365 天内有效;
- 永久授权:自私有化部署包交付日起至 2099 年 12 月 31 日有效。