产品介绍

更新时间：2026-06-05

简介

OCR 私有化部署服务支持将 OCR 识别模型部署至本地服务器或私有云环境，为企业提供 高隐私性 和 强实时性 的内网 API 服务，可供局域网内的设备进行调用。70+ 款标准模型及自定义平台可供选择，可满足 手写/印刷文本、各类卡证票据 等不同类型文字识别需求，同时可提供 自定义/自训练平台 的本地化部署，助您快速搭建企业 AI 中台。

所有模型及平台均可提供 容器化软件部署包，可部署于企业的本地服务器或私有云上，CPU/GPU 环境均可部署，主流显卡均可兼容。同时，支持单机部署、多机部署、集群部署等方式，并提供一键部署工具，可快速安装运行环境、容器及模型服务，最快半小时即可完成安装部署。

部署后可以实现与对应云端 API 能力相同的功能及效果（参数有少量区别，具体请参考相应技术方向的接口文档），适用于政务审批、金融、保险、财务等 数据需与公网隔离 的场景，以及交通车牌识别等 高并发高实时性要求 的场景。

申请使用前也请提前准备好鉴权物理机和服务器资源，这是您运行 OCR 应用服务的基础，详细硬件推荐请点击[了解详情]。同时，强烈建议您调用对应云端接口进行初步测试，确认效果及功能基本可满足需求后再发起私有化申请，以免耽误您的部署时间。

视频教程请参见：OCR 私有化部署操作教程

方案优势

纯离线：满足无网、弱网、专网等多种网络需求，满足内部数据与公网隔离的私密性需求
纯软件：不与硬件进行捆绑，价格优惠，无需硬件入场审批，充分利用现有机器资源，且可以快速测试、快速交付
能力全面：70+ 款标准能力及 2 款自定义/自训练平台的均可支持私有化部署，满足不同业务场景的文档、卡证、票据识别需求
识别效果领先：基于业界领先的深度学习技术，提供多场景、多语种、高精度的整图文字检测和识别服务，多项 ICDAR 指标居世界第一
毫秒级响应：具备高并发、高吞吐、低时延等能力，且算法卓越，性能强劲，识别速度业界领先，可应对各种实时性业务需求
选型灵活：可自由选择不同 QPS 配置，灵活适应各种业务量级的调用需求
服务专业：首次部署可提供专属交流群进行远程部署及答疑支持，正式购买后一年内提供免费线上技术支持及模型更新服务

常用能力列表

模型名称	模型功能	支持部署环境	对应云端能力
通用场景文字识别
通用文字识别	识别图片中的文字信息及文字区域的坐标信息，支持中文简体、中文繁体、英文识别	CPU/GPU	通用文字识别
通用文字识别（多语种版）	识别图片中的文字信息及文字区域的坐标信息，支持 20 种语种识别，包含中英文混合、英文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语	GPU	通用文字识别
网络图片文字识别	针对网络图片进行专项优化，对艺术字体或背景复杂的文字内容具有更优的识别效果	GPU	网络图片文字识别
办公文档识别	支持对办公类文档版面进行分析，输出图、表、标题、文本的位置，及各版块识别结果，支持中、英两种语言的手写、印刷体混排场景	GPU	办公文档识别
手写文字识别	对手写汉字、英文、数字内容进行识别	GPU	手写文字识别
表格文字识别	对单据或报表中的表格内容进行结构化识别，识别结果默认以 JSON 形式返回，如需返回 Excel，可提供调用脚本进行结果转化	CPU/GPU	表格文字识别（同步接口
卡证文字识别
身份证识别	对中国大陆二代居民身份证正反面所有8个字段进行结构化识别，支持身份证正反面自动检测及多身份证混贴识别	CPU/GPU	身份证识别
银行卡识别	对银行卡的卡号、有效期进行结构化识别	CPU/GPU	银行卡识别
营业执照识别	对各类版式的营业执照的全部字段进行结构化识别，包含证件编号、社会信用代码、单位名称、地址、法人、类型、成立日期、有效日期、经营范围	CPU/GPU	营业执照识别
护照识别	对中国大陆居民护照的资料页的全部 15 个字段进行结构化识别，包含国家码、姓名、性别、护照号、出生日期、签发日期、有效期至、签发地点等	CPU/GPU	护照识别
户口本识别	对户口本内常住人口登记卡的全部 22 个字段进行结构化识别，包含出生地、出生日期、姓名、民族、与户主关系、性别、身份证号码等	CPU/GPU	户口本识别
出生证明识别	对出生证明的全部 23 个字段进行结构化识别，包含出生时间、姓名、性别、出生证编号、父亲姓名、母亲姓名等	GPU	出生医学证明识别
财务票据文字识别
混贴票据识别	对粘贴在同一张A4纸上的多张不同种类票据进行自动切分并识别，可返回每张票据的位置、种类及票面的结构化识别结果。已支持增值税发票、定额发票、卷票、火车票、出租车票、行程单、机动车销售发票、汽车票、通行费发票、购车发票、二手车发票、网约车行程单、船票等 13 类票据的混贴识别	CPU/GPU	混贴票据识别
银行回单识别	对各大银行的收/付款人户名、账号、开户银行、金额、日期等关键字段进行结构化识别	CPU	银行回单识别
增值税发票识别	对增值税普通发票、专用发票、电子发票的全部关键字段进行结构化识别，发票基本信息、销售方及购买方信息、商品信息、价税信息等；增值税卷票识别需部署单独模型	CPU/GPU	增值税发票识别
增值税卷票识别	对增值税普通卷票的全部关键字段进行结构化识别，发票基本信息、销售方及购买方信息、商品信息、价税信息等	CPU/GPU	增值税发票识别
火车票识别	支持对红、蓝火车票的 13 个关键字段进行结构化识别，包括车票号码、始发站、目的站、车次、日期、票价、席别、姓名、座位号、身份证号、售站、序列号、时间	CPU/GPU	火车票识别
出租车票识别	支持识别全国各大城市出租车票的 16 个关键字段，包括发票号码、代码、车号、日期、总金额、燃油附加费、叫车服务费、省、市、单价、里程、上车时间、下车时间等	CPU/GPU	出租车票识别
飞机行程单识别	支持对飞机行程单的 24 个字段进行结构化识别，包括电子客票号、姓名、始发站、目的站、航班号、日期、时间、票价、身份证号、金额、客票级别、座位等级等。同时，支持单张行程单上的多航班信息识别	CPU/GPU	飞机行程单识别
汽车场景文字识别
车牌识别	支持识别中国大陆机动车蓝牌、黄牌（单双行）、绿牌、大型新能源（黄绿）、领使馆车牌、警牌、武警牌（单双行）、军牌（单双行）、港澳出入境车牌、农用车牌、民航车牌的地域编号和车牌号。同时，支持识别图像中的多张车牌，并可提供高拍场景专用识别模型	CPU/GPU	车牌识别
驾驶证识别	支持对机动车驾驶证正页及副页所有15个字段进行结构化识别，包括证号、姓名、性别、国籍、住址、出生日期、初次领证日期、准驾车型、有效期限、发证单位、档案编号等	CPU/GPU	驾驶证识别
行驶证识别	对机动车行驶证主页及副页所有22个字段进行结构化识别，包括号牌号码、车辆类型、所有人、品牌型号、车辆识别代码、发动机号码、核定载人数、质量、尺寸、检验记录等	CPU/GPU	行驶证识别
机动车销售发票识别	支持对机动车销售发票的26个关键字段进行结构化识别，包括发票代码、发票号码、开票日期、购买方信息、销售方信息、车辆信息、价格、税额等	CPU	机动车销售发票
医疗票据文字识别
医疗发票识别	支持识别全国各地门诊/住院发票的业务流水号、发票号、住院号、病例号、姓名、性别、社保卡号、金额大/小写等关键字段，其中北京/广东/河北/河南/江苏/山东/上海/天津/浙江等地区票据识别效果较佳；支持识别收费项目明细，并可根据不同省市地区返回对应的识别参数	GPU	医疗发票识别
医疗费用结算单识别	支持识别全国医疗费用结算单的姓名、出/入院时间、发票总金额、自费金额、医保支付金额等 6 个关键字段，其中北京地区票据识别效果最佳	GPU	医疗费用结算单识别
病案首页识别	支持识别全国各地病案首页的病案号、姓名、性别、出生日期、身份证号、出/入院科别、住院次数、药物过敏情况等 15 个关键字段，其中北京地区票据识别效果最佳	GPU	病案首页识别
医疗费用明细识别	支持识别全国医疗费用明细的姓名、日期、病人ID、总金额等关键字段，支持识别费用明细项目清单，其中北京地区识别效果最佳	GPU	医疗费用明细识别
教育场景文字识别
试卷分析与识别	可对作业、试卷的版面进行分析，输出图、表、标题、文本的位置，并输出分版块内容的OCR识别结果,支持中、英两种语言的手写、印刷体混排场景	GPU	试卷分析与识别

服务授权

1、授权方式

私有化部署需获取百度授权后方可使用，百度授权 License 需绑定指定服务器，因此需要您在规划用于部署授权服务的物理机/虚拟机上提取机器指纹，并在申请 OCR 私有化部署包时进行上传方可提交模型打包申请，指纹提取工具的下载和使用可点击查看详情。

百度授权 License 需根据业务需求量进行授权，您可根据实际业务中 每秒需识别的图片数量 申请或购买相应 QPS 的服务授权，如服务部署在多台应用服务器上，各应用服务器均分总授权 QPS 数。

鉴权服务与应用服务可部署在同一机器上，也可分离部署，但需保证被采集了指纹的硬件不被替换，则在 License 允许的实例数范围内，可保证多台连通的服务器运行 OCR 模型，在鉴权服务器不变的情况下可更换应用服务器。

注：如鉴权服务部署在虚拟机上，也需保证对应的物理资源不会被动态调整。

2、授权有效期

如您已通过企业认证，即可申请所需 OCR 服务一个月的免费试用期，在 OCR 控制台 — 私有部署管理页面发起申请即可。

如您需正式购买，则可选择 按年授权 或 永久授权 两种方式：

按年授权：自私有化部署包交付日起 365 天内有效；
永久授权：自私有化部署包交付日起至 2099 年 12 月 31 日有效。

EasyDL OCR

部署流程