开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
文字识别

    产品介绍

    简介

    OCR 私有化部署服务支持将 OCR 识别模型部署至本地服务器或私有云环境,为企业提供 高隐私性强实时性 的内网 API 服务,可供局域网内的设备进行调用。50+ 款标准模型及自定义平台可供选择,可满足 手写/印刷文本、各类卡证票据 等不同类型文字识别需求,同时可提供 自定义/自训练平台 的本地化部署,助您快速搭建企业 AI 中台。

    所有模型及平台均可提供 容器化软件部署包,可部署于企业的本地服务器或私有云上,CPU/GPU 环境均可部署,主流显卡均可兼容。同时,支持单机部署、多机部署、集群部署等方式,并提供一键部署工具,可快速安装运行环境、容器及模型服务,最快半小时即可完成安装部署。

    部署后可以实现与对应云端 API 能力相同的功能及效果(参数有少量区别,具体请参考相应技术方向的接口文档),适用于政务审批、金融、保险、财务等 数据需与公网隔离 的场景,以及交通车牌识别等 高并发高实时性要求 的场景。

    申请使用前也请提前准备好鉴权物理机和服务器资源,这是您运行 OCR 应用服务的基础,详细硬件推荐请点击了解详情。同时,强烈建议您调用对应云端接口进行初步测试,确认效果及功能基本可满足需求后再发起私有化申请,以免耽误您的部署时间。

    方案优势

    • 纯离线:满足无网、弱网、专网等多种网络需求,满足内部数据与公网隔离的私密性需求
    • 纯软件:不与硬件进行捆绑,价格优惠,无需硬件入场审批,充分利用现有机器资源,且可以快速测试、快速交付
    • 能力全面:50+ 款标准能力及 2 款自定义/自训练平台的均可支持私有化部署,满足不同业务场景的文档、卡证、票据识别需求
    • 识别效果领先:基于业界领先的深度学习技术,提供多场景、多语种、高精度的整图文字检测和识别服务,多项 ICDAR 指标居世界第一
    • 毫秒级响应:具备高并发、高吞吐、低时延等能力,且算法卓越,性能强劲,识别速度业界领先,可应对各种实时性业务需求
    • 选型灵活:可自由选择不同 QPS 配置,灵活适应各种业务量级的调用需求
    • 服务专业:首次部署可提供专属交流群进行远程部署及答疑支持,正式购买后一年内提供免费线上技术支持及模型更新服务

    常用能力列表

    模型名称 模型功能 支持部署环境 对应云端能力
    通用场景文字识别
    通用文字识别 识别图片中的文字信息及文字区域的坐标信息,支持中文简体、中文繁体、英文识别 CPU/GPU 通用文字识别
    通用文字识别(多语种版) 识别图片中的文字信息及文字区域的坐标信息,支持 20 种语种识别,包含 中英文混合、英文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语 GPU 通用文字识别
    网络图片文字识别 针对网络图片进行专项优化,对艺术字体或背景复杂的文字内容具有更优的识别效果 GPU 网络图片文字识别
    办公文档识别 支持对办公类文档版面进行分析,输出图、表、标题、文本的位置,及各版块识别结果,支持中、英两种语言的手写、印刷体混排场景 GPU 办公文档识别
    手写文字识别 对手写汉字、英文、数字内容进行识别 GPU 手写文字识别
    表格文字识别 对单据或报表中的表格内容进行结构化识别,识别结果默认以 JSON 形式返回,如需返回 Excel,可提供调用脚本进行结果转化 CPU/GPU 表格文字识别(同步接口
    卡证文字识别
    身份证识别 对中国大陆二代居民身份证正反面所有8个字段进行结构化识别,支持身份证正反面自动检测及多身份证混贴识别 CPU/GPU 身份证识别
    银行卡识别 对银行卡的卡号、有效期进行结构化识别 CPU/GPU 银行卡识别
    营业执照识别 对各类版式的营业执照的全部字段进行结构化识别,包含证件编号、社会信用代码、单位名称、地址、法人、类型、成立日期、有效日期、经营范围 CPU/GPU 营业执照识别
    护照识别 对中国大陆居民护照的资料页的全部 15 个字段进行结构化识别,包含国家码、姓名、性别、护照号、出生日期、签发日期、有效期至、签发地点等 CPU/GPU 护照识别
    户口本识别 对户口本内常住人口登记卡的全部 22 个字段进行结构化识别,包含出生地、出生日期、姓名、民族、与户主关系、性别、身份证号码等 CPU/GPU 户口本识别
    出生医学证明识别 对出生证明的全部 23 个字段进行结构化识别,包含出生时间、姓名、性别、出生证编号、父亲姓名、母亲姓名等 GPU 出生医学证明识别
    财务票据文字识别
    混贴票据识别 对粘贴在同一张A4纸上的多张不同种类票据进行自动切分并识别,可返回每张票据的位置、种类及票面的结构化识别结果。已支持增值税发票、定额发票、卷票、火车票、出租车票、行程单、机动车销售发票、汽车票、通行费发票、购车发票、二手车发票、网约车行程单、船票等 13 类票据的混贴识别 CPU/GPU 混贴票据识别
    银行回单识别 对各大银行的收/付款人户名、账号、开户银行、金额、日期等关键字段进行结构化识别 CPU 银行回单识别
    增值税发票识别 对增值税普通发票、专用发票、电子发票的全部关键字段进行结构化识别,发票基本信息、销售方及购买方信息、商品信息、价税信息等;增值税卷票识别需部署单独模型 CPU/GPU 增值税发票识别
    增值税卷票识别 对增值税普通卷票的全部关键字段进行结构化识别,发票基本信息、销售方及购买方信息、商品信息、价税信息等 CPU/GPU 增值税发票识别
    火车票识别 支持对红、蓝火车票的 13 个关键字段进行结构化识别,包括车票号码、始发站、目的站、车次、日期、票价、席别、姓名、座位号、身份证号、售站、序列号、时间 CPU/GPU 火车票识别
    出租车票识别 支持识别全国各大城市出租车票的 16 个关键字段,包括发票号码、代码、车号、日期、总金额、燃油附加费、叫车服务费、省、市、单价、里程、上车时间、下车时间等 CPU/GPU 出租车票识别
    飞机行程单识别 支持对飞机行程单的 24 个字段进行结构化识别,包括电子客票号、姓名、始发站、目的站、航班号、日期、时间、票价、身份证号、金额、客票级别、座位等级等。 同时,支持单张行程单上的多航班信息识别 CPU/GPU 飞机行程单识别
    汽车场景文字识别
    车牌识别 支持识别中国大陆机动车蓝牌、黄牌(单双行)、绿牌、大型新能源(黄绿)、领使馆车牌、警牌、武警牌(单双行)、军牌(单双行)、港澳出入境车牌、农用车牌、民航车牌的地域编号和车牌号。同时,支持识别图像中的多张车牌,并可提供高拍场景专用识别模型 CPU/GPU 车牌识别
    驾驶证识别 支持对机动车驾驶证正页及副页所有15个字段进行结构化识别,包括证号、姓名、性别、国籍、住址、出生日期、初次领证日期、准驾车型、有效期限、发证单位、档案编号等 CPU/GPU 驾驶证识别
    行驶证识别 对机动车行驶证主页及副页所有22个字段进行结构化识别,包括号牌号码、车辆类型、所有人、品牌型号、车辆识别代码、发动机号码、核定载人数、质量、尺寸、检验记录等 CPU/GPU 行驶证识别
    机动车销售发票识别 支持对机动车销售发票的26个关键字段进行结构化识别,包括发票代码、发票号码、开票日期、购买方信息、销售方信息、车辆信息、价格、税额等 CPU 机动车销售发票
    医疗票据文字识别
    医疗发票识别 支持识别全国各地门诊/住院发票的业务流水号、发票号、住院号、病例号、姓名、性别、社保卡号、金额大/小写等关键字段,其中北京/广东/河北/河南/江苏/山东/上海/天津/浙江等地区票据识别效果较佳;支持识别收费项目明细,并可根据不同省市地区返回对应的识别参数 GPU 医疗发票识别
    医疗费用结算单识别 支持识别全国医疗费用结算单的姓名、出/入院时间、发票总金额、自费金额、医保支付金额等 6 个关键字段,其中北京地区票据识别效果最佳 GPU 医疗费用结算单识别
    病案首页识别 支持识别全国各地病案首页的病案号、姓名、性别、出生日期、身份证号、出/入院科别、住院次数、药物过敏情况等 15 个关键字段,其中北京地区票据识别效果最佳 GPU 病案首页识别
    医疗费用明细识别 支持识别全国医疗费用明细的姓名、日期、病人ID、总金额等关键字段,支持识别费用明细项目清单,其中北京地区识别效果最佳 GPU 医疗费用明细识别
    教育场景文字识别
    试卷分析与识别 可对作业、试卷的版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果,支持中、英两种语言的手写、印刷体混排场景 GPU 试卷分析与识别

    服务授权

    1、授权方式

    私有化部署需获取百度授权后方可使用,百度授权 License 需绑定指定服务器,因此需要您在规划用于部署授权服务的物理机/虚拟机上提取机器指纹,并在申请 OCR 私有化部署包时进行上传方可提交模型打包申请,指纹提取工具的下载和使用可点击查看详情

    百度授权 License 需根据业务需求量进行授权,您可根据实际业务中 每秒需识别的图片数量 申请或购买相应 QPS 的服务授权,如服务部署在多台应用服务器上,各应用服务器均分总授权 QPS 数。

    鉴权服务与应用服务可部署在同一机器上,也可分离部署,但需保证被采集了指纹的硬件不被替换,则在 License 允许的实例数范围内,可保证多台连通的服务器运行 OCR 模型,在鉴权服务器不变的情况下可更换应用服务器

    注:如鉴权服务部署在虚拟机上,也需保证对应的物理资源不会被动态调整。

    image-20210701004100713.png

    2、授权有效期

    如您已通过企业认证,即可申请所需 OCR 服务一个月的免费试用期,在 OCR 控制台 — 私有部署管理 页面发起申请即可。

    如您需正式购买,则可选择 按年授权永久授权 两种方式:

    • 按年授权:自私有化部署包交付日起 365 天内有效;
    • 永久授权:自私有化部署包交付日起至 2099 年 12 月 31 日有效。
    上一篇
    离线SDK
    下一篇
    部署流程