开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
文字识别

    使用流程

    使用说明

    本文档主要说明如何在 iOCR 通用版的可视化界面中完成模板、分类器及字段类型的自定义,同时对模板图片预处理、框选表格识别区等高级功能进行说明

    自定义模板

    创建自定义模板的基本流程如下图所示,仅需上传一张规范的模板图片,通过简单框选,5 分钟即可完成结构化识别模板的制作。

    自定义模板流程

    Step 1: 上传模板图片

    iOCR通用版 - 模板管理页面 点击「自定义模板」标签页下方 「创建模板」 按钮,在弹出框中上传一张 字迹清晰且摆放端正 的模板图片(大小不超过4M,最长边不超过4096像素),并对模板进行命名。

    自定义模板1

    Step 2: 框选参照字段

    进入模板编辑页面,右侧操作步骤中选择 「第1步:框选参照字段」 标签,左侧工具栏选择 「框选参照字段」 按钮,使用鼠标在模板图片中框选位置和内容都固定不变的文字,如下图所示 橘色矩形 框选区域。

    自定义模板2

    注意: 「参照字段」为相同版式的不同图片中位置和内容固定不变的字段,可做为图片的锚点,用做对后续传入的图片进行模板匹配和矫正

    框选Tips:

    1. 参照字段个数需保证在4个以上(推荐8个以上),并尽量分散在四角
    2. 单个参照字段不可跨行,推荐字数在4个以内
    3. 参照字段文字内容在上下文中不会重复出现
    4. 仅支持框选中英文、数字,不可包含符号、图案

    Step 3: 框选识别区

    右侧操作步骤中点击 「第2步:框选识别区」 标签,左侧工具栏选择 「框选识别区」 按钮,使用鼠标在模板图片上框选业务场景需要进行识别的字段,如下图所示 蓝色矩形 框选区域;同时,填写 「字段名称」,并选择合适的 「字段类型」 以提高识别准确率。

    自定义模板3

    注意:「识别区」为图片中需要进行识别的字段,可通过框选及命名构建 「字段名称 : 识别区内容」 的 Key : Value 对应关系,用于对后续传入的相同版式图片的相同位置内容进行结构化识别

    框选Tips:

    1. 尽量扩大识别区框选范围,保证后续传入图片的对应字段内容可被完全覆盖,但同时也需保证不框选到其他字段内容
    2. 选择合适的字段类型有助于提升字段识别效果
    3. 如需识别图片内列宽固定的表格,可点击工具栏中「插入表格」按钮框选表格识别区,可参考 表格识别区使用说明

    Step 4: 试一试

    参照字段和识别区全部框选完毕后,可点击页面右上角的 「试一试」 按钮进行识别效果测试,在弹出框中上传任意一张相同版式的图片即可,如下图所示。可点击图片下方「更换图片」按钮更换测试图片,如多次测试效果满意即可进行发布;如效果不满意可返回继续编辑。

    自定义模板4

    注意:

    1. 如试一试结果出现图片无法匹配模板的情况,需确认上传的测试图片与模板图片是否为同一版式,如确认无误可调节参照字段框选范围或更换参照字段,以提升模板匹配准确率
    2. 如试一试结果中出现识别结果错误的情况,可调整识别区框选范围或更换识别区字段类型,以提升识别准确率

    Step 5: 发布模板,调用API进行使用

    如测试效果满意,可点击试一试弹出框右下角的 「立即发布」 按钮或模板编辑页面右上角的 「发布」 按钮进行发布,发布成功后即可通过模板ID调用该模板,调用方式可查看 API文档

    自定义模板5

    注意: 只有发布后的模板才能通过线上接口进行调用,如果编辑未发布,那么仅仅是生成了一个新的版本,此时对模板的任何修改都不会影响线上调用。

    自定义分类器

    创建自定义分类器的基本流程如下图所示,仅需针对每个模板上传 30 张相同版式的训练集图片或填写分类关键词,即可自动训练一个能够对所选模板进行自动分类的分类器。

    自定义分类器流程

    Step 1: 选择模板

    iOCR通用版 - 分类器管理页面 点击下方 「创建分类器」 按钮,在弹出框中填写「分类器名称」及「功能描述」,填写完毕点击 「确认」 即可进入分类器编辑页面。

    在分类器编辑页面中点击 「添加预置模板」「添加自定义模板」,选择 已发布的 自定义模板或系统预置模板加入训练队列。

    自定义分类器1

    说明:

    预置模板: 系统预置的常用卡证、票据模板,已上传100张训练集图片并已填写分类关键词信息,可直接勾选用于对应图片的自动分类和结构化识别

    自定义模板: 已发布的自定义模板

    Step 2: 上传训练集/填写分类关键词

    点击选中的自定义模板所在行右侧的 「编辑训练集」 按钮,在弹出框中上传一个包含 30 张以上相同版式图片、不超过 200MB 的 ZIP 格式压缩包。

    自定义分类器2

    注意: 「图片训练集」为针对已发布的识别模板上传的相同版式的图片集合,用于训练分类器对后续上传的图片进行自动分类;为了最佳的分类效果,训练集至少包含 30 张以上不重复的、版式相同的图片;系统模版已预置 100 张训练集图片,无需上传

    也可在「分类关键词」列填写对应模板图片中的关键文字内容,需保证填写的关键词在该版式图片中均有出现,且具有特异性,可根据填写的关键词唯一确定图片所属模板类别

    如身份证人像面的“姓名”、“性别”、“民族”、“出生”、“公民身份号码”五个字段在每一张身份证人像面均会出现,且 5 个字段全部出现时基本可确定该图片为身份证人像面,则此 5 个字段即可作为身份证人像面的分类关键词

    注意:每个模板最多可设置 5 个分类关键词,每个关键词最多包含 15 个中英文字符,不可包含其他特殊符号,关键词之间使用(中/英文)逗号进行间隔

    Step 3: 训练

    参与分类的模板及其训练集图片数量或分类关键词符合标准后,即可点击页面左下角的 「开始训练」 按钮进行训练,等待训练完毕后即可在分类器列表中进行查看,训练完成后的分类器有以下三种分类形式:

    • 纯图片特征分类器:如所有模板各上传了 30 张以上相同版式训练集图片,但均未填写分类关键词,则训练出的分类器将完全依据图片特征进行分类;
    • 纯文字特征分类器:如所有模板均填写了分类关键词,但部分或全部模板未上传训练集图片,则训练出的分类器将完全依据关键词的文字信息进行分类;
    • 图文协同分类器:如所有模板各上传了 30 张以上相同版式训练集图片,且部分或全部模板填写了分类关键词,则训练出的分类器将先进行关键词匹配,如匹配到相同关键词则再根据图片特征进行区分。

    自定义分类器3

    Step 4: 测试

    在分类器管理页面的分类器列表中点击训练完毕的分类器右侧的 「测试」 按钮进行效果测试,在弹出框中上传任意一张图片即可,如下图所示,测试结果中包含分类结果及结构化识别结果。可点击图片下方「更换图片」按钮更换测试图片,如多次测试效果满意即可进行发布;如效果不满意可返回继续编辑。

    自定义分类器4

    Step 5: 发布

    如测试效果满意,可点击测试弹出框右下角的 「立即发布」 按钮或分类器列表右侧的 「发布」 按钮进行发布,发布成功后即可通过分类器ID调用该分类器,实现图片的自动分类及结构化识别,调用方式可查看 API文档

    自定义分类器5

    自定义字段类型

    创建自定义字段类型的基本流程如下图所示,仅需输入全部可能出现的输出值,即可创建一个自定义字段类型在制作模板时进行使用,用于字段识别结果的规范和智能纠正。

    自定义字段类型流程

    Step 1: 编辑字段词典

    iOCR通用版 - 字段类型管理页面 点击下方 「创建字段类型」 按钮,在弹出框中填写「字段类型名称」及「词典内容」,在词典内容中列举全部可能出现的输出值内容,填写完毕点击 「立即创建」 即可完成创建;也可点击 「添加预置类型」 按钮直接添加预置的常用字段类型,无需自行编辑词典内容。

    自定义字段类型1

    Step 2: 开始使用

    创建成功的字段类型即可在制作自定义模板选择字段类型时,点击 「我的字段类型」 进行勾选使用,使用后即可对该字段的识别结果进行规范或智能纠正。

    自定义字段类型2

    高级功能

    模板图片预处理

    为保证模板的识别效果,建议上传的模板图片 字迹清晰且摆放端正,以保证后续传入的同版式图片能被匹配、矫正并准确识别。

    如您无法保证上传的模板图片摆放端正,可 在框选参照字段/识别区前 通过我们提供的模板图片预处理功能对模板图片进行 旋转/透视裁剪 操作纠正倾斜图片。

    图片旋转

    点击编辑区左侧工具栏中的 「图片旋转」 按钮,即可进入旋转处理页面。

    在旋转处理页面,使用鼠标按住上方旋转按钮拖动图片顺时针/逆时针旋转,旋转效果满意后松开鼠标点击 「保存」 按钮即可。

    图片旋转

    图片透视裁剪

    点击编辑区左侧工具栏中的 「透视裁剪」 按钮,即可进入裁剪处理页面。

    在裁剪处理页面,使用鼠标按住四角点小圆点进行拖拽,使四边紧贴卡证或票据边缘,拖拽完毕后点击 「保存」 按钮即可。

    图片裁剪

    框选表格识别区

    如果要识别的图片中存在行列固定的表格,可点击工具栏中的 「插入表格」 按钮添加指定列数的表格识别区,通过拖拽表格四角及列分隔线的小白点使识别区覆盖表格区域,并使各列识别区与表格各列对应,即可对表格内容进行结构化识别。

    注意: 表格识别区仅需覆盖表格内容,无需将表头内容进行框选

    表格识别区框选

    如您在操作过程中出现上述内容未说明的问题,可参考 iOCR常见问题,或在OCR论坛发布您的问题,也可加入百度iOCR交流群(群号:570832882)与更多开发者进行交流。

    上一篇
    简介
    下一篇
    API文档