自定义模板文字识别使用指南

首页版块访问AI主站注册发帖

自定义模板文字识别使用指南

精

付洋洋carrie 发布于2018-01 浏览:31423 回复:26

自定义模板文字识别使用指南

快速回复

最后编辑于2023-10

本文档介绍了【自定义模版文字识别】的模板配置操作和技巧，这是使用本产品的关键步骤，掌握模版配置的技巧能极大的提高后续识别的准确率。阅读本篇文档大约需要10分30秒。

产品介绍
自定义模版文字识别是一款您可以针对各种票据、卡证实现字段名和字段值对应提取的OCR产品；举例：当您需要识别某一种证件（比如房产证），但是百度官方还没有针对这种类型的证件推出具体的模版识别接口，而使用通用文字识别无法实现字段名和字段值对应化的提取，这种情况下您可以使用自定义模版文字识别产品，实现结构化的数据提取。

基本原理
如果您要识别特定的一类具有固定格式的文档，首先上传一张该文档的图片作为模板（用于制作模版的图片要求摆放端正、平整，拍摄时避免过曝，阴影等不良情况），然后在模板上框选一些固定的字段作为【参照点】。后续调用识别接口时，会将新上传的图片以【参照点】为依据，扭正到和模板图片一致。最后框选需要识别的区域作为【识别区】，框选后在右侧给该识别区命名，点击保存，这便完成了一个模版的制作。

名词解释
【参照点】：图片中固定不变的文字段，后期上传的图片会以此为依据进行扭正，参照点的选取会影响图片的识别率。
【识别区】：需要识别的内容所在的位置区域。
【 templateSign】：模板ID，用于指定后期上传的图片用哪个模版来进行识别。

简单模板制作步奏
上传模板图片
点击进入产品页面： ai.baidu.com/iocr ，点击“创建模版”后首先对模版进行命名，点击编辑区域上传一张清晰、平整、完整的图片作为模板图片，模板图片对后续识别有很大影响，请尽量保证模板图片清晰平整，切勿有弯折。下图的示例中我们上传一张北京地铁发票作为演示：

框选参照点
点击工具栏从左往右第三个小图标【参照点框选工具】，进行参照点框选。参照点必须为模板图片上的文字段。框选时有一些注意点：

同一参照点的文字必须在同一行，尽量相邻；
参照点必须是模版图片和后期上传的图片中共同并且位置不变的文字段；
参照点尽量四散在图片的边缘，尤其是四角；
一个参照字段尽量2-4个字，不用太长；太长的参照字段效果会变差
参照点尽量在模板图片上唯一，在图片中多次出现的文字段效果较差；
参照点尽量多，推荐标注8个以上的参照点，至少4个，参照点越多越分散识别效果越好；
下面是一个参照点框选的示例，橘色矩形框选的为参照点：

如果您需要删除/修改参照点，可以在右侧点击“X”来进行删除。

框选识别区
点击工具栏从左往右第一个小图标，进行识别区选择。例如单据中常见的日期。此时需要您把日期值所在的区域使用识别区框选工具框选出来，然后在右侧填写这个字段对应的字段名。沿用刚刚的定额发票的示例，蓝色矩形框选的为固定识别区

复杂模版制作步骤
在阅读复杂模版制作步骤之前，建议您先阅读上面【简单模版制作步骤】，通过上面的阅读您已经可以制作相对简单的模板，接下来从头演示一个带有表格识别区的复杂模板：

框选参照点(注意：要尽量分散且越多越好)

框选固定识别区（框选字段值的区域）

表格识别区是针对表格类的数据，因为表格本身的结构比较复杂，所以制作表格识别区的步骤也相对复杂。点击工具栏从左往右第二个小图标，弹出小框，输入表格的列数。例如本例中的表格共有三列，则输入3，点击插入

将新出现的表格识别区拖到模板图片的表格区域，将鼠标移动到表格识别区顶点的白点附近，点击选取表格识别区顶点的白点，拖拽表格识别区和「表格内容」一样大。注意是表格内容！「不包括表头」

将鼠标移动到表格识别区内，竖线上的白点附近，点击选取白点，左右拖拽调整列宽。调整好后，类似固定识别区。最后在右侧填写表名和各列的列头名称

保存模板

点击下方的保存按钮，弹出保存成功提示框，可以按照提示选择填写备注「此处强烈建议您填写，方便后期的版本管理」。至此一个模板已经制作完成

测试模板效果

此时可以通过点击下方的试一试按钮，检查当前模板制作的情况。例如测试另一张图，用更加自然的方式拍摄

发布模板

如果觉得效果不好，可以继续编辑/调整模板，然后保存后再测试；如果觉得效果已经符合要求，可以点击下方的发布按钮进行发布操作，注意：只有发布后的模板才能在线上进行接口调用。如果没有发布，那么仅仅是生成了一个新的版本，此时对模板的任何修改都不会影响线上调用。

发布页面中提示的模板ID也可以在自定义模板管理页查询到，也就是管理页的templateSign

线上接口会用到模板ID【templateSign】。接口文档参见（http://ai.baidu.com/docs#/OCR-API/8b83b775），当然您可能还有很多其他疑问，建议您可以参考自定义模版文字识别Q&A（http://ai.baidu.com/docs#/OCR-API/0d7080dd），或者在论坛（http://ai.baidu.com/forum/topic/list/164）发布您的问题，甚至您可以直接加入我们QQ群（群号：570832882），直接找到工作人员帮您解答。

文档

文字识别