自定义模板文字识别使用指南
付洋洋carrie 发布于2018-01 浏览:29553 回复:26
11
收藏
最后编辑于2023-10

本文档介绍了【自定义模版文字识别】的模板配置操作和技巧,这是使用本产品的关键步骤,掌握模版配置的技巧能极大的提高后续识别的准确率。阅读本篇文档大约需要10分30秒。

产品介绍
自定义模版文字识别是一款您可以针对各种票据、卡证实现字段名和字段值对应提取的OCR产品;举例:当您需要识别某一种证件(比如房产证),但是百度官方还没有针对这种类型的证件推出具体的模版识别接口,而使用通用文字识别无法实现字段名和字段值对应化的提取,这种情况下您可以使用自定义模版文字识别产品,实现结构化的数据提取。

基本原理
如果您要识别特定的一类具有固定格式的文档,首先上传一张该文档的图片作为模板(用于制作模版的图片要求摆放端正、平整,拍摄时避免过曝,阴影等不良情况),然后在模板上框选一些固定的字段作为【参照点】。后续调用识别接口时,会将新上传的图片以【参照点】为依据,扭正到和模板图片一致。最后框选需要识别的区域作为【识别区】,框选后在右侧给该识别区命名,点击保存,这便完成了一个模版的制作。

名词解释
【参照点】:图片中固定不变的文字段,后期上传的图片会以此为依据进行扭正,参照点的选取会影响图片的识别率。
【识别区】:需要识别的内容所在的位置区域。
【 templateSign】:模板ID,用于指定后期上传的图片用哪个模版来进行识别。


简单模板制作步奏
上传模板图片
点击进入产品页面: ai.baidu.com/iocr ,点击“创建模版”后首先对模版进行命名,点击编辑区域上传一张清晰、平整、完整的图片作为模板图片,模板图片对后续识别有很大影响,请尽量保证模板图片清晰平整,切勿有弯折。下图的示例中我们上传一张北京地铁发票作为演示:

框选参照点
点击工具栏从左往右第三个小图标 【参照点框选工具】,进行参照点框选。参照点必须为模板图片上的文字段。框选时有一些注意点:

  • 同一参照点的文字必须在同一行,尽量相邻;
  • 参照点必须是模版图片和后期上传的图片中共同并且位置不变的文字段;
  • 参照点尽量四散在图片的边缘,尤其是四角;
  • 一个参照字段尽量2-4个字,不用太长;太长的参照字段效果会变差
  • 参照点尽量在模板图片上唯一,在图片中多次出现的文字段效果较差;
  • 参照点尽量多,推荐标注8个以上的参照点,至少4个,参照点越多越分散识别效果越好;
    下面是一个参照点框选的示例,橘色矩形框选的为参照点:

如果您需要删除/修改参照点,可以在右侧点击“X”来进行删除。

框选识别区
点击工具栏从左往右第一个小图标 ,进行识别区选择。例如单据中常见的日期。此时需要您把日期值所在的区域使用识别区框选工具框选出来,然后在右侧填写这个字段对应的字段名。沿用刚刚的定额发票的示例,蓝色矩形框选的为固定识别区

 

复杂模版制作步骤
在阅读复杂模版制作步骤之前,建议您先阅读上面【简单模版制作步骤】,通过上面的阅读您已经可以制作相对简单的模板,接下来从头演示一个带有表格识别区的复杂模板:

框选参照点(注意:要尽量分散且越多越好)

框选固定识别区(框选字段值的区域)

表格识别区是针对表格类的数据,因为表格本身的结构比较复杂,所以制作表格识别区的步骤也相对复杂。点击工具栏从左往右第二个小图标 ,弹出小框,输入表格的列数。例如本例中的表格共有三列,则输入3,点击插入

将新出现的表格识别区拖到模板图片的表格区域,将鼠标移动到表格识别区顶点的白点附近,点击选取表格识别区顶点的白点,拖拽表格识别区和「表格内容」一样大。注意是表格内容!「不包括表头」

将鼠标移动到表格识别区内,竖线上的白点附近,点击选取白点,左右拖拽调整列宽。调整好后,类似固定识别区。最后在右侧填写表名和各列的列头名称

保存模板

点击下方的保存按钮,弹出保存成功提示框,可以按照提示选择填写备注「此处强烈建议您填写,方便后期的版本管理」。至此一个模板已经制作完成


测试模板效果

此时可以通过点击下方的试一试按钮,检查当前模板制作的情况。例如测试另一张图,用更加自然的方式拍摄


发布模板

如果觉得效果不好,可以继续编辑/调整模板,然后保存后再测试;如果觉得效果已经符合要求,可以点击下方的发布按钮进行发布操作,注意:只有发布后的模板才能在线上进行接口调用。如果没有发布,那么仅仅是生成了一个新的版本,此时对模板的任何修改都不会影响线上调用。

发布页面中提示的模板ID也可以在自定义模板管理页查询到,也就是管理页的templateSign

线上接口会用到模板ID【templateSign】。接口文档参见(http://ai.baidu.com/docs#/OCR-API/8b83b775),当然您可能还有很多其他疑问,建议您可以参考自定义模版文字识别Q&A(http://ai.baidu.com/docs#/OCR-API/0d7080dd),或者在论坛(http://ai.baidu.com/forum/topic/list/164)发布您的问题,甚至您可以直接加入我们QQ群(群号:570832882),直接找到工作人员帮您解答。

收藏
点赞
11
个赞
共26条回复 最后由192******42回复于2023-10
#76192******42回复于2023-10

0
#34阿奴波仔回复于2018-06
#33 白羊OwenLCH回复
Service temporarily unavailable  是什么原因造成的
展开

大概率是服务超时,如果持续这样,就在群里问一下

0
#33白羊OwenLCH回复于2018-06

Service temporarily unavailable  是什么原因造成的

0
#32阿奴波仔回复于2018-06
#31 哈哈哈xhwy回复
发现为啥不少人评论显示被删除?是自己彻了还是违反什么规则了还是咋了?

我也不知道,大概是灌水的帖子,被管理员删除了

0
#31哈哈哈xhwy回复于2018-06

发现为啥不少人评论显示被删除?是自己彻了还是违反什么规则了还是咋了?

0
#30阿奴波仔回复于2018-05
#26 我是谁啊__是我回复
请问怎么做到我想要的格式,用c#做出来后是json数组。求教

你好,具体的问题能加入到qq群里去咨询吗?在这个帖子下说可能不合适,也不及时。qq群号见原帖正文最后部分

0
#26我是谁啊__是我回复于2018-05

请问怎么做到我想要的格式,用c#做出来后是json数组。求教

0
#25一立成木回复于2018-04

#24   图三可识别,图二有一点问题。暂未测试更多例子

0
#24阿奴波仔回复于2018-04
#23 一立成木回复
这个功能很好。我尝试去做仪表的数字识别,字体非印刷体,而是7段数码液晶,发现无法识别出来
展开

这个能发个图出来看看么?

0
#23一立成木回复于2018-04

这个功能很好。我尝试去做仪表的数字识别,字体非印刷体,而是7段数码液晶,发现无法识别出来

0
#22阿奴波仔回复于2018-03
#21 雪冥shadow回复
我制作的一个模板下午都可以识别,晚上就不能识别了是怎么回事呢?同一个图片
展开

您好,加入到qq群里反馈看看吧

0
#21雪冥shadow回复于2018-03

我制作的一个模板下午都可以识别,晚上就不能识别了是怎么回事呢?同一个图片

0
#20阿奴波仔回复于2018-03
#19 慧轮科技回复
怎么java调用该模版失败

要不加一下QQ群(570832882),在里面问问,看看怎么个情况?

0
#19慧轮科技回复于2018-03

怎么java调用该模版失败

0
#18阿奴波仔回复于2018-02
#11 独孤焰坤回复
我试过很多次,上传的照片要很清楚会成功,有时不清楚就不行~

对照片的清晰度有一定的要求,但不会太高,有些情况太高反而不好;目前能处理的情况是文字像素在15*15~28*28之间比较好,所以并不是越高清越好

0
#17阿奴波仔回复于2018-02
#13 LYYAIPQC回复
请教一下: 不规则的表格有没有好的办法处理   它的列分布不均匀

做多个表格呢?或者加入到文末的qq群里,发出来看一下

0
#16阿奴波仔回复于2018-02
#8 fengchao2017回复
使用该方式,制作了一个模板,但是拿着模板图片识别时,提示“未匹配到模板”,什么原因?
展开

建议加入到文末的qq群,在里面发出来看一下

0
#15阿奴波仔回复于2018-02
#12 风搅火回复
这种方法很好,不过对照片的清晰度要求高

对照片的清晰度有一定的要求,但不会太高,有些情况太高反而不好;目前能处理的情况是文字像素在15*15~28*28之间比较好,所以并不是越高清越好

0
#14阿奴波仔回复于2018-02
#9 yy飞O回复
我试过很多次也是这样,上传的照片要很清楚会成功

制作模板有一些技巧,首先上传的模板图片要清晰平整,最好经过处理,比如截取掉边边角角没用的部分,摆得正一些。

0
#13LYYAIPQC回复于2018-02

请教一下: 不规则的表格有没有好的办法处理   它的列分布不均匀

0
TOP
切换版块