自定义模板OCR升级自动匹配识别模板

资讯社区文档

控制台

自定义模板OCR升级自动匹配识别模板

发布日期：2018-06-19 02:00浏览量：3343次

前期百度推出了自定义模板文字识别，可以通过快至15分钟的模板制作，实现结构化的文字内容提取和输入，解决了大部分模板的结构化文字识别问题。但部分客户仍需要投入人力分类指定具体使用的模板。

为了进一步节省人力成本，百度自定义模板文字识别新增自动分类功能，能针对票据、卡证自动分类匹配并调用对应模板一步完成结构化识别。

在企业报销等场景中涉及大量各式发票的结构化识别，之前需要人工分类票据的工作，现可以交由自定义模板的自动分类功能实现，准确率高至99%，一步完成分类+结构化，省时省力！

操作步骤：当创建完文字识别模板之后，按照下面5步即可实现文字识别模板自动分类功能：

1. 分类器管理页面新建分类器

2. 选择参与分类的模板

3. 上传对应模板的训练集

4. 训练完成后测试效果并发布

5. 通过API/SDK调用该服务（具体文档参见：http://ai.baidu.com/docs#/OCR-API/8b83b775）

以下为分步的详细操作指导：

1. 分类器管理页面新建分类器

点击“分类器管理”标签进入管理页面，点击“创建分类器”后输入分类器名称和该分类器的应用场景/功能描述后点击确定进入编辑页面。

2. 选择参与分类的模板

需要分类的模板分为“我的模板”和“系统模板”，“我的模板”是指您在自定义模板文字识别中手动创建的模板，“系统模板”指百度官网预置的模板（包含了：身份证正面、身份证反面、银行卡、驾驶证、行驶证、车牌、营业执照、护照、增值税发票）。客户可以根据业务需要添加模板参与分类。

3. 上传对应模板的训练集

参与分类的如果是百度预置的模板您无需上传训练集，如果参与分类的是您自己制作的模板则需要您准备30到100张同模板的票据打包成ZIP包以后点击“编辑训练集”上传该训练集。当所有的自定义模板都已经上传了符合要求（30到100张、同模板）的训练集后点击“开始训练”。您可以在分类器管理页面查看预计完成的时间并通过刷新查看当前状态。

4. 训练完成后测试效果并发布

当您的分类器训练完成后您可以在分类器管理页面点击“测试”上传图片进行分类测试，如果测试结果没有问题点击“发布”即可通过API调用该接口，如果对分类结果不满意，建议检查训练集数据中是否包含了较多噪声数据，或尝试增加训练集内的图片数量。

5. 通过API/SDK调用服务

如果针对第4步的测试结果没有问题点击“发布”即可通过API调用该接口，参数classifierId指定某个已发布的分类器，即可实现该分类器中任意模板的自动识别。具体调用文档参见：http://ai.baidu.com/docs#/OCR-API/8b83b775。

欢迎使用自定义模板文字识别，如需咨询，可点击屏幕右下角标志，提交具体咨询信息。

推荐阅读：文字识别免费额再提升自定义模板OCR发布

上一篇：【案例】魔云科技：有爱清单-人脸识别互动营销H5

下一篇：【已结束】AI开发者大会想去吗?2388元门票免费送！

快速入口

AI能力体验中心

管理控制台

开发资源

API在线调试

QQ支持群

生态与市场

生态合作伙伴

常见问题

联系我们

售后智能助手

客服电话
400-920-8999

qcode

立即体验AI能力打开百度APP“扫一扫”

qcode

获取最新AI资讯关注“百度AI”微信公众号

技术能力

查看全部AI能力

合作咨询

填写您的业务需求，专属客户经理会尽快联系您，提供1对1咨询服务

售后智能助手

智能诊断，快速解决使用问题

更多咨询，请拨打400-920-8999 转 1

体验AI

Web端前往AI能力体验中心

移动端打开百度APP“扫一扫”