通过使用百度OCR通用文字识别和iOCR自定义模板文字识别,帮助该钢铁物流平台解决了不同格式钢材的产品标签、码单、甚至有污损标签的识别,大幅提高了监管核验的自动化水平,实现了入库信息的快速采集,目前该物流已向合作的50余家钢厂进行了技术成果推介。
核心诉求
钢材标签的分类有数百种之多,由于各种钢材产品标签、码单等格式和条码等均不统一,通常需要靠手工抄录钢材信息,不仅效率低且错误率高。某钢铁物流平台希望能够通过使用通用文字识别技术来进行自动化识别,并且能够对有污损类标签进行识别,同时还能结构化产地、规格、品种、牌号、序列号、重量等信息。
解决方案
该物流平台通过使用百度通用文字识别技术,轻松实现了上述诉求,具体实现过程如下:
步骤一:用户在该物流网内将钢材标签进行拍照上传,网站会先通过图像质量检测对图片质量进行分类,筛选出符合条件的图片;
步骤二:系统再将这些图片进行分类,先对有固定版式的图片直接使用通用文字识别;
步骤三:对于不是固定版式的图片将通过iOCR自定义模板文字识别+NLP文本矫正,对非标准文档进行结构化输出;
步骤四:网站最后将输出的识别结果返回给用户。
业务实现流程图: