最近搜索
热门产品
语音识别
人脸识别
文字识别
内容安全
情感倾向分析
资讯
社区
文档
控制台
登录
未实名
立即认证
用户中心
财务及订单
消息中心
我的工单
退出登录
数链科技用飞桨和文心大模型打造大宗商品数字供应链系统,提升行业透明度及标准化
发布日期:2023-05-21 16:00
浏览量:758次
大宗商品行业市场规模巨大、关系国计民生,它的三个核心类别——能源商品、基础原材料、农副产品均在我国经济发展进程中起着举足轻重的作用。这其中,大宗商品供应链的顺畅运行和稳定发展对整个产业链的运作至关重要。
然而传统大宗商品供应链普遍存在
交易环节不透明
、
业务流程不标准
两大问题:贸易链条中各个节点的信息互不相通,各自形成了信息孤岛;贸易流程中的合同、发票、货物质量、资金流转、税务等环节往往难以严格按照相关标准和规定执行,且普遍依赖人工处理交易信息。这两大问题导致了各环节信息无法交叉验证、信息流通效率低下,不仅制约了大宗商品供应链升级提效,而且行业造假、欺诈事件频频发生,严重影响行业发展。
数链科技,一家致力于用人工智能等先进科技手段实现大宗商品实时交易数字化的公司,基于飞桨文字识别开发套件 PaddleOCR、自然语言处理模型库 PaddleNLP,开发了
大宗商品数字供应链智能识别与管理系统
。聚焦线下单据识别场景难题,基于 PaddleNLP 的通用信息抽取模型 UIE-X (以文档智能大模型文心 ERNIE-Layout 为模型底座, ERNIE-Layout 创新性引入布局知识增强,在多个文档问答榜单登顶,为各类上层应用提供了 SOTA 模型底座),通过实现非标单据的识别及关键字段提取,破除大宗商品供应链环节信息壁垒,完善系统数据质量的同时显著提高了交易效率。
以非标单据数字化为切入点
破除“不透明、不标准”信息壁垒
基于对大宗商品行业的深刻认知及对行业供应链的痛点洞察,数链科技团队敏锐地认识到,要让大宗商品交易实现升级提效,首先要让所有交易信息实现高效精准的数字化。
“传统的大宗商品供应链中,比如物流票据、合同之类的交易信息,都以实物形式存在,需要人工拍照、存档,然后人工进行信息录入。一旦出现问题,也需要人工审查、回溯图片信息。”数链科技总裁助理张越介绍,“而各个企业的单据标准常常不一样,也就是存在大量线下非标单据,这就导致人工录入单据和追溯复查的难度极大。于是我们希望能够找到一种方式,先提升非标单据数字化的效率,然后以此为切入点,推动行业的整体数字化升级。人工智能技术,就是我们的最优选。”
结合业务流程,数链科技技术团队将实现非标单据数字化的目光锁定在文字识别与信息抽取领域。然而团队调研后发现,虽然市场上已经存在文字识别技术供应商,但鲜少有针对于大宗商品供应链开发的解决方案。大宗供应链各环节都需要大量的线下表单来记录商品及其运输、交易信息。但是,企业与企业之间的单据样式存在较大差异,没有行业统一标准,而且往往机打单据与手写单据并存。不仅如此,大宗商品与其他普通商品不同,商品记录中存在大量日常生产生活中不常用的特殊字符。市场上的方案模型普遍缺乏针对特殊字符等行业数据的训练,且难以支持多种非标表单的准确识别和信息抽取归类,导致信息识别效率低,无法满足当前业务的需求。
传统非标单据示例:不同企业的汽运磅单
另一方面,采购外部供应商的产品也缺乏灵活性,系统升级改造需要花费大量时间与供应商对接调校,遇到供应商人力无法支持时,更会严重影响投入使用的进度。因此,自研一种高效灵活的产品,成为团队当务之急。
飞桨技术+生态
助力非标单据识别效率提升20倍
最终,团队选择基于飞桨文字识别开发套件 PaddleOCR 和自然语言处理模型库 PaddleNLP 和通用信息抽取模型 UIE-X 开展自研项目。通过 PaddleOCR 提供的丰富实用的工具库,训练针对大宗供应链非标单据识别模型,并通过 PaddleNLP 调用 UIE-X 的基础上,使用自己的数据集进行微调,极大降低训练开发成本。整体技术方案可以归纳为如下步骤:
充分调研业务单据的类型,根据已有的海量的样本,明确需要提取的关键信息,设定提取的关键字规则;
基于 PaddleOCR、PaddleNLP、UIE-X 进行模型分析,开发相应的关键字抽取规则;
通过数据标注、模型评估进行模型训练,通过业务反馈进行规则优化。
研发流程示意图
在文字识别过程中,传统的光学字符识别过程为:图像预处理(彩色图像灰度化、二值化处理、图像变化角度检测、矫正处理等)、版面划分(直线检测、倾斜检测)、字符定位切分、字符识别、版面恢复、后处理、校对等。使用飞桨文字识别开发套件 PaddleOCR ,首先降低了入门门槛,不需要最基础的光学字符识别理论,其次 PaddleOCR 拥有丰富的组件和公开的文字检测、文字识别等一系列基础预训练模型,大大降低了 AI 入门难度。对于开发者来说,只需具备一定的 Python 开发能力即可在开源模型基础上进行测试、调优,最终短时间内完成部署上线。
自然语言处理模型库 PaddleNLP 内的跨模态文档通用信息抽取模型 UIE-X ,以文心大模型为基础,在没有专业标注团队的情况下,使用小样本训练,进行定制化开发,大量节省了标注成本。在此基础上,数链只需准备几十份合同样本,使用飞桨智能标注 PaddleLabel 进行标注、训练,最终关键信息抽取精度达到87.5%。
在部署过程中,PaddleOCR 支持 HubServing 服务,PaddleNLP 支持 SimpleServing 服务,并且支持半精度推理方式,加快推理速度,可进行一键部署。还支持 CPU、GPU 多种服务器部署,在测试过程中降低了调试难度。部署过程使用 Docker 一键安装方式,降低了运维部署负担。
最终,项目团队成功自研出大宗商品数字供应链智能识别与管理系统,在大宗商品供应链线下单据的识别场景下,实现了线下非标单据的识别及关键字段提取,极大提高了人工补录相关单据的效率。
原本人工补录线下合同需要5分钟,现在只需人工确认结果及部分纠正即可,时间提升至15秒以内,识别效率达到原先的20倍。
据数链科技介绍,使用该系统的某企业信息录入人员反馈,每月业务最密集的时候,往往会有集中性的大量非标单据需要录入,通常部门中3位同事需要每天全员加班4个小时以上。现在通过使用大宗商品数字供应链智能识别与管理系统,即使是在业务最繁忙的时候,也可以告别加班,释放出了更多的人力完成更具专业性的运营工作。同时,由原先的人工录入改为机器识别,也极大增加了数据准确度。原先每季度平均会遇到10-15次信息录入错误,严重的甚至会造成付款金额错误,现在则再也没有出现过。整体提升了业务水平,让公司发展更健康。
项目在大宗供应链典型的表格识别场景下表现优秀。团队重新训练标注表格识别模型,将单行数据提取以单元格为维度进行矫正输出,最终使表格识别精度从87%上升到98%,大大提升合同中表格识别的准确率,对大宗商品业务场景中大量的表格式单据(如财报、铁路大票、发票、磅单、化验凭证等)的信息提取有重大意义。
张越表示,飞桨生态社区的存在也是团队当初选择飞桨进行开发的一个重要原因:“飞桨社区提供了比较多的产业范例,例如在图片反欺诈、签名比对等场景带给我们很多灵感和技术指导,同时还能帮助我们及时获取技术在产业应用的最新动态。不仅如此,我们在研发过程中遇到技术上的问题,也总能及时得到飞桨专业的研发团队和运营团队的相应支持。”
目前,数链科技大宗商品数字供应链智能识别与管理系统,已经实现线下合同、铁路大票、汽运磅单等非标单据的自动识别与信息提取,为1000余家煤炭、粮食等大宗商品领域不同规模的供应链企业提供商业化服务。
持续提升改进
赋能更多中小企业
谈到发展计划,张越表示,数链科技大宗商品数字供应链智能识别与管理系统将持续在两个主要方面进行升级拓展。
一是不断提升
系统本身的产品力和技术力
。一方面持续优化用户使用体验,让系统不仅“有用”而且“好用”,让更多客户愿意使用,共同推进行业数字化转型。另一方面扩展系统边界,尽可能多地覆盖不同类目大宗商品、不同场景业务需求,提供通用化服务。
二是结合物联网、区块链等技术,构建智慧仓储物联网平台,为大宗产品贸易中多方参与的交易流程提供防篡改、可溯源、具有公信力的
存证记录
。从而将供应链数据与金融服务打通,为广泛的中小型大宗商品供应链企业获得银行贷款等金融服务提供必要帮助,解决其“融资难、融资贵”的痛点。
“数链科技由具有资深大宗商品行业背景、金融背景、科技背景的高级管理人员发起成立。我们通过科技应用赋能大宗商品供应链,让大宗商品交易更透明,让中小企业融资更高效、成本更低。”张越介绍,“未来我们也希望能够和百度飞桨、文心大模型产生更多的合作,进一步提升大宗物流供应链流程自动化和智能监控的水平,并通过AI技术构建数据挖掘和风险评估模型,帮助更多中小企业获得金融支持机会。”
引入先进AI技术,为行业带来数字智能化转型,破除大宗商品行业“不透明、不标准”的壁垒已成为行业趋势。飞桨和文心大模型也将携手更多供应链服务企业持续助力行业转型升级,探索人工智能在大宗商品行业的落地路径,创造经济与社会价值。
文章参考
PaddleNLP UIE-X
https://github.com/PaddlePaddle/PaddleNLP/tree/develop/applications/information_extraction/document
PaddleOCR
https://github.com/PaddlePaddle/Paddleocr
相关阅读
宝武中南钢铁借助飞桨让钢筋超限监控有了“火眼金睛”
长三角生物医药产业加速跑,飞桨螺旋桨为创新药企、医药技术伙伴装上AI大模型引擎
利用飞桨技术引领废钢判级行业新格局
银行智能案防:以“AI技防”堵住违规漏洞
实时性升至秒级!飞桨PaddleSpeech赋能金融双录业务走向智能化
微信扫一扫
关注该公众
上一篇:
与文心一格相约520,绘出最有AI的“心花绽放”!
下一篇:
语音字幕服务重磅升级 生产效率全面提升!
相关动态
焕新升级 | 度目凌云平台改版工作台
厦门航空接入百度语音会议系统,打造高效会议新体验
慧博云通加入飞桨技术伙伴计划,共同推动企业AI应用创新
清微智能TX5368A与飞桨完成Ⅱ级兼容性测试,助力全行业智能化升级
Prompt范式产业实践分享!基于飞桨UIE-X和Intel OpenVINO实现跨模态文档信息抽取
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术
查看全部AI能力
语音识别
>
短语音识别标准版
热门
短语音识别极速版
实时语音识别
音频文件转写
EasyDL 语音自训练平台
>
呼叫中心语音
呼叫中心音频文件转写
呼叫中心实时语音通话
呼叫中心智能语音质检
新品
语音私有化部署方案
>
语音合成
>
短文本在线合成
热门
长文本在线合成
定制音库
热门
语音合成离线SDK
>
智能硬件
百度鸿鹄语音芯片
机器人平台ABC Robot
语音翻译
语音翻译API
实时语音翻译
AI同传
场景方案
呼叫中心语音解决方案
热门
有声阅读解决方案
热门
语音数字大屏
智能语音指令
智能语音会议
语音字幕服务
客户案例
纵横小说-让听书“声临其境”
罗湖区政府-语音大屏便捷交互
嘀嗒出现-订单播报安全护航
Kido-智能手表有问必答
4399-语音对战畅通无阻
AI中台解决方案
>
相关产品
音频内容安全
智能对话平台UNIT
曦灵 智能数字人平台
通用场景文字识别
>
通用文字识别
热门
办公文档识别
表格文字识别
手写文字识别
文档解析
新品
智能结构化
新品
印章识别
二维码识别
网络图片文字识别
数字识别
交通场景文字识别
>
行驶证识别
热门
驾驶证识别
车牌识别
VIN码识别
快递面单识别
道路运输证识别
车辆合格证识别
机动车登记证书识别
机动车销售发票识别
二手车销售发票识别
卡证文字识别
>
身份证识别
热门
银行卡识别
营业执照识别
营业执照核验
户口本识别
护照识别
社保卡识别
出生医学证明识别
结婚证识别
港澳台证件识别
房产证识别
新品
开户许可证识别
新品
食品生产/经营许可证识别
新品
iOCR自定义模板文字识别
>
智能文档分析平台
>
文档格式转换
合同审查
文档比对
文档抽取
新品
文档图像处理
>
财务票据文字识别
>
智能财务票据识别
增值税发票验真
热门
增值税发票识别
银行单据识别
差旅报销票据识别
通用机打发票识别
定额发票识别
购物小票识别
医疗票据文字识别
>
医疗发票识别
医疗费用明细识别
医疗费用结算单识别
病历单据识别
检查报告单据识别
教育场景文字识别
>
试卷分析与识别
词典笔文字识别
其他场景文字识别
>
仪器仪表盘读数识别
文字识别私有化部署方案
>
热门
文字识别离线SDK
>
场景方案
智能财务报销解决方案
保险智能理赔解决方案
档案数字化管理解决方案
合同智能处理解决方案
热门
货运物流场景应用方案
智慧旅游场景应用方案
电子商务场景应用方案
客户案例
>
泰康保险—医疗理赔智能化
极兔速递—快递下单智能化
慧谷通用—重庆法院智能办案
AI中台解决方案
>
人脸识别云服务
>
人脸关键点
人脸检测与属性分析
人脸对比
人脸搜索
活体检测
合成图检测
新品
人脸离线识别SDK
>
Android版
热门
Windows版
新品
Linux版
海思版
热门
RV1109版
热门
人脸实名认证解决方案
>
热门
度目软硬件产品
>
度目AI相机
热门
度目智能视频分析盒
热门
度目智能分析一体机
度目暗光全彩机芯
新品
度目EdgeBoard开发板卡
度目泛安防应用平台
度目凌云平台
新品
服务器私有化部署方案
人脸私有化部署包
热门
人体私有化部署包
人体与行为分析
>
人体关键点识别
人体检测与属性分析
人流量统计
手部分析与跟踪
驾驶行为分析
人像特效
>
人脸融合
热门
人像分割
人脸属性编辑
度目场景方案
度目智慧连锁方案
热门
度目AI实训室方案
新品
度目园区治理方案
度目智慧校园方案
客户案例
中国科学技术馆
用友软件
中通快递
杭州市民卡
AI中台
AI中台解决方案
生态合作计划
人脸识别专项合作伙伴权益
人脸识别专项合作伙伴标准
图像识别
>
通用物体和场景识别
热门
图像内容理解
新品
植物识别
动物识别
车型识别
车辆检测
菜品识别
地标识别
果蔬识别
品牌logo识别
图像主体检测
翻拍识别
图像搜索
>
相同图片搜索
相似图片搜索
热门
商品图片搜索
绘本图片搜索
面料图片搜索
图像增强
>
图像清晰度增强
图像无损放大
图像修复
图像私有化部署方案
>
图像特效
>
黑白图像上色
图像风格转换
人像动漫化
图片生成
文心AI作画
热门
客户案例
>
甜新科技-理赔凭证查重
薄荷科技-AI助力膳食管理
B612-趣味处理引爆交际圈
开发平台
零门槛图像模型定制
AI中台解决方案
>
百度智能云一念
>
热门
智能创作平台
智能推荐平台
内容分析平台
内容审核平台
AIGC
AI 作画
AI 成片
AI 数据转视频
曦灵 智能数字人平台
>
热门
百度翻译企业版
>
新品
机器翻译
>
文本翻译
热门
领域翻译
文档翻译
图片翻译
语音翻译
实时语音翻译
私有化部署
智能文档分析平台
>
文档格式转换
合同审查
文档对比
语言理解
>
地址识别
热门
文本纠错
情感倾向分析
评论观点抽取
对话情绪识别
词法分析
实体分析
短文本相似度
关键词提取
文本信息提取
语言生成
>
文章标签
文章分类
文章标题生成
新闻摘要
开发平台
零门槛文本模型定制
智能对话平台UNIT
文心ERNIE
客户案例
>
人民日报-“创作大脑”智能化生产
秀合同-合同全生命周期智能管理
极兔速递—快递物流高效便捷
英伟达-垂直领域翻译打破语言壁垒
AI中台解决方案
>
视频内容安全
>
短视频审核
热门
长视频审核
视频流审核
智能创作平台
>
热门
AI中台解决方案
>
视频生成
图文素材转视频
热门
数据转视频
视频封面选取
>
视频对比检索
>
视频内容分析
>
开发平台
EasyDL定制视频理解
百度智能云千帆·大模型超级工厂
千帆大模型平台
热门
百度智能云千帆AppBuilder
新品
千帆AI原生应用商店
智能代码助手
百度GBI
百舸异构计算平台AIHC
飞桨PaddlePaddle
>
教程
文档
模型库
产品全景
企业案例
直播日历
飞桨企业版
PGL 飞桨图学习平台
>
新品
AI Studio
>
项目
数据集
课程
热门
比赛
免费GPU算力
热门
教育合作
BML 全功能AI开发平台
>
热门
EasyDL零门槛AI开发平台
>
EasyData智能数据服务平台
>
EasyEdge端与边缘AI服务平台
>
智能对话平台UNIT
>
内容审核平台
>
热门
智能文档分析平台
>
大模型
>
文心·NLP大模型
文心·CV大模型
文心·跨模态大模型
文心·生物计算大模型
文心·行业大模型
开放API
ERNIE 3.0 文本理解与创作
文心AI作画
PLATO
工具与平台
百度智能云千帆大模型平台
热门
百度智能云千帆AppBuilder
新品
大模型套件-ERNIEKit
零门槛AI开发平台EasyDL
全功能AI开发平台BML
文心一言官网
热门
文心快码(Baidu Comate)
热门
旸谷社区
>
场景应用
百度智能云一念·智能创作平台
>
热门
内容审核平台
>
智能文档分析平台
>
百度翻译企业版
>
新品
企业服务
人脸实名认证
热门
智能招聘
呼叫中心语音解决方案
智能语音会议
智能语音指令
语音数字大屏
新品
AI同传
文心快码Comate
曦灵·智能数字人平台
>
热门
数字人直播平台
新品
智能客服
智能外呼
热门
智能联络中心
智能推荐引擎
>
智能双录
>
大数据营销
百度慧眼
度目智能安防
度目凌云平台
新品
度目智慧连锁方案
热门
度目园区治理方案
度目智慧教育
度目AI实训室方案
新品
度目智慧校园方案
智能制造
产品外观瑕疵质检
智能零售
数字化访销解决方案
热门
智能拓店平台
邀测
智慧医疗
医学文本结构化
AI中台解决方案
>
知识中台解决方案
>
增强现实AR
虚拟形象产品方案
虚拟现实VR
希壤
元宇宙底座
VR党建
VR教育
VR营销
VR实训
度目软硬一体方案
>
度目园区治理方案
热门
度目智慧连锁方案
新品
度目智慧校园方案
度目AI实训室方案
百度智能语音芯片
>
飞桨一体机
>
EasyDL定制AI软硬一体方案
>
机器人平台ABC Robot
>
法律政务
>
【信息筛查】汉中扶贫办
【电子政务】速聚科技
热门
【法院辅助办案】慧谷通用
医疗健康
>
【刷脸就医】杭州市民卡
热门
【辅助诊断】广州凯惠
【电子处方】佐力百草
酒店旅游
>
【便捷购票】乐山大佛
【点评分析】驴妈妈旅游网
【酒店管家】秀豹科技
金融
>
【身份核验】云白条
【智能外呼】江苏银行
【文本处理】犀语科技
房产地产
>
【智慧社区】观海数据
【购房推荐】房天下
【素材分类】家图网
生活服务
>
【图像审核】百姓网
热门
【人脸认证】时代云英
【智能助手】宝宝知道
企业服务
>
【人脸考勤】得力办公
热门
【财务报销】中国移动
【空间管理】偲睿科技
零售电商
>
【资质审核】联合利华
【智能结算】融讯伟业
【货架巡检】e店佳
热门
工业制造业
>
【安全生产】通鼎互联
【货品质检】爱包花饰
【自动化分拣】浙江工业大学
交通运输
>
【刷脸乘车】济南地铁
热门
【地址识别】德邦快递
【驾驶检测】广骏集团
文娱传媒
>
【智能创作】人民日报社
热门
【新闻采编】川报观察
【内容安全】宁波日报
智能农业
>
【农业大数据】华智生物
【智慧农贸】混元科技
【病虫害检测】虫先知
教育培训
>
【作业批改】江苏凤凰报刊
【智能教具】九龙二中
【拍照识字】读书郎
游戏视频
>
【直播审核】欢聚时代
【视频创作】好看视频
【语音审核】天天狼人杀
AI市场
>
硬件产品
热门
解决方案
热门
软件服务
数据服务
全部产品
硬件产品
>
度目AI相机
热门
度目智能视频分析盒
EdgeBoard竞速小车
EdgeBoard实验箱
EdgeBoard机器狗
EdgeBoard商服机器人
解决方案
>
人工智能教学实训平台
热门
智能协作机器人及应用实训平台
热门
机器人教育解决方案
企业智能化转型解决方案
全部解决方案
软件服务
>
表格识别算法模型
热门
通用文档识别算法模型
热门
保险单识别算法模型
人脸识别算法模型
全部软件服务
数据服务
>
AI数据标注基础服务
钢筋数量识别算法
石油仪表盘识别算法
车辆红外标注停车位标注
全部数据服务
开发资源
文档中心
热门
SDK下载
教学视频
QuickStart
API在线调试
新品
AI能力体验中心
>
产品价格
>
热门
教育及教学支持
AI课程专区
高校合作专区
新品
名师共建课程专区
BROAD开放数据集
深度学习工程师认证考试
热门
深度学习师资培训班
热门
企业人才培养
>
首席AI架构师培养计划
热门
飞桨产业实践范例
飞桨产业赋能课专区
百度AI加速器
>
比赛
2023 CCF BDCI 文心一言插件赛
新品
开发者社区
飞桨星河社区
星河社区应用
开发者热门频道
深度学习专项合作计划
飞桨技术伙伴计划
飞桨开发者技术专家计划(PPDE)
热门
飞桨人工智能产业赋能中心
>
热门
百度大脑合作伙伴计划
>
查找合作伙伴
>
合作咨询
售前咨询
填写您的业务需求,专属客户经理会尽快联系您,提供1对1咨询服务
售后智能助手
智能诊断,快速解决使用问题
联系销售
更多咨询,请拨打
400-920-8999 转 1
体验AI
Web端 前往
AI能力体验中心
移动端 打开百度APP“扫一扫”