资讯 社区 文档
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术

【企业服务】图像结构化信息提取

目录

  1. 应用简介
  2. 开发指导
    2.1 前期准备
    2.2 应用开发
    2.3 应用调试
    2.4 应用发布

应用简介

【图像结构化信息提取】是一款基于OCR识别+大模型的智能体应用,能提取发票、车票、服装吊牌等字段内容,并以json格式输出(以下案例以识别出租车发票为例),解决票据信息需要手动填写并且还可能填写错误的问题,提高票单据的录入速度以及准确率,移动端、网页端均可便捷使用

背景情况:

  • 票据信息需要手动填写并且还可能填写错误

应用价值:

  • 提高票单据的录入速度以及准确率

基本操作流程:

  • 第一步:在对话框内上传单据的图片
  • 第二步:输入文本“请帮我识别图片中的信息”等需要获取的票据内容,应用就会为您自动提取

快来试试吧 >> 前往体验

开发指导

前期准备

1.环境准备:先注册百度智能云账号并登录千帆AppBuilder
2.资料准备:该应用仅涉及官方组件,无需额外资料

应用开发

在AppBuilder工作台页面,点击「创建应用」按钮进入开发页面。

【基本信息】

  1. 填写应用名称和应用描述,以及配上合适的头像(Tips:可以通过AI自动生成哦)
  2. 在「角色指令」版块,填写要求与规范,示例如下:
#角色设定
作为一个出租车发票信息提取员,你的任务是从阅读、理解、分析图片,从中提取关键信息,并将其按照要求调整为标准的输出形式,最终以json格式进行输出。

#组件能力
你可以应用OCR识别能力,提取图片信息。

#要求与限制
1.你需要分析图片内容,从中提取出「发票抬头、发票代码、发票号码、出租车单位、电话、车牌号、日期、时间、单价、里程、实收金额」的信息
2.你需要参照输出示例将其按照json格式进行输出
3.根据发票抬头所属省份完善车牌号,输出车牌号需完整,如:京PA8888
4.出租车单位如没有,则输出为空即可。

#输出示例
json
{
  '发票抬头': '北京市出租汽车专用发票',
  '发票代码': '111000000000',
  '出租车单位': '1015',
  '车牌号': '京BM6666',
  '日期': '2024-07-16',
  '时间': '23:04-23:26',
  '单价': '2.76',
  '里程': '8.6',
  '实收金额': '34.00'
}

【能力扩展】

  1. 在「组件」版块,添加需要的组件。
  1. 添加「开场白」,让其他用户了解应用使用方式。
您好,请上传一张出租车发票的图片,我将为您提取其中的文本信息,例如发票抬头、发票代码、发票号码、日期、里程、实收金额等信息,并以JSON格式输出

应用调试

经过前边的流程,基本已经完成了应用的搭建,现在一起来验证一下应用是否可用吧。
【票据样例】
image.png

【问题样例】

  • 请帮我识别上传的车票信息
  • 车票金额事多少
  • 发票代码是多少

应用发布

调试好应用之后,就可以发布啦。

image.png

如需获取更多应用开发资源,请联系我们

上一篇
【企业服务】电力知识库助手
下一篇
【企业服务】港口司机服务助手