资讯 文档
【邀测】iOCR全场景识别,速来体验!
发布日期:2025-05-21 12:24浏览量:88次

近日,iOCR全场景识别能力正式上线邀测。依托百度OCR模型与文心大模型3.5,采用MoE混合专家架构,一个接口实现全场景结构化识别。适用于费用报销、保险理赔、贷款审批等业务场景,大幅提升各类文档处理效率。

核心功能:

  • 预置10+ OCR模型包括卡证、票据、通用等垂类模型,以及通用抽取大模型,可支持自动抽取任意文档的关键字段。
  • 自定义项目空间基于业务需求,自主创建项目空间并配置识别规则。

                  * 一键勾选所需模型:用户可一键勾选预置模型及自定义模型,即可快速开启使用。

                  * 灵活选择兜底策略:若出现已选模型未覆盖的文件类型,可任意选择全文识别、结构化识别、拒识别作为兜底策略,避免业务流中断。

  • 自定义抽取模型上传一张样本图片,配置待识别基础字段、组合字段无需训练即可精准抽取字段值。

特色优势:
 
  • 开箱即用:MoE混合专家方案驱动,预置丰富模型文心大模型3.5,一个接口全识别。
  • 积木式组合:模型灵活配置,意图识别自动分发至对应专家模型,提升资源利用率。
  • 适应复杂场景:海量文本深度学习,准确识别文字并理解上下文,结构化识别无压力。
  • 使用方式灵活:SaaS平台公有云API、私有化部署,满足企业多元需求。

 
如需调用测试,可提交合作咨询工单申请开通测试权限
 
详情参考API技术文档:https://ai.baidu.com/ai-doc/OCR/sm9zmv646
 
 
百度OCR现已推出通用场景文字识别卡证文字识别财务票据文字识别交通场景文字识别教育场景文字识别医疗票据文字识别iOCR自定义模板文字识别其他场景文字识别等80+款产品,满足各种场景的文字识别需求。提供在线APIHTTP SDK离线SDK私有化部署、一体机等多种部署方式,接入便捷、稳定可靠。
 

 

技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术