【邀测】iOCR全场景识别，速来体验！

控制台

【邀测】iOCR全场景识别，速来体验！

发布日期：2025-05-21 12:24浏览量：1762次

近日，iOCR全场景识别能力正式上线邀测。依托百度OCR模型与文心大模型3.5，采用MoE混合专家架构，一个接口实现全场景结构化识别。适用于费用报销、保险理赔、贷款审批等业务场景，大幅提升各类文档处理效率。

核心功能：

预置10+ OCR模型：包括卡证、票据、通用等垂类模型，以及通用抽取大模型，可支持自动抽取任意文档的关键字段。
自定义项目空间：基于业务需求，自主创建项目空间并配置识别规则。

* 一键勾选所需模型：用户可一键勾选预置模型及自定义模型，即可快速开启使用。

* 灵活选择兜底策略：若出现已选模型未覆盖的文件类型，可任意选择全文识别、结构化识别、拒识别作为兜底策略，避免业务流中断。

自定义抽取模型：上传一张样本图片，配置待识别基础字段、组合字段，无需训练即可精准抽取字段值。

特色优势：

开箱即用：MoE混合专家方案驱动，预置丰富模型及文心大模型3.5，一个接口全识别。
积木式组合：模型灵活配置，意图识别自动分发至对应专家模型，提升资源利用率。
适应复杂场景：海量文本深度学习，准确识别文字并理解上下文，结构化识别无压力。
使用方式灵活：SaaS平台、公有云API、私有化部署，满足企业多元需求。

如需调用测试，可提交【合作咨询】或【工单】申请开通测试权限。

详情参考API技术文档：https://ai.baidu.com/ai-doc/OCR/sm9zmv646

百度OCR现已推出：通用场景文字识别、卡证文字识别、财务票据文字识别、交通场景文字识别、教育场景文字识别、医疗票据文字识别、iOCR自定义模板文字识别及其他场景文字识别等80+款产品，满足各种场景的文字识别需求。提供在线API、HTTP SDK、离线SDK、私有化部署、一体机等多种部署方式，接入便捷、稳定可靠。

上一篇：【功能升级】实时语音识别，多方言沟通无界更贴心！

下一篇：【功能升级】呼叫中心语音合成，多场景发音人火热上线

技术能力

查看全部AI能力

合作咨询

填写您的业务需求，专属客户经理会尽快联系您，提供1对1咨询服务

售后智能助手

智能诊断，快速解决使用问题

更多咨询，请拨打400-920-8999 转 1

体验AI

Web端前往AI能力体验中心

移动端打开百度APP“扫一扫”