开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
文字识别

    简介

    Hi,您好,欢迎使用百度文字识别服务。

    本文档主要针对Nodejs开发者,描述百度文字识别接口服务的相关技术内容。如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:

    接口能力

    接口名称 接口能力简要描述
    通用文字识别 识别图片中的文字信息
    通用文字识别(高精度版) 更高精度地识别图片中的文字信息
    通用文字识别(含位置信息版) 识别图片中的文字信息(包含文字区域的坐标信息)
    通用文字识别(高精度含位置版) 更高精度地识别图片中的文字信息(包含文字区域的坐标信息)
    通用文字识别(含生僻字版) 识别图片中的文字信息(包含对常见字和生僻字的识别)
    网络图片文字识别 识别一些网络上背景复杂,特殊字体的文字
    身份证识别 识别身份证正反面的文字信息
    银行卡识别 识别银行卡的卡号并返回发卡行和卡片性质信息
    驾驶证识别 识别机动车驾驶证所有关键字段
    行驶证识别 识别机动车行驶证所有关键字段
    车牌识别 识别中国大陆各类机动车车牌信息
    营业执照识别 对营业执照进行识别
    表格文字识别 自动识别表格线及表格内容,结构化输出表头、表尾及每个单元格的文字内容
    通用票据识别 对各类票据图片(医疗票据,保险保单等)进行文字识别,并返回文字在图片中的位置信息
    增值税发票识别 增值税发票识别 对增值税发票进行文字识别,并结构化返回字段信息,支持增值税专票、普票、电子发票
    出租车票识别 针对全国各大城市出租车票的发票号码、发票代码、车号、日期、时间、金额等进行结构化识别
    VIN码识别 对车辆车架、挡风玻璃上的VIN码进行识别
    火车票识别 支持对大陆火车票的车票号、始发站、目的站、车次、日期、票价、席别、姓名进行结构化识别
    数字识别 识别图片中的数字,适用于手机号提取、快递单号提取、充值号码提取等场景
    二维码识别 对图片中的二维码、条形码进行检测和识别,返回存储的文字信息
    试卷分析与识别 可对作业、试卷的版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果
    机动车销售发票 支持对机动车销售发票的26个关键字段进行结构化识别
    车辆合格证 支持对车辆合格证的23个关键字段进行结构化识别]
    户口本识别 支持对户口本内常住人口登记卡的全部 22 个字段进行结构化识别
    手写文字识别 支持对图片中的手写中文、手写数字进行检测和识别
    飞机行程单识别 支持对飞机行程单的24个字段进行结构化识别,包括电子客票号、印刷序号、姓名、始发站、目的站、航班号、日期、时间、票价、身份证号、承运人等
    通用机打发票 对国家/地方税务局发行的横/竖版通用机打发票进行结构化识别
    护照识别 支持对中国大陆护照个人资料页所有11个字段进行结构化识别

    版本更新记录

    上线日期 版本号 更新内容
    2021.05.27 4.15.5 新增: 二维码、行程单、机动车销售发票、车辆合格证、试卷分析与识别、手写、护照、户口本、通用机打(均为商用接口)
    2021.01.28 4.15.4 新增 增值税发票、出租车票、VIN码、火车票、数字识别
    2020.08.06 4.15.1 新增 文档版面分析与识别,仪器仪表盘读数识别, 网络图片文字识别
    2018.4.9 2.2.0 新增表格识别同步接口
    2018.1.12 2.1.0 新增自定义文字识别接口
    2017.12.21 2.0.0 实现代码重构,接口返回标准promise对象
    2017.8.10 1.2.3 增加通用票据识别接口
    2017.7.28 1.2.2 新增通用文字识别高精度接口,通用文字识别部分支持url调用
    2017.7.14 1.2.1 OCR加入车牌识别接口
    2017.6.30 1.2.0 OCR加入表格识别
    2017.6.15 1.1.0 加入行驶证,驾驶证
    2017.4.13 1.0.0 初版
    上一篇
    C#语言
    下一篇
    快速入门