通用文字识别的内容是按什么依据分段的？

首页版块访问AI主站注册发帖

通用文字识别的内容是按什么依据分段的？

firechun 发布于2017-12 浏览:1484 回复:1

快速回复

第一张图片是原始图片，第二张图片是识别结果，不加黑线图片发不出来，大家明白就好。

可以看到在原始图片中文字的格式是相同的，但识别出的结果，第一行在妇产科门诊这里分段了，第二行在数字结束后就分段了（第二行的“产科”没有识别出来，这里不管它）。第二张图片中的每一行就是返回的json中的每全个words的内容，想知道words中的内容是按什么算法分段的？

另外吐槽下，论坛发贴有BUG，你们对图片进行检查，不让带类似电话号码或医院部门名称的图片，这个我理解，所以对图片加工了下。但每次检查图片不合法后，就无法重新上传图片了，必须刷新发贴的页面，才能上传图片。刷新页面后，原来写的内容都没了，这个贴子我写了4次才发上来……

通用文字识别

个赞

共1条回复最后由用户已被禁言回复于2022-04

#2用户已被禁言回复于2017-12

您好，感谢您使用百度AI社区，如果有志同道合的小伙伴遇到过相似问题并解决了会给您答复，同时我们也内部再跟进您这个问题，会尽快给您具体答复

快速回复

小编推荐

火车票识别和出租车票识别正式商用

用户已被禁言 10回复

【案例】美匣科技：OCR技术为签证办理增质提效

用户已被禁言 6回复

如何快速开通邀测接口权限

用户已被禁言 21回复

【百度大脑新品体验】车牌识别

wangwei8638 25回复

TOP

操作指南

常见问答

平台公告

经验交流

技术专区

文字识别

人脸识别

语音技术

PaddlePaddle

EasyDL

BML

EasyData

AI Studio

UNIT

人体分析

图像搜索

图像识别

内容审核

自然语言处理

机器人视觉

视频技术

增强现实

知识图谱

智能创作

智能呼叫中心

文心

EdgeBoard

DuerOS

EasyEdge

度目硬件

百度AI市场

Doris

AI赛事

百度之星大赛

AI Studio人工智能竞赛

语言与智能技术竞赛

千言数据集

集思广益

共享工具

头脑风暴

成果展示

智能客服