通用文字识别的内容是按什么依据分段的?
firechun 发布于2017-12 浏览:1484 回复:1
0
收藏

第一张图片是原始图片,第二张图片是识别结果,不加黑线图片发不出来,大家明白就好。

可以看到在原始图片中文字的格式是相同的,但识别出的结果,第一行在妇产科门诊这里分段了,第二行在数字结束后就分段了(第二行的“产科”没有识别出来,这里不管它)。第二张图片中的每一行就是返回的json中的每全个words的内容,想知道words中的内容是按什么算法分段的?

另外吐槽下,论坛发贴有BUG,你们对图片进行检查,不让带类似电话号码或医院部门名称的图片,这个我理解,所以对图片加工了下。但每次检查图片不合法后,就无法重新上传图片了,必须刷新发贴的页面,才能上传图片。刷新页面后,原来写的内容都没了,这个贴子我写了4次才发上来……

收藏
点赞
0
个赞
共1条回复 最后由用户已被禁言回复于2022-04
#2用户已被禁言回复于2017-12

您好,感谢您使用百度AI社区,如果有志同道合的小伙伴遇到过相似问题并解决了会给您答复,同时我们也内部再跟进您这个问题,会尽快给您具体答复

0
TOP
切换版块