【通用文字识别】Java示例解析JSON转对象
756665228 发布于2017-11 浏览:27247 回复:93
7
收藏

好多Java开发者们。感觉解析JSON读取识别的结果内容表示不太方便。鄙人就打个样。O(∩_∩)O 大神就不要鄙视了哦

原图文件(被我裁剪了一下)

  • Java通过SDK方式请求通用文字识别接口并解析JSON字符串
import java.util.HashMap;
import java.util.List;

import org.json.JSONObject;

import pay.CMBC.BaiDuOCRBean.Words_result;

import com.alibaba.fastjson.JSON;
import com.baidu.aip.ocr.AipOcr;

/**
 * @author 小帅丶
 * @类名称  TestOcr
 * @remark 
 * @date  2017-11-24
 */
public class TestOcr {
	public static void main(String[] args) throws Exception {
		AipOcr aipOcr = new AipOcr("APPID", "APIKEY", "SECRETKEY");
		String imgData = "G:/big2.jpg";
		HashMap options= new HashMap();
		JSONObject jsonObject = aipOcr.basicGeneral(imgData ,options);
		System.out.println(jsonObject);
		BaiDuOCRBean baiDuOCRBean = com.alibaba.fastjson.JSONObject.toJavaObject(JSON.parseObject(jsonObject.toString()), BaiDuOCRBean.class);
		List list = baiDuOCRBean.getWords_result();
		for (int i = 0; i < list.size(); i++) {
			System.out.println(list.get(i).getWords());
		}
	}
}
  • 返回的内容JSON字符串
{
    "words_result": [
        {
            "words": "企业名称预先核准申请书填写说明"
        }, 
        {
            "words": "注:以下“说明”供填写申请书参照使用,不需向登记机关提供"
        }, 
        {
            "words": "1、本申请书适用于所有内资企业的名称预先核准申请、名称项目调整(投资人除外)"
        }, 
        {
            "words": "名称延期申请等。"
        }, 
        {
            "words": "2、向登记机关提交的申请书只填写与本次申请有关的栏目。"
        }, 
        {
            "words": "3、申请人应根据《企业名称登记管理规定》和《企业名称登记管理实施办法》有关规"
        }, 
        {
            "words": "定申请企业名称预先核准,所提供信息应真实、合法、有效。"
        }, 
        {
            "words": "4、“企业类型”栏应根据以下具体类型选择填写:有限责任公司、股份有限公司、分"
        }, 
        {
            "words": "公司、非公司企业法人、营业单位、企业非法人分支机构、个人独资企业、合伙企业。"
        }, 
        {
            "words": "5、“经营范围”栏只需填写与企业名称行业表述相一致的主要业务项目,应参照《国"
        }, 
        {
            "words": "民经济行业分类》国家标准及有关规定填写。"
        }, 
        {
            "words": "6、申请企业设立名称预先核准、对已核准企业名称项目进行调整或延长有效期限的,"
        }, 
        {
            "words": "申请人为全体投资人。其中,自然人投资的由本人签字,非自然人投资的加盖公章。"
        }, 
        {
            "words": "7、在原核准名称不变的情况下,可以对已核准名称项目进行调整,如住所、注册资本"
        }, 
        {
            "words": "(金)等,变更投资人项目的除外。"
        }, 
        {
            "words": "8、《企业名称预先核准通知书》的延期应当在有效期期满前一个月内申请办理,申请"
        }, 
        {
            "words": "延期时应缴回《全业名称预先核准通知书》原件。投资人有正当理由,可以申请《企业名称"
        }, 
        {
            "words": "预先核准通知书》有效期延期六个月,经延期的《企业名称预先核准通知书》不得再次申请"
        }, 
        {
            "words": "延期"
        }, 
        {
            "words": "9、指定代表或委托代理人、具体经办人应在粘贴的身份证件复印件上用黑色钢笔或签"
        }, 
        {
            "words": "字笔签字确认“与原件一致”。"
        }, 
        {
            "words": "10、“投资人”项及“已核准名称项目调整(投资人除外)”项可加行续写或附页续写"
        }, 
        {
            "words": "11、申请人提交的申请书应当使用A4型纸。依本表打印生成的,使用黑色钢笔或签字笔"
        }, 
        {
            "words": "签署;手工填写的,使用黑色钢笔或签字笔工整填写、签署。"
        }
    ], 
    "words_result_num": 24, 
    "log_id": 5860211020402440000
}
  • 解析JSON后返回的只有words字段的内容
企业名称预先核准申请书填写说明
注:以下“说明”供填写申请书参照使用,不需向登记机关提供
1、本申请书适用于所有内资企业的名称预先核准申请、名称项目调整(投资人除外)
名称延期申请等。
2、向登记机关提交的申请书只填写与本次申请有关的栏目。
3、申请人应根据《企业名称登记管理规定》和《企业名称登记管理实施办法》有关规
定申请企业名称预先核准,所提供信息应真实、合法、有效。
4、“企业类型”栏应根据以下具体类型选择填写:有限责任公司、股份有限公司、分
公司、非公司企业法人、营业单位、企业非法人分支机构、个人独资企业、合伙企业。
5、“经营范围”栏只需填写与企业名称行业表述相一致的主要业务项目,应参照《国
民经济行业分类》国家标准及有关规定填写。
6、申请企业设立名称预先核准、对已核准企业名称项目进行调整或延长有效期限的,
申请人为全体投资人。其中,自然人投资的由本人签字,非自然人投资的加盖公章。
7、在原核准名称不变的情况下,可以对已核准名称项目进行调整,如住所、注册资本
(金)等,变更投资人项目的除外。
8、《企业名称预先核准通知书》的延期应当在有效期期满前一个月内申请办理,申请
延期时应缴回《全业名称预先核准通知书》原件。投资人有正当理由,可以申请《企业名称
预先核准通知书》有效期延期六个月,经延期的《企业名称预先核准通知书》不得再次申请
延期
9、指定代表或委托代理人、具体经办人应在粘贴的身份证件复印件上用黑色钢笔或签
字笔签字确认“与原件一致”。
10、“投资人”项及“已核准名称项目调整(投资人除外)”项可加行续写或附页续写
11、申请人提交的申请书应当使用A4型纸。依本表打印生成的,使用黑色钢笔或签字笔
签署;手工填写的,使用黑色钢笔或签字笔工整填写、签署。
  • Java通过API方式请求通用文字识别接口并解析JSON字符串
import java.io.IOException;
import java.net.URLEncoder;
import java.util.HashMap;
import java.util.List;

import org.json.JSONObject;

import pay.CMBC.BaiDuOCRBean.Words_result;

import com.alibaba.fastjson.JSON;
import com.baidu.aip.ocr.AipOcr;
import com.baidu.aip.util.Base64Util;
import com.juli.paymentmanager.util.HttpUtil;
import com.uitl.FileUtil;

/**
 * @author 小帅丶
 * @类名称  TestOcr
 * @remark 
 * @date  2017-11-24
 */
public class TestOcr {
	public static void main(String[] args) throws Exception {
		String imgData = "G:/big2.jpg";
		String url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic?access_token=自己应用获取的token";
		String base64 = Base64Util.encode(FileUtil.readFileByBytes(imgData));
		String param = "image="+URLEncoder.encode(base64,"UTF-8")+"&language_type=CHN_ENG&detect_direction=true&detect_language=true&probability=true";
		String result = HttpUtil.post(url, param);
		BaiDuOCRBean baiDuOCRBean = com.alibaba.fastjson.JSONObject.toJavaObject(JSON.parseObject(result), BaiDuOCRBean.class);
		List list = baiDuOCRBean.getWords_result();
		for (int i = 0; i < list.size(); i++) {
			System.out.println(list.get(i).getWords());
		}
	}
}
  • API传的参数多。返回的JSON内容更丰富。
{
    "log_id": 8877206896837273000, 
    "direction": 0, 
    "words_result_num": 24, 
    "words_result": [
        {
            "words": "企业名称预先核准申请书填写说明", 
            "probability": {
                "variance": 0.000038, 
                "average": 0.99629, 
                "min": 0.981279
            }
        }, 
        {
            "words": "注:以下“说明”供填写申请书参照使用用,不需向登记机关提供", 
            "probability": {
                "variance": 0, 
                "average": 0.999711, 
                "min": 0.99635
            }
        }, 
        {
            "words": "1、本申请书适用于所有内资企业的名称预先核准申请、名称项目调整(投资人除外)", 
            "probability": {
                "variance": 0.000036, 
                "average": 0.998041, 
                "min": 0.967467
            }
        }, 
        {
            "words": "名称延期申请等。", 
            "probability": {
                "variance": 0, 
                "average": 0.999921, 
                "min": 0.999692
            }
        }, 
        {
            "words": "2、向登记机关提交的申请书只填写与本次申请有关的栏目。", 
            "probability": {
                "variance": 0.000002, 
                "average": 0.99964, 
                "min": 0.993614
            }
        }, 
        {
            "words": "3、申请人应根据《企业名称登记管理规定》和《企业名称登记管理实施办法》有关规", 
            "probability": {
                "variance": 0, 
                "average": 0.99987, 
                "min": 0.998576
            }
        }, 
        {
            "words": "定申请企业名称预先核准,所提供信息应真实、合法、有效。", 
            "probability": {
                "variance": 0, 
                "average": 0.999918, 
                "min": 0.999155
            }
        }, 
        {
            "words": "4、“企业类型”栏应根据以下具体类型选择填写:有限责任公司、股份有限公司、分", 
            "probability": {
                "variance": 0.000002, 
                "average": 0.999533, 
                "min": 0.992644
            }
        }, 
        {
            "words": "公司、非公司企业法人、营业业单位、企业非法人分支机构、个人独资企业、合伙企业。", 
            "probability": {
                "variance": 0.000009, 
                "average": 0.998969, 
                "min": 0.986941
            }
        }, 
        {
            "words": "5、“经营范围”栏只需填写与企业名称行业表述相一致的主要业务项目,应参照照《国", 
            "probability": {
                "variance": 0.000002, 
                "average": 0.99954, 
                "min": 0.990742
            }
        }, 
        {
            "words": "民经济行业分类》国家标准及有关规定填写。", 
            "probability": {
                "variance": 0, 
                "average": 0.999818, 
                "min": 0.998759
            }
        }, 
        {
            "words": "6、申请企业设立名称预先核准、对已核准企业名称项目进行调整或延长有效期限的,", 
            "probability": {
                "variance": 0.00071, 
                "average": 0.993425, 
                "min": 0.840738
            }
        }, 
        {
            "words": "申请人为全体投资人。其中,自然人投资的由本人签字,非自然人投资的加盖公章。", 
            "probability": {
                "variance": 0, 
                "average": 0.999625, 
                "min": 0.99754
            }
        }, 
        {
            "words": "7、在原核准名称不变的情况下,可以对己核准名称项目进行调整,如住所、注册资本", 
            "probability": {
                "variance": 0.005251, 
                "average": 0.98353, 
                "min": 0.575357
            }
        }, 
        {
            "words": "(金)等,变更投资人项目的除外。", 
            "probability": {
                "variance": 0.000002, 
                "average": 0.998811, 
                "min": 0.995471
            }
        }, 
        {
            "words": "8、《企业名称预先核准通知书》的延期应当在有效期期满前一个月内申请办理,申请", 
            "probability": {
                "variance": 0, 
                "average": 0.99981, 
                "min": 0.997269
            }
        }, 
        {
            "words": "延期时应缴回《企业名称预先核准通知书》原件。投资人有正当理由,可以申请《企业名称", 
            "probability": {
                "variance": 0.001316, 
                "average": 0.992622, 
                "min": 0.769052
            }
        }, 
        {
            "words": "预先核准通知书》有效期延期六个月,经延期的《企业名称预先核准通知书》不得再次申请", 
            "probability": {
                "variance": 0.001129, 
                "average": 0.993042, 
                "min": 0.785771
            }
        }, 
        {
            "words": "延期", 
            "probability": {
                "variance": 0, 
                "average": 0.999716, 
                "min": 0.999584
            }
        }, 
        {
            "words": "指定代表或委托代理人、具体经办人应在粘贴的身份证件复印件上用黑色钢笔或签", 
            "probability": {
                "variance": 0.000001, 
                "average": 0.999669, 
                "min": 0.994517
            }
        }, 
        {
            "words": "字笔签字确认“与原件一致”。", 
            "probability": {
                "variance": 0.000002, 
                "average": 0.999261, 
                "min": 0.995568
            }
        }, 
        {
            "words": "10、“投资人”项及“已核准名称项目调整(投资人除外外)”项可加行续写或附页续写", 
            "probability": {
                "variance": 0.000114, 
                "average": 0.997625, 
                "min": 0.931265
            }
        }, 
        {
            "words": "11、申请人提交的申请书应当使用A4型纸。依本表打印生成的,使用用黑色钢笔或签字笔", 
            "probability": {
                "variance": 0.005255, 
                "average": 0.986583, 
                "min": 0.529887
            }
        }, 
        {
            "words": "签署;手工填写的,使用黑色钢笔或签字笔工整填写、签署。", 
            "probability": {
                "variance": 0.000019, 
                "average": 0.998177, 
                "min": 0.980623
            }
        }
    ], 
    "language": 3
}

只读取words内容和上面的是一样的。就不重复显示了

  • 用到的Java对象(具体含义自行查看文档)
import java.util.List;

/**
 * @author 小帅丶
 * @类名称  BaiDuOCRBean
 * @remark 
 * @date  2017-11-27
 */
public class BaiDuOCRBean {
	 	private Long log_id;
	    private int direction;
	    private int words_result_num;
	    private List words_result;
	    private int language;
	    
	    /**
		 * @return the log_id
		 */
		public Long getLog_id() {
			return log_id;
		}

		/**
		 * @param log_id 
		 * log_id
		 */
		public void setLog_id(Long log_id) {
			this.log_id = log_id;
		}

		/**
		 * @return the direction
		 */
		public int getDirection() {
			return direction;
		}

		/**
		 * @param direction 
		 * direction
		 */
		public void setDirection(int direction) {
			this.direction = direction;
		}

		/**
		 * @return the words_result_num
		 */
		public int getWords_result_num() {
			return words_result_num;
		}

		/**
		 * @param words_result_num 
		 * words_result_num
		 */
		public void setWords_result_num(int words_result_num) {
			this.words_result_num = words_result_num;
		}

		/**
		 * @return the words_result
		 */
		public List getWords_result() {
			return words_result;
		}

		/**
		 * @param words_result 
		 * words_result
		 */
		public void setWords_result(List words_result) {
			this.words_result = words_result;
		}

		/**
		 * @return the language
		 */
		public int getLanguage() {
			return language;
		}

		/**
		 * @param language 
		 * language
		 */
		public void setLanguage(int language) {
			this.language = language;
		}

		public static class Words_result{
	    	 private String words;
	    	 private Probability probability;
	    	 
	    	 /**
			 * @return the words
			 */
			public String getWords() {
				return words;
			}

			/**
			 * @param words 
			 * words
			 */
			public void setWords(String words) {
				this.words = words;
			}

			/**
			 * @return the probability
			 */
			public Probability getProbability() {
				return probability;
			}

			/**
			 * @param probability 
			 * probability
			 */
			public void setProbability(Probability probability) {
				this.probability = probability;
			}

			public static class Probability{
    		   private double variance;
    		   private double average;
    		   private double min;
			/**
			 * @return the variance
			 */
			public double getVariance() {
				return variance;
			}
			/**
			 * @param variance 
			 * variance
			 */
			public void setVariance(double variance) {
				this.variance = variance;
			}
			/**
			 * @return the average
			 */
			public double getAverage() {
				return average;
			}
			/**
			 * @param average 
			 * average
			 */
			public void setAverage(double average) {
				this.average = average;
			}
			/**
			 * @return the min
			 */
			public double getMin() {
				return min;
			}
			/**
			 * @param min 
			 * min
			 */
			public void setMin(double min) {
				this.min = min;
			}
	    	}
	    }
}
  • 用到的工具类分别是Base64Util、FileUtil、HttpUtil 下载地址:

         http://aixiaoshuai.mydoc.io/?t=234826

 

 

收藏
点赞
7
个赞
共93条回复 最后由kzyoyo回复于2022-05
#17没了没了没了靠回复于2017-12

你写的这个帖子解析出的文字没有格式,比如标题前面有一段空格,你这个例子解析出来的就没有。我想用“通用文字识别(含位置信息版)”这个接口把文章及它的格式完整地识别出来,,不知道有没有说清楚。

0
#16用户已被禁言回复于2017-12
#15 没了没了没了靠回复
就是这个功能:通用文字识别(含位置信息版) , 返回的数据是类似这样的:{"char": "察", "location": {"width": 18, "top": 31, "height": 19, "left": 303}}, {"char": "值", "location": {"width": 17, "top": 29, "height": 20, "left": 320}},。
展开

什么意思?不太明白?

是要通用文字识别(含位置信息版) 返回JSON对应的Java对象?

1
#15没了没了没了靠回复于2017-12

就是这个功能:通用文字识别(含位置信息版) , 返回的数据是类似这样的:{"char": "察", "location": {"width": 18, "top": 31, "height": 19, "left": 303}}, {"char": "值", "location": {"width": 17, "top": 29, "height": 20, "left": 320}},。

0
#14用户已被禁言回复于2017-12
#13 没了没了没了靠回复
请问有格式的json怎么解析呢,想转成word格式的文件

有格式的JSON?您是说换行?排版的JSON数据?

1
#13没了没了没了靠回复于2017-12

请问有格式的json怎么解析呢,想转成word格式的文件

0
#11笔墨哥回复于2017-12
#10 用户已被禁言回复
那就可以点个赞

她是刷分的,每个回帖都是666,已经警告她咯~

0
#10用户已被禁言回复于2017-12
该评论已删除

那就可以点个赞

2
#8用户已被禁言回复于2017-12
  • 补上SDK传本地图片的byte[]调用示例。
		AipOcr aipOcr = new AipOcr("APPID", "APIKEY", "SECRETKEY");
		byte[] imgData = FileUtil.readFileByBytes("G:/car.png");
		HashMap options = new HashMap();
		JSONObject jsonObject = aipOcr.general(imgData, options);
		System.out.println(jsonObject.toString(2));
		//上面就是SDK获取图片二进制数组进行通用识别的示例代码
		//下面的代码是把返回的 JSON字符串转成了Java对象。方便获取值
		BaiDuOCRBean baiDuOCRBean = com.alibaba.fastjson.JSONObject.toJavaObject(JSON.parseObject(jsonObject.toString()), BaiDuOCRBean.class);
		System.out.println(baiDuOCRBean.getWords_result().get(0).getWords());

多说一句。SDK是有源码的。不知道传什么参数看一下。最好有一定的Java语言基础。

1
#6笔墨哥回复于2017-11

样子打的不错呀

0
#5用户已被禁言回复于2017-11
#4 荒墨丶迷失回复
fastjson 阿里的一直在用,里面封装的解析json挺好的 尤其是像UNIT的多层嵌套的json hhh~
展开

嗯嗯

1
#4荒墨丶迷失回复于2017-11

fastjson 阿里的一直在用,里面封装的解析json挺好的 尤其是像UNIT的多层嵌套的json hhh~

1
#3用户已被禁言回复于2017-11

接口返回的JSON转Java对象。如果是idea。是有这样的插件的。

如果不是idea。那就百度搜索在线的也行哦。

最好封装在一个类里面哦。

还有一点忘记说了。使用的是fastjson

1
#2用户已被禁言回复于2017-11
  • Java版本SDK文件的Maven方式引入(适合项目是Maven的)

    com.baidu.aip
    java-sdk
    3.3.2
  • 不是Maven项目的。需要自行下载。

http://ai.baidu.com/download?sdkId=1

1
TOP
切换版块