【人像特效】户口簿识别
才能我浪费99 发布于2020-12 浏览:4342 回复:2
1
收藏
最后编辑于2022-04

1.功能描述:

支持对户口本内常住人口登记卡的全部 22 个字段进行结构化识别,包括户号、姓名、与户主关系、性别、出生地、民族、出生日期、身份证号、本市县其他住址、曾用名、籍贯、宗教信仰、身高、血型、文化程度、婚姻状况、兵役状况、服务处所、职业、何时由何地迁往本市、何时由何地迁往本址、登记日期

2.平台接入

具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:
http://ai.baidu.com/forum/topic/show/943327

3.调用攻略(Python3)及评测

3.1首先认证授权:

在开始调用任何API之前需要先进行认证授权,具体的说明请参考:

http://ai.baidu.com/docs#/Auth/top

具体Python3代码如下:

# -*- coding: utf-8 -*-
#!/usr/bin/env python

import urllib
import base64
import json
#client_id 为官网获取的AK, client_secret 为官网获取的SK
client_id =【百度云应用的AK】
client_secret =【百度云应用的SK】

#获取token
def get_token():
    host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + client_id + '&client_secret=' + client_secret
    request = urllib.request.Request(host)
    request.add_header('Content-Type', 'application/json; charset=UTF-8')
    response = urllib.request.urlopen(request)
    token_content = response.read()
    if token_content:
        token_info = json.loads(token_content)
        token_key = token_info['access_token']
    return token_key

3.2接口调用:

详细说明请参考: https://ai.baidu.com/ai-doc/OCR/ak3h7xzk7

说明的比较清晰,这里就不重复了。

大家需要注意的是:
API访问URL:https://aip.baidubce.com/rest/2.0/ocr/v1/household_register

输入参数image和url二选一
image:图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式

url:图片完整URL,URL长度不超过1024字节,URL对应的图片base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式,当image字段存在时url字段失效。请注意关闭URL防盗链

返回示例
{
"log_id": 1301870459,
"words_result": {
"BirthAddress": {
"words": "河南洛阳市郊区"
},
"Birthday": {
"words": "2016-07-28"
},
"CardNo": {
"words": "410311201607282825"
},
"Name": {
"words": "孙翌晨"
},
"Nation": {
"words": "汉族"
},
"Relationship": {
"words": "户主"
},
"Sex": {
"words": "男"
},
},
"words_result_num": 7
}

Python3调用代码如下:

#调用百度户口本识别接口
def household_register(filename):
    request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/household_register"
    
    # 二进制方式打开图片文件
    f = open(filename, 'rb')
    img = base64.b64encode(f.read())
    
    params = dict()
    params['image'] = img
    params = urllib.parse.urlencode(params).encode("utf-8")
    
    access_token = get_token()
    
    begin = time.perf_counter()
    request_url = request_url + "?access_token=" + access_token
    request = urllib.request.Request(url=request_url, data=params)
    request.add_header('Content-Type', 'application/x-www-form-urlencoded')
    response = urllib.request.urlopen(request)
    content = response.read()
    end = time.perf_counter()

    print('处理时长:'+'%.2f'%(end-begin)+'秒')
    
    if content:
        #print(content)
        content=content.decode('utf-8')
        #print(content)
        data = json.loads(content)
        #print(data)
        words_result=data['words_result']
        print ("识别结果")
        for item in words_result:
            print (item,':',words_result[item]['words'])  

4.功能评测(图片来自网络):

具体效果如下:

处理时长:5.05秒
识别结果
Nation : 汉族
......
Height : 170厘米
WorkAddress : 无
Hometown : 四川省

5.测试结论和建议

测试下来,整体识别效果不错。户口本的很准确,速度也很快,用起来非常的方便。可以用于:
身份信息登记
使用户口本识别技术,对户口本上的姓名、性别、出生地、出生日期、身份证号等信息进行识别,可应用于新生儿建档、户口迁移、个人信贷申请、社会救济金申请等政务办理场景,使政务部门能够快速提取申请人身份信息完成核验和登记,提升办事效率
亲属关系登记
使用户口本识别技术,对户口本上的姓名、与户主关系、身份证号等信息进行识别,可应用于婚姻登记、遗产继承、子女入学登记等需证明亲属关系的民政业务办理场景,使政务部门能够快速提取申请人身份信息及关系完成登记,提升办事效率

收藏
点赞
1
个赞
共2条回复 最后由用户已被禁言回复于2022-04
#3才能我浪费99回复于2020-12
#2 用户已被禁言回复
有的代码没有用代码块。

嗯,修改成代码块了

0
#2用户已被禁言回复于2020-12

有的代码没有用代码块。

1
TOP
切换版块