功能介绍
支持对大陆居民往来台湾通行证的证件号码、姓名、姓名拼音、出生日期、性别、有效期限、签发地点7个关键字段进行结构化识别
应用场景
出境旅游、留学
结合多种卡证识别技术,实现对护照、台湾通行证、台湾通行证等境外常用卡证信息的自动识别和录入,应用于境外旅游产品预定、个人信息登记等场景,有效提升信息录入效率,降低用户输入成本,提升用户使用体验
接口描述
对台湾通行证所有关键字段进行识别。
帮助地址:https://ai.baidu.com/docs#/OCR-API-TPermit/877539b2
请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/taiwan_exitentrypermit
请求参数
image string 图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式
返回示例
{
"log_id": 424957212,
"words_result": {
"Address": {
"words": "北京"
},
"Birthday": {
"words": "19870405"
},
"CardNum": {
"words": "L07379776"
},
"NameChn": {
},
"words": "陈孟"
},
"NameEng": {
"words": "CHENMENG"
},
"Sex": {
"words": "女"
},
"ValidDate": {
"words": "20160116-20260115"
},
},
"words_result_num": 7
}
代码实现(python3):
import urllib
import base64
import json
import time
#client_id 为官网获取的AK, client_secret 为官网获取的SK
client_id = 'XXXXXXXX'
client_secret = 'XXXXXXXXX'
#获取token
def get_token():
host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + client_id + '&client_secret=' + client_secret
request = urllib.request.Request(host)
request.add_header('Content-Type', 'application/json; charset=UTF-8')
response = urllib.request.urlopen(request)
token_content = response.read()
if token_content:
token_info = json.loads(token_content)
token_key = token_info['access_token']
return token_key
#台湾通行证识别
def taiwan_exitentrypermit(filename):
request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/taiwan_exitentrypermit"
# 二进制方式打开图片文件
f = open(filename, 'rb')
img = base64.b64encode(f.read())
params = dict()
params['image'] = img
params = urllib.parse.urlencode(params).encode("utf-8")
access_token = get_token()
begin = time.perf_counter()
request_url = request_url + "?access_token=" + access_token
request = urllib.request.Request(url=request_url, data=params)
request.add_header('Content-Type', 'application/x-www-form-urlencoded')
response = urllib.request.urlopen(request)
content = response.read()
end = time.perf_counter()
print('处理时长:'+'%.2f'%(end-begin)+'秒')
if content:
content=content.decode('utf-8')
data = json.loads(content)
words_result=data['words_result']
for item in words_result:
print (item,':',words_result[item]['words'])
产品测评:
处理时长:2.13秒
ValidDate : 20170322-20270321
Sex : 女
NameChn : 王子文
Birthday : 19980506
NameEng : WANGZIWEN
CardNum : L00058585
Address : 安徽
测试结果及建议
通过评测发现百度台湾通行证识别速度和准确率都很不错。可以大大的加快相关业务的处理速度。
AI会越来越流行
功能非常强大
识别的非常准确