百度出租车票识别,支持识别全国各大城市出租车票的6个关键字段,包括发票号码、代码、车号、日期、时间、金额
功能接入:
进入百度AI管理界面:https://console.bce.baidu.com/
进入界面后点击“创建应用”
输入应用信息及需要的AI功能即可。
百度现在提供每天一定量的免费调用额度,足够大家测试使用了。
获取Access Token
调用出租车票识别功能前需要先调用鉴权API,确保安全。
具体说明请查阅:http://ai.baidu.com/docs#/Auth/top
请求URL数据格式
向授权服务地址https://aip.baidubce.com/oauth/2.0/token发送请求(推荐使用POST),并在URL中带上以下参数:
grant_type: 必须参数,固定为client_credentials;
client_id: 必须参数,应用的API Key;
client_secret: 必须参数,应用的Secret Key;
例如:
https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=Va5yQRHlA4Fq5eR3LT0vuXV4&client_secret=0rDSjzQ20XUj5itV6WRtznPQSzr5pVw2&
出租车票识别AP调用
出租车票识别的API说明链接为:https://ai.baidu.com/docs#/OCR-API/top
接口描述
针对全国各大城市出租车票的发票号码、发票代码、车号、日期、时间、金额进行结构化识别
请求说明
请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/taxi_receipt
具体参数:
返回示例
{
"log_id":2034039896,
"words_result_num":6,
"words_result":
{
"Date":"2017-11-26",
"Fare":"¥153.30元",
"InvoiceCode":"111001681009",
"InvoiceNum":"90769610",
"TaxiNum":"BV2062",
"Time":"20:42-21:07",
"FuelOilSurcharge": "¥0.00",
"CallServiceSurcharge": "¥0.00"
}
}
详细代码(C#):
public static class AccessToken
{
// 调用getAccessToken()获取的 access_token建议根据expires_in 时间 设置缓存
// 返回token示例
// 百度云中开通对应服务应用的 API Key 建议开通应用的时候多选服务
private static String clientId = "你获得的ID";
// 百度云中开通对应服务应用的 Secret Key
private static String clientSecret = "你获得的KEY";
public static String getAccessToken() {
String authHost = "https://aip.baidubce.com/oauth/2.0/token";
HttpClient client = new HttpClient();
List> paraList = new List>();
paraList.Add(new KeyValuePair("grant_type", "client_credentials"));
paraList.Add(new KeyValuePair("client_id", clientId));
paraList.Add(new KeyValuePair("client_secret", clientSecret));
HttpResponseMessage response = client.PostAsync(authHost, new FormUrlEncodedContent(paraList)).Result;
String result = response.Content.ReadAsStringAsync().Result;
Console.WriteLine(result);
JObject jobject = (JObject)JsonConvert.DeserializeObject(result);
string token = jobject["access_token"].ToString();
return token;
//return result;
}
public class Program
{
// 出租车票识别
public static string taxiReceipt(String imagefilename)
{
string token = AccessToken.getAccessToken();
Console.WriteLine(token);
string host = "https://aip.baidubce.com/rest/2.0/ocr/v1/taxi_receipt?access_token=" + token;
Encoding encoding = Encoding.Default;
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(host);
request.Method = "post";
request.KeepAlive = true;
// 图片的base64编码
string base64 = getFileBase64(imagefilename);
String str = "image=" + HttpUtility.UrlEncode(base64);
byte[] buffer = encoding.GetBytes(str);
request.ContentLength = buffer.Length;
request.GetRequestStream().Write(buffer, 0, buffer.Length);
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.Default);
string result = reader.ReadToEnd();
Console.WriteLine("分析结果:");
Console.WriteLine(result);
return result;
}
public static String getFileBase64(String fileName) {
FileStream filestream = new FileStream(fileName, FileMode.Open);
byte[] arr = new byte[filestream.Length];
filestream.Read(arr, 0, (int)filestream.Length);
string baser64 = Convert.ToBase64String(arr);
filestream.Close();
return baser64;
}
}
功能测试(图片来自网络):
分析结果:
{"log_id": 2859735968464531535, "words_result_num": 8, "words_result": {"Fare": "¥76.00", "InvoiceNum": "20160607", "InvoiceCode": "发票号码", "FuelOilSurcharge": "¥0.00", "TaxiNum": "YT0053", "Time": "07:15-08:02", "Date": "2016-06-07", "CallServiceSurcharge": "¥0.00"}}
分析结果:
{"log_id": 1999955144710115535, "words_result_num": 8, "words_result": {"Fare": "¥10.70", "InvoiceNum": "41016692", "InvoiceCode": "250001010135", "FuelOilSurcharge": "¥0.00", "TaxiNum": "2013-02-13", "Time": "17:46-17:57", "Date": "2013-02-13", "CallServiceSurcharge": "¥0.00"}}
测试结论及建议
测试后发现效果很好,调用速度很快,结果准确,可以大大的提高人们的工作效率。希望后续能够强化对多张票据及有皱褶纸张情况的识别精度。
资金现在投入很大
因为市场很大
未来会全普及的
ai的发现速度太快了
主要还是资金和观念的问题
但是目前很多AI产品推进的并不是十分顺利,很多在二线城市还是需要加大宣传推广力度
未来AI应用会越来越多
AI识别能减少错误率,增加工作效率
是啊,未来会是AI everywhere
AI现在的确发展很快
百度Al越来越强大,一张小小的发票都做的很完美。
将来所有的发票都是AI识别了
百度AI的应用面越来越广了,赞
相信不断改进,会更加完美的