百度火车票识别,支持对大陆火车票的车票号、始发站、目的站、车次、日期、票价、席别、姓名进行结构化识别
功能接入:
进入百度AI管理界面:https://console.bce.baidu.com/
进入界面后点击“创建应用”, 输入应用信息及需要的AI功能即可。
百度现在提供每天一定量的免费调用额度,足够大家测试使用了。获取Access Token
调用火车票识别功能前需要先调用鉴权API,确保安全。
具体说明请查阅:http://ai.baidu.com/docs#/Auth/top
请求URL数据格式
向授权服务地址https://aip.baidubce.com/oauth/2.0/token发送请求(推荐使用POST),并在URL中带上以下参数:
grant_type: 必须参数,固定为client_credentials;
client_id: 必须参数,应用的API Key;
client_secret: 必须参数,应用的Secret Key;
例如:
https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=Va5yQRHlA4Fq5eR3LT0vuXV4&client_secret=0rDSjzQ20XUj5itV6WRtznPQSzr5pVw2&
火车票识别AP调用
火车票识别的API说明链接为:https://ai.baidu.com/docs#/Body-API/top
接口描述
支持对大陆火车票的车票号、始发站、目的站、车次、日期、票价、席别、姓名进行结构化识别
请求说明
请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/train_ticket
具体参数:
image string 是 图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式
返回示例
{
{
"errno":"0",
"logid":"55481588484",
"date":"2017年12月11日",
"destination_station":"嘉善南站",
"name":"刘虎",
"seat_category":"二等座",
"starting_station":"上海虹桥站",
"ticket_num":"Z13N025800",
"ticket_rates":"¥24.0元",
"train_num":"D3125"
}
}
详细代码(C#):
public static class AccessToken
{
// 调用getAccessToken()获取的 access_token建议根据expires_in 时间 设置缓存
// 返回token示例
// 百度云中开通对应服务应用的 API Key 建议开通应用的时候多选服务
private static String clientId = "你获得的ID";
// 百度云中开通对应服务应用的 Secret Key
private static String clientSecret = "你获得的KEY";
public static String getAccessToken() {
String authHost = "https://aip.baidubce.com/oauth/2.0/token";
HttpClient client = new HttpClient();
List> paraList = new List>();
paraList.Add(new KeyValuePair("grant_type", "client_credentials"));
paraList.Add(new KeyValuePair("client_id", clientId));
paraList.Add(new KeyValuePair("client_secret", clientSecret));
HttpResponseMessage response = client.PostAsync(authHost, new FormUrlEncodedContent(paraList)).Result;
String result = response.Content.ReadAsStringAsync().Result;
Console.WriteLine(result);
JObject jobject = (JObject)JsonConvert.DeserializeObject(result);
string token = jobject["access_token"].ToString();
return token;
//return result;
}
public class Program
{
// 火车票识别
public static string trainTicket(String imagefilename)
{
string token = AccessToken.getAccessToken();
Console.WriteLine(token);
string host = "https://aip.baidubce.com/rest/2.0/ocr/v1/train_ticket?access_token=" + token;
Encoding encoding = Encoding.Default;
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(host);
request.Method = "post";
request.KeepAlive = true;
// 图片的base64编码
string base64 = getFileBase64(imagefilename);
String str = "image=" + HttpUtility.UrlEncode(base64);
byte[] buffer = encoding.GetBytes(str);
request.ContentLength = buffer.Length;
request.GetRequestStream().Write(buffer, 0, buffer.Length);
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.Default);
string result = reader.ReadToEnd();
Console.WriteLine("结果:");
Console.WriteLine(result);
return result;
}
public static String getFileBase64(String fileName) {
FileStream filestream = new FileStream(fileName, FileMode.Open);
byte[] arr = new byte[filestream.Length];
filestream.Read(arr, 0, (int)filestream.Length);
string baser64 = Convert.ToBase64String(arr);
filestream.Close();
return baser64;
}
public static String saveBase64File(string base64Str, string outPath)
{
var contents = Convert.FromBase64String(base64Str);
using (var fs = new FileStream(outPath, FileMode.Create, FileAccess.Write))
{
fs.Write(contents, 0, contents.Length);
fs.Flush();
}
return "finished";
}
}
功能测试(所有测试图片都来自网络):
车票图片:
返回结果:
结果:
{"log_id": 4264893197103796988, "words_result_num": 8, "words_result": {"name": "", "destination_station": "", "seat_category": "新空调硬座快速", "ticket_rates": "¥128.5元", "ticket_num": "郑州", "date": "2015年3月5日00;20开", "train_num": "", "starting_station": "上海"}}
测试结论及建议
测试后发现效果不错,调用速度很快,可以节省大量的人力。
有没有兴趣和小编聊聊呀,可以发送微信号到邮箱 v_guoweicheng@baidu.com
看来排版有这么多说道,我知道了,谢谢
代码可以放到代码框里面
谢谢指导,第一次做没有经验,下一次调整一下
你这个稍微排一下版,效果会更好
百度在问文字识别上确实很强