第五期【百度大脑新品体验】手写文字识别
风搅火 发布于2019-09-15 浏览:5650 回复:2
0
收藏
最后编辑于2019-10-24

百度手写文字识别,支持对图片中的手写中文、手写数字进行检测和识别,针对不规则的手写字体进行专项优化,识别准确率可达90%以上

功能接入:
点击功能链接:https://console.bce.baidu.com/ai/?fromai=1#/ai/body/overview/index
进入界面后点击“创建应用”

输入应用信息点击确认即可。


百度现在提供每天一定量的免费调用额度,足够大家测试使用了。


获取Access Token
调用手写文字识别功能前需要先调用鉴权API,确保安全。
具体说明请查阅:http://ai.baidu.com/docs#/Auth/top

请求URL数据格式
向授权服务地址https://aip.baidubce.com/oauth/2.0/token发送请求(推荐使用POST),并在URL中带上以下参数:
grant_type: 必须参数,固定为client_credentials;
client_id: 必须参数,应用的API Key;
client_secret: 必须参数,应用的Secret Key;
例如:
https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=Va5yQRHlA4Fq5eR3LT0vuXV4&client_secret=0rDSjzQ20XUj5itV6WRtznPQSzr5pVw2&


手写文字识别AP调用
手写文字识别的API说明链接为:https://ai.baidu.com/docs#/OCR-API/top

接口描述
对手写中文汉字、数字进行识别

请求说明
请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting

具体参数:


返回示例
{
"log_id": 620759800,
"words_result": [
{
"location": {
"left": 56,
"top": 0,
"width": 21,
"height": 210
},
"words": "3"
}
],
"words_result_num": 1
}


详细代码(C#):

    public static class AccessToken
	{
	    // 调用getAccessToken()获取的 access_token建议根据expires_in 时间 设置缓存
	    // 返回token示例
     // 百度云中开通对应服务应用的 API Key 建议开通应用的时候多选服务
		private static String clientId = "你获得的ID";
		// 百度云中开通对应服务应用的 Secret Key
		private static String clientSecret = "你获得的KEY";

		public static String getAccessToken() {
			String authHost = "https://aip.baidubce.com/oauth/2.0/token";
			HttpClient client = new HttpClient();
			List> paraList = new List>();
			paraList.Add(new KeyValuePair("grant_type", "client_credentials"));
			paraList.Add(new KeyValuePair("client_id", clientId));
			paraList.Add(new KeyValuePair("client_secret", clientSecret));

			HttpResponseMessage response = client.PostAsync(authHost, new FormUrlEncodedContent(paraList)).Result;
			String result = response.Content.ReadAsStringAsync().Result;
			Console.WriteLine(result);
            JObject jobject = (JObject)JsonConvert.DeserializeObject(result);
            string token = jobject["access_token"].ToString();
            return token;
			//return result;
		}
		public class Program
    {
        // 手写文字识别
        public static string handwriting(String imagefilename)
        {
            string token = AccessToken.getAccessToken();
            Console.WriteLine(token);
            string host = "https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting?access_token=" + token;
            Encoding encoding = Encoding.Default;
            HttpWebRequest request = (HttpWebRequest)WebRequest.Create(host);
            request.Method = "post";
            request.KeepAlive = true;
            // 图片的base64编码
            string base64 = getFileBase64(imagefilename);
            String str = "image=" + HttpUtility.UrlEncode(base64);
            byte[] buffer = encoding.GetBytes(str);
            request.ContentLength = buffer.Length;
            request.GetRequestStream().Write(buffer, 0, buffer.Length);
            HttpWebResponse response = (HttpWebResponse)request.GetResponse();
            StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.Default);
            string result = reader.ReadToEnd();
            Console.WriteLine("分析结果:");
            Console.WriteLine(result);
            return result;
        }

        public static String getFileBase64(String fileName) {
            FileStream filestream = new FileStream(fileName, FileMode.Open);
            byte[] arr = new byte[filestream.Length];
            filestream.Read(arr, 0, (int)filestream.Length);
            string baser64 = Convert.ToBase64String(arr);
            filestream.Close();
            return baser64;
        }
    }
    

功能测试:


分析结果:
{"log_id": 3449839304266810127, "words_result_num": 2, "words_result": [{"location": {"width": 636, "top": 257, "left": 163, "height": 176}, "words": "总是活在过去"}, {"location": {"width": 945, "top": 459, "left": 139, "height": 207}, "words": "任拿什么拥抱未来"}]}


分析结果:
{"log_id": 1053148568257627407, "words_result_num": 4, "words_result": [{"location": {"width": 403, "top": 94, "left": 125, "height": 71}, "words": "不管前方的路有多苦,"}, {"location": {"width": 365, "top": 190, "left": 128, "height": 61}, "words": "只要走的方向正确,"}, {"location": {"width": 366, "top": 269, "left": 126, "height": 76}, "words": "不管多么崎岖不平"}, {"location": {"width": 421, "top": 367, "left": 122, "height": 72}, "words": "都比站在原地更幸福"}]}


测试结论及建议
测试后发现效果很好,调用速度很快,结果准确,可以大大的提高人们的工作效率。建议未来支持同时识别文字和图表。

收藏
点赞
0
个赞
共2条回复 最后由AI最前线回复于2019-10-24
#3AI最前线回复于2019-10-24

开发者,有没有兴趣成为百度AI的核心开发者,可以把微信号发送到V_guoweicheng@baidu.com  小编和你聊一聊哈 

0
#2风搅火回复于2019-09-16

可以在学校率先推广

0
TOP
切换版块