手写作文识别(多模态)
接口描述
基于多模态大模型实现手写体作文内容的精准识别。支持单页、跨页、分栏作文等多种版式场景;能够有效过滤阴影、涂抹痕迹、额外批注等多种干扰信息;精准识别中文手写作文笔迹,识别后段落自动合并,输出易于处理的结构化文本,无缝对接后续批改流程。
手写作文识别(多模态)API服务为异步接口,需要先调用提交请求接口获取 task_id,然后调用获取结果接口进行结果轮询,建议提交请求后 5~10 秒轮询。提交请求接口QPS为2,获取结果接口QPS为10。
在线调试
您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
申请试用
该接口正在邀测中,请您先提交 合作咨询 或 提交工单,提供公司名称、appid、应用场景等信息,工作人员协助开通权限后方可使用。
提交请求接口
请求说明
请求示例
HTTP 方法:POST
请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting_composition/create_task
URL参数:
参数 | 值 |
---|---|
access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
Header如下:
参数 | 值 |
---|---|
Content-Type | application/json |
Body中放置请求参数,参数详情如下:
请求参数
参数 | 是否必选 | 类型 | 可选值范围 | 说明 |
---|---|---|---|---|
image | 和 url/pdf_file 三选一 | string | - | 图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过10M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式优先级: image > url > pdf_file,当image字段存在时,url字段失效 |
url | 和 url/pdf_file 三选一 | string | - | 图片完整url,url长度不超过1024字节,url对应的图片base64编码后大小不超过10M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式优先级: image > url > pdf_file,当image字段存在时,url字段失效请注意关闭URL防盗链 |
pdf_file | 和 image/url 三选一 | string | - | PDF文件,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过10M,最短边至少15px,最长边最大4096px优先级: image > url > pdf_file,当image字段存在时,url字段失效 |
请求代码示例
提示:使用示例代码前,请记得替换其中的示例Token、文档地址或Base64信息。
curl -i -k 'https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting_composition/create_task?access_token=【调用鉴权接口获取的token】'
-H 'Content-Type: application/json'
--data '{
"url": "https://ai.bdstatic.com/file/088749BAB26D4809B8A0B96FE100E7F0"
}'
# encoding:utf-8
import requests
import base64
'''
作文识别提交请求
'''
request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting_composition/create_task"
# 二进制方式打开图片文件
f = open('[本地文件]', 'rb')
img = base64.b64encode(f.read())
params = json.dumps({
"image": img
})
access_token = '[调用鉴权接口获取的token]'
request_url = request_url + "?access_token=" + access_token
headers = {'content-type': 'application/json'}
response = requests.post(request_url, data=params, headers=headers)
if response:
print (response.json())
package com.baidu.ai.aip;
import com.baidu.ai.aip.utils.Base64Util;
import com.baidu.ai.aip.utils.FileUtil;
import com.baidu.ai.aip.utils.HttpUtil;
import com.google.gson.Gson;
import java.util.HashMap;
import java.util.Map;
/**
* 作文识别提交请求
*/
public class HandwritingCompositionCreateTask {
/**
* 重要提示代码中所需工具类
* FileUtil,Base64Util,HttpUtil,GsonUtils请从
* https://ai.baidu.com/file/658A35ABAB2D404FBF903F64D47C1F72
* https://ai.baidu.com/file/C8D81F3301E24D2892968F09AE1AD6E2
* https://ai.baidu.com/file/544D677F5D4E4F17B4122FBD60DB82B3
* https://ai.baidu.com/file/470B3ACCA3FE43788B5A963BF0B625F3
* 下载
*/
public static String handwritingCompositionCreateTask() {
// 请求url
String url = "https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting_composition/create_task";
try {
// 本地文件路径
String filePath = "[本地文件路径]";
byte[] imgData = FileUtil.readFileByBytes(filePath);
String imgStr = Base64Util.encode(imgData);
// 构造请求体
Map<String, Object> map = new HashMap<>();
map.put("image", imgStr); // 或者使用 url 参数
String param = new Gson().toJson(map);
// 注意这里仅为了简化编码每一次请求都去获取access_token,线上环境access_token有过期时间, 客户端可自行缓存,过期后重新获取。
String accessToken = "[调用鉴权接口获取的token]";
String result = HttpUtil.post(url, accessToken, "application/json", param);
System.out.println(result);
return result;
} catch (Exception e) {
e.printStackTrace();
}
return null;
}
public static void main(String[] args) {
HandwritingCompositionCreateTask.handwritingCompositionCreateTask();
}
}
返回说明
返回参数
字段 | 类型 | 说明 |
---|---|---|
log_id | uint64 | 唯一的log id,用于问题定位 |
error_code | int | 错误码 |
error_msg | string | 错误描述信息 |
result | dict | 返回的结果列表 |
+ task_id | string | 该请求生成的task_id,后续使用该task_id获取识别结果 |
返回示例
成功返回示例:
{
"error_code": 0,
"error_msg": "",
"log_id": "10138598131137362685273505665433",
"result": {
"task_id": "task-3zy9Bg8CHt1M4pPOcX2q5bg28j26801S"
}
}
失败返回示例(详细的错误码说明见API文档-错误码):
{
"log_id": 1965746008642488944,
"error_msg": "并发超限",
"error_code": 15
}
获取结果接口
请求说明
请求示例
HTTP 方法:POST
请求URL: https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting_composition/get_result
URL参数:
参数 | 值 |
---|---|
access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
Header如下:
参数 | 值 |
---|---|
Content-Type | application/json |
Body中放置请求参数,参数详情如下:
请求参数
参数 | 是否必选 | 类型 | 说明 |
---|---|---|---|
task_id | 是 | string | 发送提交请求时返回的task_id |
请求代码示例
提示:使用示例代码前,请记得替换其中的示例Token、task_id。
curl --location 'https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting_composition/get_result?access_token=【调用鉴权接口获取的token】' \
--header 'Content-Type: application/json' \
--data '{
"task_id": "1965376138007096888"
}'
# encoding:utf-8
import requests
import base64
'''
作文识别获取请求
'''
request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting_composition/get_result"
params = json.dumps({
"task_id": "1965376138007096888"
})
access_token = '[调用鉴权接口获取的token]'
request_url = request_url + "?access_token=" + access_token
headers = {'content-type': 'application/json'}
response = requests.post(request_url, data=params, headers=headers)
if response:
print (response.json())
package com.baidu.ai.aip;
import com.baidu.ai.aip.utils.HttpUtil;
import com.google.gson.Gson;
import java.util.HashMap;
import java.util.Map;
/**
* 作文识别获取请求
*/
public class HandwritingCompositionGetResult {
/**
* 重要提示代码中所需工具类
* HttpUtil,GsonUtils请从
* https://ai.baidu.com/file/544D677F5D4E4F17B4122FBD60DB82B3
* https://ai.baidu.com/file/470B3ACCA3FE43788B5A963BF0B625F3
* 下载
*/
public static String handwritingCompositionGetResult() {
// 请求url
String url = "https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting_composition/get_result";
try {
// task_id 来自提交请求的返回结果
Map<String, Object> map = new HashMap<>();
map.put("task_id", "1965376138007096888");
String param = new Gson().toJson(map);
String accessToken = "[调用鉴权接口获取的token]";
String result = HttpUtil.post(url, accessToken, "application/json", param);
System.out.println(result);
return result;
} catch (Exception e) {
e.printStackTrace();
}
return null;
}
public static void main(String[] args) {
HandwritingCompositionGetResult.handwritingCompositionGetResult();
}
}
#include <iostream>
#include <curl/curl.h>
#include <string>
const static std::string get_request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting_composition/get_result";
static std::string get_result_str;
/**
* curl发送http请求调用的回调函数
*/
static size_t get_callback(void *ptr, size_t size, size_t nmemb, void *stream) {
get_result_str = std::string((char *) ptr, size * nmemb);
return size * nmemb;
}
/**
* 作文识别 - 获取任务结果
* @return 调用成功返回0,发生错误返回其他错误码
*/
int handwriting_composition_get_result(std::string &json_result, const std::string &access_token, const std::string &task_id) {
std::string url = get_request_url + "?access_token=" + access_token;
CURL *curl = NULL;
CURLcode result_code;
int is_success;
// 构造JSON请求体
std::string json_body = "{\"task_id\":\"" + task_id + "\"}";
curl = curl_easy_init();
if (curl) {
curl_easy_setopt(curl, CURLOPT_URL, url.c_str());
curl_easy_setopt(curl, CURLOPT_POST, 1L);
// 设置请求头 Content-Type: application/json
struct curl_slist *headers = NULL;
headers = curl_slist_append(headers, "Content-Type: application/json");
curl_easy_setopt(curl, CURLOPT_HTTPHEADER, headers);
curl_easy_setopt(curl, CURLOPT_POSTFIELDS, json_body.c_str());
curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, get_callback);
result_code = curl_easy_perform(curl);
if (result_code != CURLE_OK) {
fprintf(stderr, "curl_easy_perform() failed: %s\n",
curl_easy_strerror(result_code));
is_success = 1;
} else {
json_result = get_result_str;
is_success = 0;
}
curl_slist_free_all(headers);
curl_easy_cleanup(curl);
} else {
fprintf(stderr, "curl_easy_init() failed.\n");
is_success = 1;
}
return is_success;
}
返回说明
返回参数
字段 | 类型 | 说明 |
---|---|---|
log_id | uint64 | 唯一的log id,用于问题定位 |
error_code | int | 错误码 |
error_msg | string | 错误描述信息 |
result | dict | 返回的结果列表 |
+ task_id | string | 任务ID |
+ status | string | 任务状态,pending:排队中;processing:运行中;success:成功;failed:失败 |
+ created_time | string | 任务创建时间 |
+ started_time | string | 任务开始时间 |
+ finished_time | string | 任务结束时间 |
+ duration | string | 任务执行时长 |
+ word | string | 作文识别结果,示例结果:{"作文题目": "美味的火龙果","作文内容": "有的人喜欢吃香甜的梨,有的人喜欢吃酸甜的山楂,而我最喜欢吃的是香甜可口的火龙果。\n火龙果长得非常奇特。火龙果是椭圆形的,好像一个小娃娃,披着紫色的外衣,它身上还长着黄绿相间的小叶子,远看火龙果好似一个红红的大火球。\n火龙果摸起来滑嫩嫩的,还有一点点的冰凉,我轻轻地剥开火龙果,只听一阵阵小小的咔声,就把火龙果剥开了,呈现出水灵灵的果肉上镶嵌这黑芝麻似的种子。\n闻起来有一阵淡淡的清香,那香味仿佛在我的鼻尖上跳舞,我忍不住咬了一口,冰冰凉凉的,咬下火龙果的种子还会发出“咯吱咯吱”的声音呢!\n听我们老师说:“多吃火龙果可以美容养颜和延缓衰老呢!”"} |
返回示例
成功返回示例:
{
"error_code": "0",
"error_msg": "",
"result": {
"task_id": "1965376138007096888",
"status": "Success",
"created_time": 1757417161000,
"started_time": 1757417162000,
"finished_time": 1757497412914,
"duration": 80250914,
"words": "{\"作文题目\": \"观沧海\", \"作文内容\": \"东临碣石,以观沧海。\\n\\n水何澹澹,山岛竦峙。\\n\\n树木丛生,百草丰茂。\\n\\n秋风萧瑟,洪波涌起。\\n\\n日月之行,若出其中。\\n\\n星汉灿烂,若出其里。\\n\\n幸甚至哉,歌以咏志。\"}"
},
"log_id": 1965712739761721295
}
失败返回示例(详细的错误码说明见API文档-错误码):
{
"log_id": 1965712846932687146,
"error_msg": "the input image is not a composition",
"error_code": 256667
}