文本纠错

更新时间：2025-11-17

接口描述

识别输入文本中有错误的片段，提示错误并给出正确的文本结果。支持短文本、长文本、语音等内容的错误识别，纠错是搜索引擎、语音识别、内容审查等功能更好运行的基础模块之一。

文本纠错-高级版新增语法、专名、地址纠错能力，详见文档。

在线调试

您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

请求说明

请求示例

HTTP方法: POST

请求URL: https://aip.baidubce.com/rpc/2.0/nlp/v1/ecnet

URL参数：

参数	值
access_token	通过API Key和Secret Key获取的access_token,参考“Access Token获取”
charset	UTF-8

Header如下：

参数	值
Content-Type	application/json

Body请求示例:

{
    "text": "百度是一家人工只能公司"
}

请求格式

POST方式调用

注意：要求使用JSON格式的结构体来描述一个请求的具体内容。

body整体文本内容支持UTF-8格式的编码。

UTF-8支持：若文本需要使用UTF-8编码，请在url参数中添加charset=UTF-8 （大小写敏感） 例如 https://aip.baidubce.com/rpc/2.0/nlp/v1/lexer?charset=UTF-8&access_token=24.f9ba9c5241b67688bb4adbed8bc91dec.2592000.1485570332.282335-8574074

请求参数

参数	类型	描述	是否必填
text	string	待纠错文本，输入限制550个汉字	必填

返回格式

JSON格式

若输入为UTF-8编码（通过指定charset参数），则返回内容为UTF-8编码

返回参数

参数	说明	描述
log_id	uint64	请求唯一标识码
+correct_query	string	纠错后的文本
+score	double	模型置信度打分。备注：若score返回为数字7，表示输入不合法，比如输入过长或过短。该情况没有纠错结果。
item	object	分析结果
+vec_fragment	list	替换候选片段信息
++ori_frag	string	原片段
++correct_frag	string	替换片段
++begin_pos	int	片段起始
++end_pos	int	片段结尾

返回示例

{
    "item": {
        "vec_fragment": [
            {
                "end_pos": 11,
                "begin_pos": 5,
                "correct_frag": "人工智能公司",
                "ori_frag": "人工只能公司"
            }
        ],
        "score": 0.0,
        "correct_query": "百度是一家人工智能公司"
    },
    "text": "百度是一家人工只能公司",
    "log_id": 1607927786443355511
}

短文本相似度

文本纠错-高级版