开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
语言处理技术

    文本纠错

    文本纠错接口

    接口描述

    识别输入文本中有错误的片段,提示错误并给出正确的文本结果。支持短文本、长文本、语音等内容的错误识别,纠错是搜索引擎、语音识别、内容审查等功能更好运行的基础模块之一。

    在线调试

    您可以在API Explorer中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

    请求说明

    请求示例

    HTTP方法: POST

    请求URL: https://aip.baidubce.com/rpc/2.0/nlp/v1/ecnet

    URL参数:

    参数
    access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取
    charset UTF-8

    Header如下:

    参数
    Content-Type application/json

    Body请求示例:

    {
        "text": "百度是一家人工只能公司"
    }

    请求格式

    POST方式调用

    注意:要求使用JSON格式的结构体来描述一个请求的具体内容。

    body整体文本内容支持UTF-8格式的编码。

    UTF-8支持:若文本需要使用UTF-8编码,请在url参数中添加charset=UTF-8 (大小写敏感) 例如 https://aip.baidubce.com/rpc/2.0/nlp/v1/lexer?charset=UTF-8&access_token=24.f9ba9c5241b67688bb4adbed8bc91dec.2592000.1485570332.282335-8574074

    请求参数

    参数 类型 描述 是否必填
    text string 待纠错文本,输入限制511字节 必填

    返回格式

    JSON格式

    若输入为UTF-8编码(通过指定charset参数),则返回内容为UTF-8编码

    返回参数

    参数 说明 描述
    log_id uint64 请求唯一标识码
    +correct_query string 纠错后的文本
    +score double 模型置信度打分。备注:若score返回为数字7,表示输入不合法,比如输入过长或过段。该情况没有纠错结果。
    item object 分析结果
    +vec_fragment list 替换候选片段信息
    ++ori_frag string 原片段
    ++correct_frag double 替换片段
    ++begin_pos int 起始(长度单位)
    ++end_pos list 结尾(长度单位)

    返回示例

    {
        "log_id": 6770395607901559829,
        "item": {
            "vec_fragment": [
                {
                    "ori_frag": "只能",
                    "begin_pos": 21,
                    "correct_frag": "智能",
                    "end_pos": 27
                }
            ],
            "score": 0.875169,
            "correct_query": "百度是一家人工智能公司"
        },
        "text": "百度是一家人工只能公司"
    }
    上一篇
    文章分类
    下一篇
    新闻摘要