开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
语言处理技术

    合同纠错

    合同纠错(邀测)

    接口描述

    合同纠错接口提供合同文本的纠错,具体的,能够对合同文本中的字词错误、标点符号错误、日期格式错误、时间间隔与两时间点之间的长度不匹配、中文数字与阿拉伯数值连用不规范、大小写数值不匹配等多种文本和数值类型错误的检测和纠错服务。 (目前合同纠错接口处于邀测状态,您可提交工单申请开通)

    请求格式

    POST方式调用

    请求说明

    请求示例

    HTTP方法: POST

    请求URL:https://aip.baidubce.com/rpc/2.0/contract/v1/corrector

    URL参数:

    参数
    access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取

    Header如下:

    参数
    Content-Type application/json

    Body请求示例:

    {
        "action": "text_corrcetion", 
        "data": [
            {
                "content": "4、乙方在签订本协议同时,应向甲方提交本次采购成交金额10%(百分之十)的履约保证金,人民币 426,029.60  元(大写:人民币肆拾贰万陆千零贰拾玖元)", 
                "content_len": 199
            },
            {
                "content": "该项目工期为期3个月,自2019年3月15日起至2020年6月15日止。", 
                "content_len": 78
            } 
        ], 
        "user_id": "xx8231", 
        "source": "api", 
        "type": 1
    }

    请求参数

    字段 说明 数据类型 是否为必须字段
    action 请求类型 string 是,建议保持为“text_corrcetion”默认值
    data 待纠错文本 list[dict] 是,列表每项为一个包含两字段的字典
    user_id 用户id string
    source 用户类型 string
    type 请求类型 string

    返回格式

    JSON格式,UTF-8编码

    返回说明

    {
    	"code": -1,
    	"msg": "success",
    	"output": [{
    		"content": "项目工期为期六个半月,预计售房五-六万套。占总房源的30%-40%\n",
    		"content_len": 84,
    		"content_fixed": "项目工期为期六个半月,预计售房五-六万套。占总房源的30%-40%\n",
    		"details": [{
    			"sentence_id": 0,
    			"sentence": "项目工期为期六个半月,",
    			"sentence_fixed": "项目工期为期六个半月,"
    		}, {
    			"sentence_id": 1,
    			"sentence": "预计售房五-六万套。",
    			"sentence_fixed": "预计售房五-六万套。",
    			"fragments": [{
    				"frag_ori": "五-六万",
    				"frag_fixed": "五六万",
    				"offset": 12,
    				"length": 10,
    				"score": 0,
    				"score_delta": 0,
    				"type": 2,
    				"operation": 4,
    				"explain": "数值连用表估计时不加分隔符",
    				"state": -1
    			}]
    		}, {
    			"sentence_id": 2,
    			"sentence": "占总房源的30%-40%\n",
    			"sentence_fixed": "占总房源的30%-40%\n"
    		}]
    	}, {
    		"content": "该项目月40%_80%的资金将用于够买计算机等硬件设备,10~20%用于支付电费,生育不足50%的部分用于支付人工费,系统运营费用等\n",
    		"content_len": 167,
    		"content_fixed": "该项目月40%_80%的资金将用于够买计算机等硬件设备,10~20%用于支付电费,生育不足50%的部分用于支付人工费,系统运营费用等\n",
    		"details": [{
    			"sentence_id": 3,
    			"sentence": "该项目月40%_80%的资金将用于够买计算机等硬件设备,",
    			"sentence_fixed": "该项目月40%_80%的资金将用于够买计算机等硬件设备,"
    		}, {
    			"sentence_id": 4,
    			"sentence": "10~20%用于支付电费,",
    			"sentence_fixed": "10~20%用于支付电费,"
    		}, {
    			"sentence_id": 5,
    			"sentence": "生育不足50%的部分用于支付人工费,",
    			"sentence_fixed": "生育不足50%的部分用于支付人工费,"
    		}, {
    			"sentence_id": 6,
    			"sentence": "系统运营费用等\n",
    			"sentence_fixed": "系统运营费用等\n"
    		}]
    	}, {
    		"content": "合同的借款期限为 3 年,自2019年1 月1日至20 21年1月1日。\n",
    		"content_len": 75,
    		"content_fixed": "合同的借款期限为 3 年,自2019年1 月1日至20 21年1月1日。\n",
    		"details": [{
    			"sentence_id": 7,
    			"sentence": "合同的借款期限为 3 年,自2019年1 月1日至20 21年1月1日。",
    			"sentence_fixed": "合同的借款期限为 3 年,自2019年1 月1日至20 21年1月1日。",
    			"fragments": [{
    				"frag_ori": "3 年,自2019年1 月1日至20 21年1月1日",
    				"frag_fixed": "3 年,自2019年01月01日至2021年12月31日",
    				"offset": 25,
    				"length": 46,
    				"score": 0,
    				"score_delta": 0,
    				"type": 6,
    				"operation": 0,
    				"explain": "时间长度与两个时间点的间距可能不匹配,建议的结束时间为2021年12月31日",
    				"state": -1
    			}, {
    				"frag_ori": "2019年1 月1日",
    				"frag_fixed": "2019年01月01日",
    				"offset": 36,
    				"length": 16,
    				"score": 0,
    				"score_delta": 0,
    				"type": 6,
    				"operation": 0,
    				"explain": "日期格式不合法",
    				"state": -1
    			}, {
    				"frag_ori": "20 21年1月1日",
    				"frag_fixed": "2021年01月01日",
    				"offset": 55,
    				"length": 16,
    				"score": 0,
    				"score_delta": 0,
    				"type": 6,
    				"operation": 0,
    				"explain": "日期格式不合法",
    				"state": -1
    			}]
    		}, {
    			"sentence_id": 8,
    			"sentence": "\n",
    			"sentence_fixed": "\n"
    		}]
    	}
    }

    返回参数

    • 返回字段名说明

      字段 数据类型 是否为必须字段 说明
      code int 响应码
      msg str 响应消息
      output list 纠错结果
      error_num int 错误数
    • output 列表成员结构字段说明

      字段 数据类型 是否为必须字段 说明
      content string 原文本
      content_fixed string 纠错后文本
      content_len int 原文本长度
      details list[dict] 详细信息
    • output.details 列表成员结构字段说明

      字段 数据类型 是否为必须字段 说明
      sentence_id int 句子id
      sentence string 原句子
      sentence_fixed string 纠错后句子
      fragments list[dict] 纠错细节,仅当前句子包含错误时返回中才包含该字段
    • output.details.fragments 列表成员结构字段说明

      字段 数据类型 是否为必须字段 说明
      frag_ori string 错误片段
      frag_fixed string 纠正片段, 检测到错误但不能纠正时为空
      offset int 原始片段的offset(字节码长度)
      length int 纠错片段length(字节码长度)
      type int 错误类型:字词错误,标点错误,专名错误,涉政错误,搭配问题等
      operation int 操作类型:增删改查
      score double 模型输出分数
      score_delta double 模型输出
      explain string 解释
      state int 暂无意义

    上一篇
    智能招聘解决方案