开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
语言处理技术

    中文DNN语言模型

    中文DNN语言模型接口

    接口描述

    中文DNN语言模型接口用于输出切词结果并给出每个词在句子中的概率值,判断一句话是否符合语言表达习惯。

    在线调试

    您可以在API Explorer中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

    请求说明

    请求示例

    HTTP方法:POST

    请求URL: https://aip.baidubce.com/rpc/2.0/nlp/v2/dnnlm_cn

    URL参数:

    参数
    access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取

    Header如下:

    参数
    Content-Type application/json

    Body请求示例:

    {
        "text":"床前明月光"
    }

    请求格式

    POST方式调用

    注意:要求使用JSON格式的结构体来描述一个请求的具体内容。

    body整体文本内容可以支持GBK和UTF-8两种格式的编码。

    1、GBK支持:默认按GBK进行编码,输入内容为GBK编码,输出内容为GBK编码,否则会接口报错编码错误

    2、UTF-8支持:若文本需要使用UTF-8编码,请在url参数中添加charset=UTF-8 (大小写敏感) 例如 https://aip.baidubce.com/rpc/2.0/nlp/v1/lexer?charset=UTF-8&access_token=24.f9ba9c5241b67688bb4adbed8bc91dec.2592000.1485570332.282335-8574074

    请求参数

    参数 类型 描述
    text string 文本内容,最大512字节,不需要切词

    返回格式

    JSON格式

    默认返回内容为GBK编码

    若用户指定输入为UTF-8编码(通过指定charset参数),则返回内容为UTF-8编码

    返回参数

    参数 类型 说明
    log_id uint64 请求唯一标识码
    word string 句子的切词结果
    prob float 该词在句子中的概率值,取值范围[0,1]
    ppl float 描述句子通顺的值:数值越低,句子越通顺

    返回示例

    {
      "text": "床前明月光",
      "items": [
        {
          "word": "床",
          "prob": 0.0000385273
        },
        {
          "word": "前",
          "prob": 0.0289018
        },
        {
          "word": "明月",
          "prob": 0.0284406
        },
        {
          "word": "光",
          "prob": 0.808029
        }
      ],
      "ppl": 79.0651
    }
    上一篇
    词义相似度
    下一篇
    依存句法分析