开放能力
开发平台
行业应用
生态合作
开发与教学
资讯 社区 控制台
技术能力
语音技术
图像技术
文字识别
人脸与人体识别
视频技术
AR与VR
自然语言处理
知识图谱
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
智能农业
信息服务
智能园区
智能硬件
语言处理技术

    词义相似度

    词义相似度接口

    接口描述

    输入两个词,得到两个词的词义相似度结果。

    在线调试

    您可以在API Explorer中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

    请求说明

    请求示例

    HTTP方法: POST

    请求URL: https://aip.baidubce.com/rpc/2.0/nlp/v2/word_emb_sim

    URL参数:

    参数
    access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取

    Header如下:

    参数
    Content-Type application/json

    Body请求示例:

    {
        "word_1":"北京",
        "word_2":"上海"
    }

    请求格式

    POST方式调用

    注意:要求使用JSON格式的结构体来描述一个请求的具体内容。

    body整体文本内容可以支持GBK和UTF-8两种格式的编码。

    1、GBK支持:默认按GBK进行编码,输入内容为GBK编码,输出内容为GBK编码,否则会接口报错编码错误

    2、UTF-8支持:若文本需要使用UTF-8编码,请在url参数中添加charset=UTF-8 (大小写敏感) 例如 https://aip.baidubce.com/rpc/2.0/nlp/v1/lexer?charset=UTF-8&access_token=24.f9ba9c5241b67688bb4adbed8bc91dec.2592000.1485570332.282335-8574074

    请求参数

    参数 是否必选 类型 描述
    word_1 string 词1,最大64字节
    word_2 string 词2,最大64字节

    返回格式

    JSON格式

    默认返回内容为GBK编码

    若用户指定输入为UTF-8编码(通过指定charset参数),则返回内容为UTF-8编码

    返回参数

    参数 类型 描述
    log_id uint64 请求唯一标识码,随机数
    score float 相似度结果,(0,1],分数越高说明相似度越高

    返回示例

    {
        "score": 0.456862,
        "words": {
          "word_1": "北京",
          "word_2": "上海"
        }
    }
    上一篇
    中文词向量表示
    下一篇
    中文DNN语言模型