资讯 社区 文档 控制台
技术能力
语音技术
文字识别
人脸与人体
图像技术
语言与知识
视频技术
AR与VR
数据智能
场景方案
部署方案
行业应用
智能教育
智能医疗
智能零售
智能工业
企业服务
智能政务
信息服务
智能园区

关键词提取

接口描述

能够从文本中自动抽取若干个反映文本主题、话题、实体等方面的关键词或短语。

在线调试

您可以在API Explorer中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

请求说明

请求示例

HTTP方法: POST

请求URL: https://aip.baidubce.com/rpc/2.0/nlp/v1/txt_keywords_extraction

URL参数:

参数
access_token 通过API Key和Secret Key获取的access_token,参考“Access Token获取

Header如下:

参数
Content-Type application/json

Body请求示例:

{
    "text":[
        "学习书法,就选唐颜真卿《颜勤礼碑》原碑与对临「第1节」"
    ],
    "num":4
}

请求格式

POST方式调用

注意:要求使用JSON格式的结构体来描述一个请求的具体内容。

Body整体文本内容支持UTF-8格式编码。

若文本需要使用UTF-8格式编码,请在url参数中添加charset=UTF-8 (大小写敏感) 。

请求参数

参数 类型 是否必选 描述
text string 原文本内容,最大65535字符(1个汉字=1个字符)
num int 需要提取的关键词数量的最大值,取值为大于等于1的正整数,无num字段时返回全部关键词(提示:num取值较大时,返回的关键词数量可能小于num值)

返回格式

JSON格式

返回编码格式与传入编码格式一致。

返回参数

参数 说明 描述
log_id uint64 请求唯一标识码
results array 关键词提取结果的数组集合
+score float 关键词的置信度,数值范围[0,1]
+word string 提取出的关键词

返回示例

{
    "log_id":123123,
    "results":[
        {
            "score":0.2669559478242008,
            "word":"颜勤礼碑"
        },
        {
            "score":0.25579790927326845,
            "word":"书法"
        },
        {
            "score":0.23924662247807055,
            "word":"原碑"
        },
        {
            "score":0.23799952042446024,
            "word":"唐颜真卿"
        }
    ]
}
上一篇
文本纠错-高级版
下一篇
中文词向量表示