关键词提取

更新时间：2025-11-17

接口描述

能够从文本中自动抽取若干个反映文本主题、话题、实体等方面的关键词或短语。

在线调试

您可以在示例代码中心中调试该接口，可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。

请求说明

请求示例

HTTP方法: POST

请求URL: https://aip.baidubce.com/rpc/2.0/nlp/v1/txt_keywords_extraction

URL参数：

参数	值
access_token	通过API Key和Secret Key获取的access_token,参考“Access Token获取”

Header如下：

参数	值
Content-Type	application/json

Body请求示例:

{
    "text":[
        "学习书法，就选唐颜真卿《颜勤礼碑》原碑与对临「第1节」"
    ],
    "num":4
}

请求格式

POST方式调用

注意：要求使用JSON格式的结构体来描述一个请求的具体内容。

Body整体文本内容支持UTF-8格式编码。

若文本需要使用UTF-8格式编码，请在url参数中添加charset=UTF-8 （大小写敏感）。

请求参数

参数	类型	是否必选	描述
text	array[]	是	原文本内容，最大65535字符（1个汉字=1个字符），建议在文本中同一词语的出现次数少于500次
num	int	否	需要提取的关键词数量的最大值，取值为大于等于1的正整数，无num字段时返回全部关键词（提示：num取值较大时，返回的关键词数量可能小于num值）

返回格式

JSON格式

返回编码格式与传入编码格式一致。

返回参数

参数	说明	描述
log_id	uint64	请求唯一标识码
results	array	关键词提取结果的数组集合
+score	float	关键词的置信度，数值范围[0,1]
+word	string	提取出的关键词

返回示例

{
    "log_id":123123,
    "results":[
        {
            "score":0.2669559478242008,
            "word":"颜勤礼碑"
        },
        {
            "score":0.25579790927326845,
            "word":"书法"
        },
        {
            "score":0.23924662247807055,
            "word":"原碑"
        },
        {
            "score":0.23799952042446024,
            "word":"唐颜真卿"
        }
    ]
}

文本纠错-高级版

文本信息提取