【定制化词法分析】配置及调用方法详细说明
置顶
频率吧 发布于2017-12-13 17:41 浏览:5763 回复:35
9
收藏

为满足不同领域专有词汇的分析需求,我们已上线可定制化的词法分析功能。

配置及调用步骤为:  1.注册登录百度AI控制台------2.创建应用------3.词表配置------4.调用

详细操作说明如下:

1.注册登录百度AI控制台

进入百度AI官网https://ai.baidu.com/,点击右上方”控制台”, 在展开菜单中选中”自然语言”。
如果此时您尚未登录, 需要使用百度账号进行登录。

2.创建应用

    a.     当您登录成功后, 您会进入”自然语言处理”的”概览”页面。 从页面中部, 您可以点击”创建应用”按钮。

    b.     之后页面跳入”应用列表”中。 在这里请填写”应用名称”, 选择”应用类型”, “接口选择”, 填写”应用描述”。 请尽量按真实情况填写或选取。 便于您日后对应用进行管理。

    c.    创建成功后, 您将看到新申请的应用, 以及对应的AppID, API Key, Secret Key。 这些ID和Key值在您开发应用时还会用到.

3. 词表配置

    a.       点击左侧导航区”自然语言处理”下方的”个性化定制”, 即可进行词表配置。

    b.       点击”立即创建”后, 可以看到词表管理区。 点击上方”新增词表”按钮, 即可开始添加自定义词表。

    c.       词表需要首先填写词表名, 其次是英文简称(需要全部大写), 然后就可以选择词表文件进行导入。 下方有两种词表的示例文件(请注意, 无论使用哪种方式, 文件需以GBK方式编码)。

    词汇导入Demo:

正则表达式导入Demo:

    d.       上传成功后, 即可点击右上角的”立即生效”按钮, 将词表上传加载,通常需要数分钟。当界面上出现”词表已生效”的弹窗, 请点击确认后, 该词表即成功加载。

4.调用

    a.       通过API接口的方式进行调用:API地址为https://aip.baidubce.com/rpc/2.0/nlp/v1/lexer_custom (温馨提示:通用版和定制版的调用地址有区别,请按需选择)

通用版和定制版的接口输入和输出格式一样,具体的调用说明以及接口参数可以参考AI官网的文档说明http://ai.baidu.com/docs#/NLP-API/top

    b.       SDK我们会在12月中旬推出,敬请期待!

【调用量说明】:

默认日调用量限制为10w次/天以及QPS控制在5以内,超量会导致调用错误哦!如果您需要更大量的调用,您也可以给我们提工单(http://ticket.bce.baidu.com/#/ticket/create)申请,备注公司业务和接口对应的需求量会更快通过申请。
实际在调用量的数据查询可以在控制台中进行查看。

附:词法分析产品详细介绍 https://ai.baidu.com/tech/nlp/lexical

收藏
点赞
9
个赞
共35条回复 最后由Minelab_DM回复于2018-09-07 09:03
#36Minelab_DM回复于2018-09-07

请问,有本地版的吗

0
#352010_ssh2回复于2018-06-21

好东西,好用、灵活。给百度点赞

0
#34shpherdjames回复于2018-06-19

请问怎么匹配汉字?

按示例demo,(京|沪|深|渝|冀|豫|云|辽|黑|湘|皖|鲁)[A-Za-z]\d{3}上传词表失败!

0
#33shpherdjames回复于2018-06-14

你好!我自定义了词库,比如说 苹果我定义为手机品牌,但是定制化词法分析返回的却是 ORG?

自定义词库  难道 不能覆盖  百度默认词库?

0
#32shpherdjames回复于2018-06-14

11

0
#31蓝天1234的故事回复于2018-05-21

标注算法是用正则表达式完成的?有没有基于深度学习的迭代算法?

0
#30蓝兰兰111回复于2018-03-14

很详细,试一试

0
#29奇迹斗牛士回复于2018-01-29
#22 古顺续回复
已经按照楼主提示配置词库,但返回的接口数据并没有出现我定义的词库类型,省份、城市、县区我全部导入了自定义的词库,分别命名为PROVIN, CITY, COUNTY,但返回的结果中全部是'ne'这个参数返回的都是LOL,也就是系统词库,正常不是应该返回我自定义的PROVIN, CITY, COUNTY 这种标识么,在线求解。
展开

收到,您方便的话QQ加下我 491837080 我们联系开发帮你看下

 

0
#28古顺续回复于2018-01-26

不好意思,昨天一直提示我发帖失败,我以为没有提交成功,所以重复发帖了

0
#27荒墨丶迷失回复于2018-01-25
#26 古顺续回复
已经按照楼主提示配置词库,但返回的接口数据并没有出现我定义的词库类型,省份、城市、县区我全部导入了自定义的词库,分别命名为PROVIN, CITY, COUNTY,但返回的结果中全部是'ne'这个参数返回的都是LOL,也就是系统词库,正常不是应该返回我自定义的PROVIN, CITY, COUNTY 这种标识么,在线求解。
展开

您好。您这边严重违反了社区回复的制度了  1.连续回复不能超过三条。且不能连续回复跟帖。严重者将禁言处理

0
#26古顺续回复于2018-01-25

已经按照楼主提示配置词库,但返回的接口数据并没有出现我定义的词库类型,省份、城市、县区我全部导入了自定义的词库,分别命名为PROVIN, CITY, COUNTY,但返回的结果中全部是'ne'这个参数返回的都是LOL,也就是系统词库,正常不是应该返回我自定义的PROVIN, CITY, COUNTY 这种标识么,在线求解。

0
#25古顺续回复于2018-01-25

为什么不让跟帖

0
#24古顺续回复于2018-01-25

为什么不让跟帖

0
#23古顺续回复于2018-01-25

已经按照楼主提示配置词库,但返回的接口数据并没有出现我定义的词库类型,省份、城市、县区我全部导入了自定义的词库,分别命名为PROVIN, CITY, COUNTY,但返回的结果中全部是'ne'这个参数返回的都是LOL,也就是系统词库,正常不是应该返回我自定义的PROVIN, CITY, COUNTY 这种标识么,在线求解。

0
#22古顺续回复于2018-01-25

已经按照楼主提示配置词库,但返回的接口数据并没有出现我定义的词库类型,省份、城市、县区我全部导入了自定义的词库,分别命名为PROVIN, CITY, COUNTY,但返回的结果中全部是'ne'这个参数返回的都是LOL,也就是系统词库,正常不是应该返回我自定义的PROVIN, CITY, COUNTY 这种标识么,在线求解。

0
#21古顺续回复于2018-01-25

已经按照楼主提示配置词库,但返回的接口数据并没有出现我定义的词库类型,省份、城市、县区我全部导入了自定义的词库,分别命名为PROVIN, CITY, COUNTY,但返回的结果中全部是'ne'这个参数返回的都是LOL,也就是系统词库,正常不是应该返回我自定义的PROVIN, CITY, COUNTY 这种标识么,在线求解。

0
#20古顺续回复于2018-01-25

已经按照楼主提示配置词库,但返回的接口数据并没有出现我定义的词库类型,省份、城市、县区我全部导入了自定义的词库,分别命名为PROVIN, CITY, COUNTY,但返回的结果中全部是'ne'这个参数返回的都是LOL,也就是系统词库,正常不是应该返回我自定义的PROVIN, CITY, COUNTY 这种标识么,在线求解。

0
#19频率吧回复于2018-01-23
#18 荒墨丶迷失回复
楼主正式回归开始分享了?还有相关的吗。

可以同步关注ai.baidu.com官网,新产品新功能新活动会集中在首页banner图和图下方的上线快报、新闻资讯、精彩活动中。

关于自然语言处理相关的技术,最新上线“文章标签”产品。文章标签服务对文章的标题和内容进行深度分析,输出能够反映文章关键信息的主题、话题、实体等多维度标签以及对应的置信度,在个性化推荐、文章聚合、内容检索等场景具有广泛的应用价值(就是这么官方O(∩_∩)O)

产品链接:http://ai.baidu.com/tech/nlp/doctagger

 

0
#18荒墨丶迷失回复于2018-01-22
#17 频率吧回复
Let's do better!

楼主正式回归开始分享了?还有相关的吗。

1
#17频率吧回复于2018-01-22
#15 a13531732231回复
哇,原来还有这个功能呢?感觉楼主是在开挖隐藏的功能   哈哈哈哈哈!

Let's do better!

0
TOP
切换版块