完成知识类目及属性定义(Schema),并成功上传数据源文件后即可开始图谱构建。
1.知识图谱的生产过程分为5步:
a)知识抽取:从上传的所有文档中抽取出图谱知识数据。
b)属性映射:将文档中抽取出的属性映射到“知识定义”阶段所定义的属性上。
c)数据清洗:针对日期、数值、文本类属性值制定清洗规则,对齐数据表示结构(符合数据类型约束)。
d)消歧归一:系统会根据策略判断两个或多个实体描述是否为同一实体。如是,会将其融合为一个实体。
e)构建完成
当您更新知识类目及属性(Schema)更新、删减原始数据文件或更新策略规则时,需二次启动图谱构建。
当知识类目及属性(Schema)与策略规则皆未更新,仅原始数据文件有新增时,建议选择“增量更新”。
当知识类目及属性(Schema)或策略规则有更新,或原始数据文件有删减,则默认全量启动。
根据数据源文件的数量与配置的策略,知识图谱生产的过程将耗时几分钟至几个小时不等。
2.生产完成后,您可以查看详细的知识抽取结果、属性映射结果、数据清洗结果、消歧归一结果:
知识抽取
知识抽取为上传的所有文档中抽取出图谱知识(即:spo三元组)数据。您能够查看本次图谱生产中所有的数据源文件,列表中会显示文件名称、抽取实体数量,您可以查看到该文件中抽取出的全部实体、属性、属性值,以及该实体的属性值所在的位置信息。
属性映射
属性映射是用来解决知识抽取出的属性名称与“知识定义”阶段的属性名称不一致的问题。通过配置属性映射的策略(将文档中抽取出的属性映射到“知识定义”阶段所定义的属性上)使所有的产出数据完全符合“知识定义”的格式与规范。属性映射结果中会按类目显示每个类目中各属性的映射情况。当状态为“未映射”或“已映射”但您认为映射结果不正确时,您可以重新配置属性映射规则来持续优化属性映射策略。更新属性映射规则后,需重新进行图谱构建,方可生效。
例如下图,想要把抽取出的“景点简介”属性映射到“知识定义”阶段的“简介”属性,如图所示,下拉选择“简介”即可。
数据清洗
数据清洗是针对日期、数值、文本类属性值制定清洗规则,对齐数据表示结构。数据清洗结果中会显示具体哪个类目下的哪个属性的数据类型进行了清洗,并显示出清洗后的数据格式。更新清洗规则后,需重新进行图谱构建,方可生效。
您可以根据需求填写正则表达式来配置清洗规则。
消歧归一
消歧归一是系统会根据策略判断两个或多个实体描述是否为同一实体。如是,会将其融合为一个实体。您能够:
a) 查看系统对相同实体的归一融合情况:对于从文档中抽取出的实体,系统将根据属性、属性值对其进行归一融合。
b) 手动配置归一规则来优化知识数据。
更新归一规则后,需重新进行图谱构建,方可生效。
3.最后您可以查看历史构建记录。
【“我的知识”产品说明文档 目录】
功能概述:http://ai.baidu.com/forum/topic/show/943727
图谱知识库:http://ai.baidu.com/forum/topic/show/943733
问答知识库:http://ai.baidu.com/forum/topic/show/943734
常见问题解答:http://ai.baidu.com/forum/topic/show/943731
已经按照要求完成了只是定义和上传了原始数据文件,但是构建图谱时报错:
知识抽取结果为空,请检查知识定义或原始数据文件后,重新启动图谱构建。
功能概述:http://ai.baidu.com/forum/topic/show/943727
图谱知识库:http://ai.baidu.com/forum/topic/show/943733
问答知识库:http://ai.baidu.com/forum/topic/show/943734
常见问题解答:http://ai.baidu.com/forum/topic/show/943731
1、在【我的知识】里面单个添加的实体需不需要重新构建图谱?
2、在【我的知识】里面单个添加了实体,然后更改了类目及属性,重新构建图谱的时候,单个添加的实体怎么处理?
为什么实体数据更新了,也发布过了,还是之前的数据呢?
正在适用中 哈哈哈 多提供数据给我们呀
大家有问题欢迎在帖子中留言~