知识定义”,也称数据描述规范(Schema),是知识图谱数据生产所必需的一套规范。“知识定义”用于描述规范化数据的结构。拥有一套完善的数据描述规范,也是计算机理解知识的必要条件。
“定义知识类目及属性”具体说明:
为什么要做“知识定义”?
“知识定义”,也称数据描述规范(Schema),是知识图谱数据生产所必需的一套规范。“知识定义”用于描述规范化数据的结构。拥有一套完善的数据描述规范,也是计算机理解知识的必要条件。
建立“知识定义”是创建知识图谱的首要步骤。知识图谱的所有构建策略全部依赖于知识定义进行。知识定义的是否准确与全面将直接影响知识图谱的构建效果,为了保证图谱知识的丰富与全面,定义的知识类目及属性(Schema)应尽量全面的覆盖到知识文档中数据的类别和属性。
如何定义知识类目及属性?
定义知识类目及属性有三种方式,分别为:手动新建、导入预置类目、导入自定义类目。这里我们选择手动新建的方式来构建一个有关“城市”的简单Schema。
【源文件示例】
基于以上数据,我们根据需要,定义知识类目:
您需注意:知识定义与图谱构建紧密相关,请不要频繁修改,一旦修改则需要重新进行图谱构建。
【具体操作】
1.新建一个类目,类目名称输入“城市”,父类目默认为“事物”( “事物”类目为一切其他概念的基类,无法更改)。
2.接着为这个类目添加属性:在属性名称中输入“地理位置”、数据类型选择“文本”、单多值选择单值、属性别名输入“位置”、属性描述为非必填项,可按需填写。
接着,分别创建另外两个属性:面积、行政区划。
在添加属性的过程中您需要注意:
a)属性类型除了可以填写文本、日期时间、日期、时间、数字、浮点、整数、单位数值、枚举、URL,还可选择已创建的其他类目来建立边关系,详情请查看建边流程及说明:https://unitweb.cdn.bcebos.com/图谱知识库建边规则及说明.zip
b)属性别名是指当前属性名称的相似表达,填写多个属性别名有利于在图谱构建时更好的抽取数据。
c)单多值是指属性值是单个答案还是多个答案,多个答案即多值。如果选择为多值,则在数据清洗阶段会进行多值拆分操作。
多值拆分:为保证多值拆分效果,多属性值需要用逗号、顿号或分号进行分隔。
d)一个类目所具有的属性,既包括该类目的自有属性,也包括继承自其父类的所有属性。
导入预置类目
在这个方式下,您可以根据需要选择导入系统自动定义的schema。
【具体操作】
根据您需要的行业选择预置类目,导入即可。
【“我的知识”产品说明文档 目录】
功能概述:http://ai.baidu.com/forum/topic/show/943727
图谱知识库:http://ai.baidu.com/forum/topic/show/943733
问答知识库:http://ai.baidu.com/forum/topic/show/943734
常见问题解答:http://ai.baidu.com/forum/topic/show/943731
申请了还没下来,请问这个和新上线的表格问答有什么区别
大家有问题欢迎在帖子中留言~