本体知识图谱
本体就是对那些可能相对于某一智能体(agent)或智能体群体而存在的概念和关系的一种描述。
——汤姆·格鲁伯——《迈向知识共享型本体的设计原则》。
本体从schema的角度来定义(自上向下),而知识图谱其实更强调的是数据层(自底向上)来构建。对于领域或垂直行业的知识图谱,一般都需要有本体层。而实体可以定义为本体的某个概念的实例。
——王昊奋老师
本体(ontology)主要应用于:人工智能、语义网、软件工程、 生物医学信息学、图书馆学以及信息架构。
本体从分类上来说,分为:
- 领域本体
domain ontology或者说domain-specific ontology,即领域特异性本体。 所建模的是某个特定领域。如医学领域的氨基酸本体(Amino Acid Ontology)、细胞周期本体(Cell-Cycle Ontology,CCO)、疾病本体(Disease Ontology)等。
- 上层本体
upper ontology或者说foundation ontology,即基础本体。 指一种由那些在各种各样的领域本体之中都普遍适用的共同对象所构成的模型。其中所收录的核心词表,可以用来描述一套领域当中的对象。如openCyc。
- openCyc
是一个致力于将各个领域的本体及常识知识综合地集成在一起,并在此基础上实现知识推理的人工智能项目。其目标是使人工智能的应用能够以类似人类推理的方式工作。Cyc知识库中表示的知识一般形如“每棵树都是植物”、“植物最终都会死亡”。当提出“树是否会死亡”的问题时,推理引擎可以得到正确的结论,并回答该问题。
常见的本体要素有:
- 个体(实例):基础的或者说“底层的”对象。
- 类:集合(sets)、概念、对象类型或者说事物的种类。
- 属性:对象(和类)所可能具有的属性、特征、特性、特点和参数。
- 关系:类与个体之间的彼此关联所可能具有的方式。
- 函数术语:在声明语句当中,可用来代替具体术语的特定关系所构成的复杂结构。
- 约束(限制):采取形式化方式所声明的,关于接受某项断言作为输入而必须成立的情况的描述。。
- 规则:用于描述可以依据特定形式的某项断言所能够得出的逻辑推论的,if-then(前因-后果)式语句形式的声明。
- 公理:采取特定逻辑形式的断言(包括规则在内)所共同构成的就是其本体在相应应用领域当中所描述的整个理论。这种定义有别于产生式语法和形式逻辑当中所说的“公理”。在这些学科当中,公理之中仅仅包括那些被断言为先验知识的声明。就这里的用法而言,“公理”之中还包括依据公理型声明所推导得出的理论。
- 事件(哲学):属性或关系的变化。
其他关于本体的概念,参考Google:https://googleblog.blogspot.com/2012/05/introducing-knowledge-graph-things-not.html
举个例子,我们查看章子怡参演的电影:
代码语言:javascript复制match (p:Person{name:"章子怡"})-[r]-(q) return r,p,q