> 文章列表 > 知识图谱学习笔记——(二)知识图谱的表示

知识图谱学习笔记——(二)知识图谱的表示

知识图谱学习笔记——(二)知识图谱的表示

一、知识学习

声明:知识学习中本文主体按照浙江大学陈华钧教授的《知识图谱》公开课讲义进行介绍,并个别地方加入了自己的注释和思考,希望大家尊重陈华钧教授的知识产权,在使用时加上出处。感谢陈华钧教授。

(一)B站 《浙大知识图谱完整版》——2

学识时间:2023年4月13日08:56:51

2、知识图谱的表示

2.1 什么是知识表示

人类的自然语言, 以及创作的绘画和音乐、 数学语言、 物理模型、 化学公式等都是人类知识的表示形式和传承方式。 具有获取、 表示和处理知识 的能力是人类心智区别于其它物种心智的最本质特征, 也是人脑智能的最本质特征。
什么是知识的表达(Representation)?
◆ 简单而言,知识表示( KR)就是用易于计算机处理的方式来描述人脑的知识的方法。
◆ KR不是数据格式、不等同于数据结构、也不是编程语言,对于人工智能而言,数据与知识的区别在于KR支持推理。

知识图谱学习笔记——(二)知识图谱的表示
知识表达(KR)就是:Computational Model of Reality,现实的计算模型
(1)知识的符号表示
 一阶谓词逻辑 (First-Order Logic)
语义网络 (Semantic Net)
 产生式规则 (Production Rule)
 框架系统 (Framework)
 描述逻辑( Description Logic)
 逻辑程序 (Logic Programming)
知识图谱学习笔记——(二)知识图谱的表示
从符号表示到向量表示
知识图谱学习笔记——(二)知识图谱的表示
(2)知识的向量表示

知识图谱学习笔记——(二)知识图谱的表示
小结:

  • The essence of intelligence is reasoning, a good starting point for understanding reasoning is formal logic.
    智能的精华是怎样实现推理 , 推理的关键是形式化逻辑
  • Learning will only be solved once we know what needs to be learned, The idea that almost everything is learned is absurd.
    “ 学习” 需要我们清楚的知道要学习的是什么, 那些认为任何东西都可以学习出来的想法是愚蠢的。
  • There are no pixels or symbol strings in the head. All we have in our heads is big activity vectors that cause more big activity vectors.
    大脑中并没有像素和符号字符串的存储, 而是一些巨大的活跃向量之间相互发生的作用。

2.2人工智能历史发展长河中的知识表示

知识图谱学习笔记——(二)知识图谱的表示
2.2.1 一阶谓词逻辑
(1)描述逻辑

  • 描述逻辑是一阶谓词逻辑的可判定子集,主要用于描述本体概念和属性 ,对于本体知识库的构建提供了便捷的表达形式,是与知识图谱最密切相关的知识表示方法之一。

  • 核心表达要素:
    ◆ 概念Concepts:解释为一个领域的子集
    例如:学生,已婚者: {x| Student(x) }, {x| Married(x) }
    ◆ 关系Relations:解释为指该领域上的二元关系
    例如:示例:朋友,爱人: {<x,y> | friend(x,y) } , {<x,y> | loves(x,y) }
    ◆ 个体Individuals:一个领域内的实例
    例如:小明,小红: {Ming, Hong}

  • 描述逻辑的知识库O:=<T, A>, T即Tbox, A即Abox
    ◆ TBox包含内涵知识,描述概念的一般性质
     定义: 引入概念以及关系的名称,例如: Mother, Person, has_child
     包含:声明包含关系的公理,例如: Mother ⊑ ∃ has_child.Person
    ◆ ABox包含外延知识 (又称断言知识),描述论域中的特定个体。
     概念断言:表示一个对象是否属于某个概念,例如: Mother(Helen),
     关系断言:表示两个对象是否满足一定的关系,例如: has_child(Helen, Jack)
    (2)Horn Logic

  • Horn Logic是一阶谓词逻辑的子集,主要特点是表达形式简单,复杂度低。著名的Prolog语言就是基于Horn逻辑设计实现的。

  • 核心表达要素:
    ◆ 原子Atoms
    p(t1, t2 …, tn), p 是谓词, ti 是项(变量或者常量),例子: has_child(X, Y)
    ◆ 规则Rules
    由原子构建: H:– B1, B2, …, Bm.
    H称为Head; B1, B2, …, Bm称为Body,例子: has_child(X, Y) :- has_son(X, Y)
    ◆ 事实Facts:
    没有体部且没有变量的规则,例子: has_son(Helen, Jack) :-
    (3)一阶谓词逻辑优缺点比较

  • 优点:
     接近自然语言,容易被接受,且易于表示精确知识
     有严格的形式定义和推理规则,易于精确实现

  • 缺点:
     无法表示不确定性知识,难以表示启发性知识及元知识
     组合爆炸,经常出现事实、规则等的组合爆炸,导致效率低,推理复杂度通常较高
     是以人的逻辑为主导的表示方式,可能并不适合机器,机器可能有自己的逻辑表示。
    2.2.2 产生式系统
    (1)定义

  • 产生式系统是一种更广泛意义的规则系统,专家系统多数是基于产生式系统:
    Feigenbaum研制的化学分子结构专家系统DENDRAL
    Shortliffe研制的的诊断感染性疾病的专家系统MYCIN

  • 产生式系统的核心表达形式:
    IF P THEN Q CF = [0, 1], 其中P是产生式的前提, Q是一组结论或操作, CF(Certainty Factor)为确定性因子,也称置信度。
    (2)优缺点

  • 优点:
     自然性:产生式系统采用人类常用的因果关系知识表示形式,既直观、自然,又便于进行推理。
     模块性:产生式规则形式相同,易于模块化管理。
     有效性:能表示确定性知识、不确定性知识、启发性知识、过程性知识等。
     清晰性:产生式有固定的格式,既便于规则设计,又易于对规则库中的知识进行一致性、完整性检测

  • 缺点:
     效率不高:产生式系统求解问题的过程是一个反复进行“匹配—冲突消解—执行”的过程。而规则库一般都比较大,匹配又十分费时,因此其工作效率不高。
     在求解复杂问题时容易引起组合爆炸。
     不能表达结构性知识:产生式系统对具有结构关系的知识无能为力,它不能把具有结构关系的事物间的区别与联系表示出来
    2.2.3 框架系统
    (1)定义

  • 框架理论的基本思想:认为人们对现实世界中事物的认识都是以一种类似于框架的结构存储在记忆中。当面临一个新事物时,就从记忆中找出一个合适的框架,并根据实际情况对其细节加以修改、补充,从而形成对当前事物的认识。框架系统在很多NLP任务如Dialogue系统中都有广泛的应用。

  • 基本表达要素:
    ◆框架:是一种描述对象 (事物、事件或概念等)属性的数据结构。
    ◆一个框架由若干个“槽” (Slot)结构组成,每个槽又可分为若干个 “侧面”。
     一个槽:用于描述所论对象某一方面的属性;
     一个侧面:用于描述相应属性的一个方面。
     槽和侧面所具有的属性值分别称为槽值和侧面值
    知识图谱学习笔记——(二)知识图谱的表示
    (2)优缺点

  • 优点
     对于知识的描述完整和全面;
     基于框架的知识库质量高;
     框架允许数值计算

  • 缺点
     框架构建成本高,质量要求高;
     框架的表达形式不灵活,很难同其它形式的数据集相互关联使用
    2.2.4语义网络
    1968年J.R.Quillian在其博士论文中最先提出语义网络,把它作为人类联想记忆的一个显式心理学模型,并在他设计的可教式语言理解器TLC (TeachableLanguage Comprehenden)中用作知识表示方法。
    知识图谱学习笔记——(二)知识图谱的表示
    (1)WordNet
    WordNet是最著名的词典知识库,主要用于词义消歧。 WordNet由普林斯顿大学认识科学实验室从1985年开始开发。
    WordNet主要定义了名词、动词、形容词和副词之间的语义关系。例如名词之间的上下位关系(如:“猫科动物”是“猫”的上位词),动词之间的蕴含关系(如:“打鼾”蕴含着“睡眠”)等。
    WordNet3.0已经包含超过15万个词和20万个语义关系。
    知识图谱学习笔记——(二)知识图谱的表示
    (2)优缺点

  • 优点
     结构性:语义网络是一种结构化的知识表示方法,它能把事物的属性以及事物间的各种语义联想显式地表示出来。
     联想性:最初是作为人类联想记忆模型提出来的。
     自然性:直观地把事物的属性及其语义联系表示出来,便于理解,自然语言与语义网络的转换比较容易实现,故语义网络表示法在自然语言理解系统中应用最为广泛

  • 缺点
     非严格性:语义网络没有公认的形式表示体系。一个给定的语义网络所表达的含义完全依赖于处理程序如何对它进行解释。
     通过推理网络而实现的推理不能保证其正确性。支持全称量词和存在量词的语义网络在逻辑上是不充分的,不能保证不存在二义性。
     处理上的复杂性:语义网络表示知识的手段多种多样,灵活性高,但由于表示形式不一致使得处理复杂性高,对知识的检索相对复杂

小结

  • 知识表示与推理在人工智能的发展历史上一直居于核心位置。
  • 传统的知识表示方法主要以符号表示为主,与知识图谱有关的典型方法有:描述逻辑、 Horn Logic、产生式规则、框架系统、语义网络等等。
  • 这些方法各有优缺点,但都有一个共同的缺点是知识的获取过程主要依靠专家和人工,越复杂的知识表示框架知识获取过程越困难。

2.3知识图谱的符号表示方法

2.3.1 基于图的知识表示与建模
知识图谱比纯粹的图更有表现力,但是有没有形式逻辑那样复杂。

知识图谱学习笔记——(二)知识图谱的表示
(1)属性图

  • 属性图是图数据库Neo4J实现的图结构表示模型,在工业界有广泛应用。
  • 属性图的优点是表达方式非常灵活,例如,它允许为边增加属性,非常便于表示多元关系。
  • 属性图的存储充分利用图的结构进行优化,因而在查询计算方面具有较高优势
  • 属性图的缺点是缺乏工业标准规范的支持,由于不关注更深层的语义表达,也不支持符号逻辑推理
    知识图谱学习笔记——(二)知识图谱的表示
  • 在属性图的术语中,属性图是由 顶点( Vertex),边( Edge),标签( Label),关系类型还有属性
    ( Property)组成的有向图
  • 顶点也称为 节点( Node),边也称为 关系( Relationship)。
  • 在属性图中,节点和关系是最重要的实体 。节点上包含属性,属性可以以任何键值形式存在。
    知识图谱学习笔记——(二)知识图谱的表示
  • 关系连接节点,每个关系都有拥有一个方向、一个标签、一个开始节点和结束节点。关系的方向的标签使得属性图具有语义化特征。
  • 和节点一样,关系也可以有属性,即边属性,可以通过在关系上增加属性给图算法提供有关边的元信息,如创建时间等,此外还可以通过边属性为边增加权重和特性等其他额外语义

(2)RDF: Triple-based Assertion model
RDF是国际万维网联盟W3C推动的面向Web的语义数据标准
An RDF triple (S,P,O) encodes a statement—a simple logical expression, or claim about the world。
一个RDF三元组是对状态的编码,包括简单的逻辑表达的编码或者对世界声明的编码。
知识图谱学习笔记——(二)知识图谱的表示

2.4知识图谱的向量表示方法

3、知识图谱的存储与查询

3.1基于关系型数据库的知识图谱存储

3.2基于原生图数据库的知识图谱存储

3.3 原生图数据库实现原理浅析

4、知识图谱的抽取与构建

4.1重新理解知识工程与知识获取

4.2 知识抽取——实体识别与分类

4.3 知识抽取——关系抽取与属性补全

4.4 知识抽取——概念抽取

4.5 知识抽取——事件识别与抽取

4.6知识抽取技术前沿

5、知识图谱推理

5.1什么是推理

5.2 知识图谱推理简介

5.3基于符号逻辑的知识图谱推理

5.3.1 基于Ontology的推理
5.3.2 规则的推理

5.4基于表示学习的知识图谱推理

5.4.1基于嵌入学习的知识图谱推理
5.4.2基于规则学习的知识图谱推理
5.4.3Ontology Embedding—本体概念层推理

6、知识图谱融合

6.1知识图谱融合概述

6.2概念层融合——本体匹配

6.3实例层的融合——实体对齐

6.4知识融合技术前沿

7、知识图谱问答

7.1 智能问答系统概述

7.2基于查询模版的知识图谱问答

7.3基于语义解析的知识图谱问答

7.4基于检索排序的知识图谱问答

7.5基于深度学习的知识图谱问答

8、图算法与图数据分析

8.1图的基本知识

8.2基础图算法

8.3图神经网络与图表示学习

8.4图神经网络与知识图谱

9、知识图谱技术发展

9.1 多模态知识图谱

9.2 知识图谱与语言预训练

9.3 事理知识图谱

9.4 知识图谱与低资源学习

☆★○●◇◆□■△▲→←↑↓〓