ESWC 2018 | R-GCN：基于图卷积网络的关系数据建模

题目： Modeling Relational Data with Graph Convolutional Networks

会议： Extended Semantic Web Conference, 2018

论文地址：https://link.springer.com/chapter/10.1007/978-3-319-93417-4_38

本篇文章是GCN的作者Kipf继GCN后的一项工作，GCN存在以下两个比较明显的问题：

只能处理无向图
只能处理同质图，也就是只能处理同种类型的边。

R-GCN作为GCN的后续工作，其最主要的贡献就是将GCN引入到了多关系异质图中，也就是说R-GCN在对节点特征进行更新时可以考虑到不同类型边上节点的特征。

1. 关系图卷积网络

术语定义：网络

G=(mathcal{V},mathcal{E}, mathcal{R})

，其中节点

v_i in mathcal{V}

，边

(v_i,r,v_j) in mathcal{E}

，其中

r in mathcal{R}

表示边的类型。

GCN和R-GCN都是利用图卷积来更新节点状态，二者可以用以下框架统一起来：

这里

h_i^{(l)}

表示节点

v_i

第

层的隐状态，

g_m(.,.)

可以理解为前面文章提到的消息函数，

mathcal{M}_i

指节点

v_i

的传入消息集合，

sigma

为激活函数。

对于GCN来讲，

g_m(.,.)

表示将邻居节点的特征乘上归一化权重系数，此时GCN并没有考虑节点的类型信息，因为所有节点都属于同一类型。

对于R-GCN来讲，一个关键问题是如何在卷积过程中考虑到不同类型节点间的不同之处，也就是多关系间如何进行交互。对于图中不同类型的关系，R-GCN的做法如下：

其中：

mathcal{N}_i^r

：节点

v_i

的关系为

的邻居节点集合。比如对于一个引用网络而言，作者节点和其他节点的关系可能为“作者写论文”、“作者属于某一个组织”等等。

c_i,r

：一个归一化系数，可以设置为一个可学习的参数或者一个常量，例如

|mathcal{N}_i^r|

。

W_r^{(l)}

：线性转换函数，观察下标

我们可以知道，每种类型的关系都有属于自己的线性转换函数，它们负责将对应关系边上的邻居节点的特征进行转换。

观察上式我们可以发现，R-GCN在将不同关系的节点特征进行聚合后，还需要加上自身节点的特征，最后通过一个激活函数就能得到更新后的节点特征。

R-GCN与GCN最大的不同在于R-GCN引入了多个线性转换函数来对多种类型的关系节点进行转换，而GCN中只存在一种类型的关系，也就是说只有一个线性转换函数。

R-GCN中单个节点更新的计算图如下所示：

其中红色节点表示待更新节点，深蓝色节点表示待更新节点的邻居节点，它们根据关系被分为不同的组，同时每组内的节点又根据边的方向分为对内关系节点和对外关系节点。深蓝色节点的状态通过转换函数进行转换后变成绿色的节点，然后再聚合到一起(由于为每个节点增加了self-loop，红色节点本身的特征也被考虑在内)。最后，聚合后的特征通过一个激活函数得到红色节点更新后的状态。