SFFAI分享 | 常建龙:基于关系的深度学习【附PPT与视频资料】

2020-05-14 10:47:20 浏览数 (1)

作者简介


常建龙,师从潘春洪和向世明研究员,中国科学院自动化研究所在读博士生,主要研究方向为基于关系的深度学习,包括自动机器学习、网络压缩、深度图网络、深度无监督学习等等。目前已在IEEE T-PAMI(2篇), NeurIPS和ICCV (Oral) 等机器学习与计算机视觉顶级期刊和会议发表学术论文。

0. 引言


作为当下最受欢迎的机器学习方法之一,深度神经网络在很多领域取得了非凡的成绩。但是目前的深度神经网络模型依旧存在很多局限性,例如无法自动地设计网络结构、无法有效地学习无标签数据的特征、很难处理嵌入在非欧几里得空间的数据和无标签的数据等等。为此,我们通过建模深度神经网络中变量之间的关系来解决以上问题并提升深度神经网络的性能,例如通过考虑神经网络中层与层之间的关系来自动学习网络结构、通过考虑参数与参数之间的关系来压缩模型、通过考虑特征与特征之间的关系来处理非欧式空间中的数据、通过考虑样本于样本之间的关系来聚类无标签数据等等。

图1:机器学习与深度学习中关系建模的不同体现,即网页检索中不同网页之间的关系、推荐系统中用户和商品之间的关系、神经网络中不同节点之间的关系。

1. 深度无监督学习 – 不同样本之间的关系


为了用深度学习模型更好地处理大量的无标签数据,我们通过研究两两样本之间的关系来处理聚类问题。通过逐渐确定同类和不同类的样本来训练网络,提出的DAC模型可以直接学习数据的高层语义特征进行聚类分析。从基本定义来看,聚类的目的是将相似的数据聚为同类,将不相似的数据聚为不同类。根据以上定义,我们通过讨论成对样本之间的相关性来将每个样本映射为one-hot的向量以实现聚类的目的。在实际中,该模型不仅可以处理多种数据的聚类任务,例如:图像,文本,音频等等,还有着很好的理论基础来保证模型的有效性。算法流程图如下图所示。

2. 非欧空间数据处理 – 不同特征之间的关系


由于局部输入的无序性和维度的可变性,传统卷积网络很难处理这种处于非欧几里得空间的数据。为了解决这个问题,时空大数据处理团队(STDAL)的常建龙博士、向世明研究员、潘春洪研究员等人提出了结构感知卷积神经网络来处理一般结构的数据,而不是仅局限于处理欧氏空间的数据。根据“数据=特征 结构”的基本假设,我们对传统卷积做了两个泛化来达到以上目的。第一,将离散的有限维卷积核泛化为连续的无穷维卷积核,即单变量函数;第二,将结构信息建模到卷积中。算法流程图如下图所示。大量的实验证明,结构感知卷积网络可以高效地在GPU上处理各种基于不同结构数据的任务,例如,图像分类和聚类、交通流量预测、分子活性预测等等。

3. 网络结构学习 – 不同层之间的关系


在网络结构学习中,我们将不同层之间的关系看作是一个选择不同层之间操作的多分类问题。由于类别数目无法确定,我们提出了集成的Gumbel-Softmax来搜索高性能的网络结构。由于Gumbel-Softmax可以有效并高效地用一种可微的方式来优化离散空间结构。我们集成的Gumbel-Softmax方法也可以保证搜索过程的可微性,并且可以最大化地保证网络结构在训练和测试过程中的一致性,使得模型的性能和效率可以同时得到可观的提升。算法流程图如下图所示。

0 人点赞