论文地址: http://arxiv.org/pdf/2006.14610v2.pdf
代码: 公众号回复:09051337661
来源: NVIDIA, 巴伊兰大学
论文名称:A causal view of compositional zero-shot recognition
原文作者:Yuval Atzmon
内容提要
人们很容易识别新的视觉类别,这些视觉类别是已知组件的新组合。因为新组合的长尾支配着分布,所以这种组合泛化能力对于在视觉和语言等现实世界中的学习非常重要。不幸的是,学习系统很难与组成概括相结合,因为它们通常建立在与类标签相关的特征上,即使这些特征对类来说不是必需的。这将导致对来自新分布的样本进行一致的错误分类,就像已知组件的新组合一样。
这里我们描述了一种建立在因果观念上的组合概括方法。首先,我们从因果的角度来描述组合的zero-shot学习,并提出将zero-shot推理视为找出哪一种干预导致了图像?其次,我们提出了一个因果启发的嵌入模型,从相关的(混杂的)训练数据中学习视觉对象的基本成分的解缠表示。我们在预测属性-对象对的新组合的两个数据集上评估这种方法:一个控制良好的合成图像数据集和一个由细粒度类型的鞋子组成的真实数据集。我们的结果相比于强基准显示出改进。
主要框架及实验结果
声明:文章来自于网络,仅用于学习分享,版权归原作者所有,侵权请加上文微信联系删除。