有几篇关联的论文,如果论文开源代码了,笔者比较喜欢读 code练习,所以看这类文献比较慢,先Mark再精读了…
文章目录
- 1 Auto IV: Counterfactual Prediction via Automatic Instrumental Variable Decomposition
- 2 ICML & UBC|Deep IV: A Flexible Approach for Counterfactual Prediction
- 3 Double Robust Representation Learning for Counterfactual Prediction
- 4 Counterfactual Predictions under Runtime Confounding
- 5 Robust Multi-agent Counterfactual Prediction
- 6 State-Building through Public Land Disposal? An Application of Matrix Completion for Counterfactual Prediction
- 7 2017:Model-Robust Counterfactual Prediction Method
- 8 Predicting Counterfactuals from Large Historical Data and Small Randomized Trials
1 Auto IV: Counterfactual Prediction via Automatic Instrumental Variable Decomposition
参考来自:《因果学习周刊》第9期:因果学习中的工具变量
简介:工具变量(Instrumental Variables, IV)是治疗随机化的来源,有条件地独立于结果,在未观察到的混杂因素的因果推理中具有重要作用。然而,现有的基于工具变量的反事实预测方法需要预先定义好的工具变量,而在许多现实场景中,找到有效的IV是一门艺术,而不是科学。此外,人为预先定义的IV可能会因为违反有效IV的条件从而引入错误。这些棘手的事实阻碍了基于IV的反事实预测方法的应用。在本文中,我们提出了一种新的自动工具变量分解(AutoIV)算法,从观测变量(IV候选变量)中自动生成IV的表示。具体来说,我们通过互信息最大化和最小化约束,让学到的IV表示分别满足与治疗和结果的相关性条件。我们也通过鼓励他们与治疗和结果相关来学习混杂表征。在对抗性博弈中,IV表征和混杂表征通过它们的约束条件争夺信息,这使得我们能够得到基于IV的反事实预测的有效的IV表征。大量的实验表明,我们的方法能够产生有效的IV表征来进行准确的基于IV的反事实预测。
论文地址:http://arxiv.org/abs/2107.05884 刚刚开源的github: junkunyuan/AutoIV
推荐理由:本文是况琨老师组的最新工作,提出了在表征学习中同时学习IV与混淆变量的框架,其问题建模十分新颖,有很大的参考价值。
2 ICML & UBC|Deep IV: A Flexible Approach for Counterfactual Prediction
参考来自:《因果学习周刊》第9期:因果学习中的工具变量
简介:反事实预测需要理解所谓的治疗和结果变量之间的因果关系。本文提供了一种深度学习方法的方法,以在存在工具变量(IV)的情况下准确地描述这种关系——有条件地独立于结果的治疗随机化来源。我们的IV规范分解为两个可以用深度神经网络解决的预测任务: 第一级网络用于治疗预测,第二阶段网络的损失函数涉及对条件治疗分布的集成。Deep IV框架允许我们利用现成的有监督学习技术,通过调整损失函数来估计因果效应。实验表明,该方法的性能优于现有的机器学习方法。
论文地址:http://arxiv.org/abs/1612.09596
推荐理由:本文在深度学习的框架下提出了学习并使用IV变量的方法,具有很强的启发意义,值得参考。
3 Double Robust Representation Learning for Counterfactual Prediction
论文地址: https://arxiv.org/abs/2010.07866
github:https://github.com/zengshx777/Double-Rouble-Representation-Learning
笔者粗略看了一下,这代码点子扎手… 之后有空再啃了…
因果推理,或反事实预测,是医疗保健、政策和社会科学决策的核心。
为了在观察性研究中使用高维数据去偏倚因果估计,最近的进展表明将机器学习模型结合在倾向评分和结果函数上的重要性。我们提出了一种新的可扩展的方法来学习反事实预测的 Double-Robust Representations(DRR)
,如果倾向得分或outcome的模型(但不一定是两者)被正确计算,就可以得到一致的因果估计。
具体来说,我们使用熵平衡方法来学习权重,以最小化治treatment和control组之间的Jensen-Shannon(JS散度)
,在此基础上,我们对个人和平均治疗效果做出了稳健和有效的反事实预测。我们为所提出的方法提供了理论证明。该算法在现实世界和合成数据上都显示出了与目前最先进的算法相媲美的性能。
4 Counterfactual Predictions under Runtime Confounding
论文地址: https://arxiv.org/abs/2006.16916
算法通常被用来预测在特定的决定或干预下的结果,比如预测一个罪犯在最低限度的监督下是否会获得假释。一般来说,要从历史决策和相应结果的观察数据中学习这种反事实的预测模型,必须衡量所有共同影响结果和所采取的决策的因素。
在决策支持应用程序的推动下,我们研究了反事实的预测任务,其中所有相关因素都捕获在历史数据中,但在预测模型中使用某些此类因素要么是不可取的,要么是不允许的。我们将此设置称为Runtime Confounding
。
在此背景下,我们提出了一个学习反事实预测模型的doubly-robust procedure(DRP)
。我们的理论分析和实验结果表明,我们的方法往往优于竞争的方法。我们也提出了一个验证程序来评估反事实预测方法的性能。
5 Robust Multi-agent Counterfactual Prediction
论文地址: https://arxiv.org/abs/1904.02235
我们考虑使用记录数据来预测如果我们改变多主体系统中的“游戏规则”会发生什么。这个任务是困难的,因为在很多情况下,我们观察到的是个体采取的行动,而不是他们的私人信息或他们的全部奖励功能。此外,代理是战略性的,所以当规则改变时,他们也会改变自己的行动。现有的方法(如结构估计、反向强化学习)通过构建博弈模型,增加agent行为来自给定目标的优化假设,从而做出反事实的预测,然后将观察到的行为颠倒来学习agent的潜在效用函数(又称类型)。一旦知道了代理的类型,做出反事实的预测相当于解决反事实环境的平衡。这种方法强加了大量的假设,如被观察的主体的合理性,分析者的环境/主体效用函数参数形式模型的正确性,以及使点识别成为可能的各种其他条件。我们提出了一种方法来分析违反这些假设的反事实结论的敏感性。我们将这种方法称为鲁棒多智能体反事实预测(RMAC)。我们运用我们的技术来调查反事实主张在市场设计中的经典环境中的稳健性:拍卖、学校选择和社会选择。重要的是,我们证明了RMAC可以用于点识别不可能的区域(例如那些从类型分布到结果具有多个均衡或非单射映射的区域)。
6 State-Building through Public Land Disposal? An Application of Matrix Completion for Counterfactual Prediction
论文地址: https://arxiv.org/abs/1903.08028
如果没有宅基地政策,美国边疆的各州将如何发展?本文探讨了宅基地政策在塑造国家能力方面的作用,这一政策开放了数亿英亩的边疆土地用于定居。如果没有homestead,我将使用矩阵完成方法预测前线状态能力的反事实时间序列,我将其扩展为允许损失函数的倾向加权来控制选择偏差。 在仿真中,该估计器在最小化样本外预测误差方面优于综合控制方法和差异中的差异。因果估计表明,宅基地政策对州政府支出和收入有重大和长期的负面影响。这些结果类似于差异中差异估计,即利用从146万个个人土地专利记录中汇总的宅基地条目的时间和强度的变化。
7 2017:Model-Robust Counterfactual Prediction Method
https://arxiv.org/abs/1705.07019
我们开发了一种新的反事实分析方法,其主要基于不同exposure单元间预测间隔的观测样本。 与针对exposure的异质性target或CATE的方法不同,所提出的方法旨在考虑反事实结果不可减少的分散性,从而量化不同exposure的相对影响。 在共形预测方法的基础上,以无分布和模型鲁棒的方式构造预测区间。通过利用一种无调优方法的特性,可以绕过这种方法的计算障碍,该方法可以学习用于反事实结果的稀疏可加预测模型。该方法用真实数据和合成数据进行了说明。
8 Predicting Counterfactuals from Large Historical Data and Small Randomized Trials
地址:https://arxiv.org/abs/1610.07667
当考虑使用一种新的治疗方法时,无论是药物还是搜索引擎排名算法,出现的一个典型问题是,它的性能会超过当前的治疗方法吗?回答这个反事实问题的传统方法是通过一个对照的随机实验来评估新治疗方法与传统治疗方法的效果。虽然这种方法理论上可以保证无偏估计,但它也存在一些缺陷,包括难以找到具有代表性的实验群体以及运行此类试验的成本。此外,这样的试验忽略了大量可用的控制条件数据,而这些数据常常被完全忽略。 we propose a discriminative framework for estimating the performance of a new treatment given a large dataset of the control condition and data from a small (and possibly unrepresentative) randomized trial comparing new and old treatments.(没看论文不太好直接翻译。。) 这使得我们不仅可以估计平均效应,而且可以对随机样本之外的例子产生个体预测。 我们通过三个领域的实验来证明我们的方法的实用性:搜索引擎操作、糖尿病患者的治疗和房屋的市场价值估算。我们的结果表明,我们的方法可以减少目前进行的随机对照实验的数量和规模,从而为从业者节省了大量的时间、金钱和精力。