胡中惠 SPACE


又一个WordPress站点

首页 >全部文章 > 正文内容
【香樟推文0837】高维数据下的因果推断-香樟经济学术圈

图片说明:图片是四维数据的可视化,第四维以颜色表示。左图和右图前面三维数据相同,幸福小丈夫全集在线观看不同的仅是第四维数据。
图片来源:推文作者使用matlab自行绘制。
原文信息:A. Belloni, V. Chernozhukov and C. Hansen, 2014巴西神曲 , Inference on Treatment Effects after Selection among High-Dimensional Controls罗秀春, Review of Economic Studies 81(2): 608-650.
哈哈
引言
利用普通回归估计因果效应,一个重要假设就是控制了其他因素后,感兴趣的变量是随机的。譬如,感兴趣政策对失业的影响,那么控制其他因素后冉东阳 ,政策安排就要是随机的。但其他因素有很多呀,能控制得完吗?Belloni et al.(2014)以机器学习中的lasso模型为例提出了一种方法彩虹旗泡弟弟 ,该方法表明,你可以尽可能多地搜集变量,包括交叉项、二次项等,然后加入到模型中来,也不必担心变量个数超过样本个数奉节生活网 ,通过对这些海量自变量的某种选择,利用OLS一样可以实现对感兴趣变量的因果推断。
输入
方法

那具体的方法是什么呢?考虑一个部分线性模型:

其中,di是处理变量,α0是感兴趣的系数。海量自变量zi通过函数g(zi),m(zi)影响结果变量和处理变量孙闻竹。然后使用控制变量的一个线性组合来逼近g(zi), m(zi):

其中rgi,rmi是逼近误差,xi就是从海量变量中选出来的变量。只要满足稀疏性假设(该假设的具体公式可以见原文),rgi,rmi就可以足够小,从而使得大量变量的线性组合也能逼近g(zi)广饶房产网 ,m(zi)。通过上述表述变蝇人2,可以得到(1)式的诱导式如下:

其中,

通过对上述两个诱导方程分别进行lasso变量选择,从而得到两个变量集,用yi对这两个变量集的并集以及di进行OLS,就可以得到想要的α0,对于α0的推断与传统回归推断无异。作者把他这种从两个方程中选择变量然后做OLS的方法称为后双重选择估计量(post-double-selection estimator)。卢驭龙
理论推导可参考原文。

这么做的直觉
输12
为理解这种双重选择的重要性,作者通过将该估计量与后单一估计量(post-single-selection estimator)进行比较来获得一种直觉。所谓后单一估计量是仅仅利用下式进行变量选择,然后进行OLS:

两种方法的比较涉及大量公式金针菇炒肉 。但粗略地说,当通过筛选而去掉了某些自变量时播磨拳儿,后单一选择估计量可能存在很大的偏误,而后双重选择估计量则不存在这个问题。
输入
应用

作者最后使用他们的方法重新估计了Donohue III and Levitt(2001)的模型,发现Donohue III and Levitt(2001)的结果不再显著了。
Abstracts:We propose robust methods for inference about the effect of a treatment variable on a scalar outcome in the presence of very many regressors in a model with possibly non-Gaussian and heteroscedastic disturbances. We allow for the number of regressors to be larger than the sample size. To make informative inference feasible, we require the model to be approximately sparse; that is, we require that the effect of confounding factors can be controlled for up to a small approximation error by including a relatively small number of variables whose identities are unknown. The latter condition makes it possible to estimate the treatment effect by selecting approximately the right set of regressors. We develop a novel estimation and uniformly valid inference method for the treatment effect in this setting, called the “post-double-selection” method. The main attractive feature of our method is that it allows for imperfect selection of the controls and provides confidence intervals that are valid uniformly across a large class of models. In contrast康熙传奇 , standard post-model selection estimators fail to provide uniform inference even in simple cases with a small, fixed number of controls. Thus, our method resolves the problem of uniform inference after model selection for a large, interesting class of models. We also present a generalization of our method to a fully heterogeneous model with a binary treatment variable. We illustrate the use of the developed methods with numerical simulations and an application that considers the effect of abortion on crime rates.
香樟经济学术圈征稿
输入
“分享”是一种学者的人文情怀黄河颂教案 ,香樟经济学术圈欢迎广大订阅读者(“香粉”)向公众平台投稿超龄插班生,也诚邀您加入香樟推文team宝鸡卷烟厂 。生活处处皆经济渡边大辅,经济处处现生活。如果你或者身边的朋友看了有趣的学术论文,或者撰写了经济政策评论,愿意和大家分享释果宁 ,欢迎投稿(经济金融类),投稿邮箱:cectuiwen@163.com。如果高校、研究机构、媒体或者学者,愿意与平台合作,也请您通过邮箱联系我们。香樟经济学术圈本期小编:段雨玮

上一篇:ycbcr肤色检测算法 下一篇:汤灿事件最新动态【高度】美国三院院士:我们并非处于人工智能的大爆炸时代-学术plus

繁华落尽 转瞬即逝

我们需要透过一系列的训练来突破关卡,我们需要达到一个不受到过去历史的羁绊的心境,透过这样的心境,进而引导成为一个适合进行前进到战士人,我们需要成为一个完美无缺的战士,我们的目标是遵循着力量进入无限的领域和穿越!