数学天元2017统计学青年骨干教师培训班-第二天

课程开始,耿直老师回顾了第一天的内容,特别是多个非混杂因素的剔除算法,根据因果网络,巧妙的构造了两个判断标准,根据两个标准,逐步从候选集合中删除非混杂因素[1](课后整理的相关参考文献,供参考)。

1

随后,耿老师介绍了流行病学专家Rubin提出的倾向得分方法[2]。其目的在于,当找到的混杂因素X的类型为连续型或者取值范围很广的离散型数据时,按照X进行分层,虽然可以确保强可忽略条件成立,但会将总体分的太细,导致各子群体的个体数理非常小,降低统计推断的效率。倾向得分方法简单来说,就是将原来的按照X分层,改为按照X的函数Y分层,确保各子群体中个体数目较多。具体涉及到的概念有:平衡得分,倾向得分,由定理推出的几个重要推论(基于平衡得分的对匹配,基于平衡得分的分层,基于平衡得分的协变量调整)。

耿老师的内容介绍基于计量经济学和流行病学的角度,提出了工具变量估计方法,代表性文章有,计量经济学专家Angrist[3]及流行病学专家Robins[4]。其目的是,当已有直接效应的因果图,解决含有观测误差时的简单线性回归的系数估计问题,当混杂变量不可知时,尝试找到一个与处理变量有强相关性,并与混杂变量独立的工具变量,进而,将回归方程中原来带有误差的不可测的混杂变量替换为可测工具变量。

对于交互作用和直接作用、间接作用做了介绍,Greenland首次提出并对这些概念进行了详细的描述[5]。其中,生物交互作用用于判断多个暴露因素之间是否会相互影响,可仔细研究。直接作用和间接作用基本是pearl的内容[6]。

通过课程,了解到因果推断在计量经济学和流行病学已有广泛应用,但基本理论内容相对成熟,近20年更新较慢。今天的课确实为今后的研究提供了些新的思路,收获颇丰。

 

 


 

[1]Wang, X., Geng, Z., Chen, H. and Xie, X. (2009) Detecting multiple confounders.J. Statist Plan. & Inf. 139, 1073-1081.

[2]Rosenbaum, P. R. and Rubin, D. B.(1983). The central role of the propensity score in observational studies for causal effects. Biometrika, 70, 41-55.

[3]Angrist, J., Imbens, G. and Rubin, D. (1996) Identification of causal effects using instrumental variables. J. Amer. Statist. Assoc. 91, 444-472.

[4]Robins, J. M., Mark, S. D. and Newey, W. K. (1992) Estimating exposure effects by modeling the expectation of exposure conditional on confounders. Biometrics, 48, 479-495.

[5]Greenland, S., Pearl, J. and Robins, J. M. (1999) Causal diagrams for epidemiologic research. Epidemiology 10, 37–48.

[6]Pearl, J. (2001) Direct and Indirect Effects. In Proc. 17th Conf. Uncertainty in Artificial Intelligence, 411-420.

 

anyShare分享到:
This entry was posted in 交流活动, 博士生, 新闻动态. Bookmark the permalink.

发表评论