【学术报告】Causal decision trees学术报告

2018年11月29日,南澳大利亚大学信息技术与数学科学学院的Lin Liu教授来我校进行题目为Causal decision trees(因果决策树)的学术交流报告。报告中主要讲述了揭示数据分析的主要目标是数据中的因果关系。

1 2 (1)

以前因果推论(Causal inference)的主要模型

 

  1. 图像因果模型 Graphical causal model
  2. 潜在结果模型 Potential outcome model
  3. 结构方程模型 Structural equation model

 

 

  1. 图像因果模型 Graphical causal model

 

图形因果模型旨在用有向无环图(DAG)描述管理所研究系统的基础物理机制的结构

由图中的节点表示的每个变量的状态由随机过程生成,该过程由图中其父变量的值确定。 影响过程结果的所有变量都被称为结果变量的原因。 间接原因通过另一个变量间接产生效果状态。 如果已知变量中没有中间变量,则原因被认为是直接原因。

 

  1. 潜在结果模型 Potential outcome model

潜在结果模型(Potential Outcomes Model)是其中最重要的理论模型之一,其核心是比较同一个研究对象(Unit)在接受干预(Treatment)和不接受干预(Control)时结果差异,认为这一结果差异就是接受干预相对于不接受干预的效果。

在提供疗法的前提下,假设有两个潜在的结果Z0i和Z1i

则通过一个独立方程产生因果效应:δi=Z1i-Z0i

平均因果效应:E[δi]= E[Z1i]-E[Z0i]

 

  1. 结构方程模型 Structural equation model

结构方程模型分析:结构方程模型是一种建立、估计和检验因果关系模型的方法。模型中既包含有可观测的显在变量,也可能包含无法直接观测的潜在变量。结构方程模型可以替代多重回归、通径分析、因子分析、协方差分析等方法,清晰分析单项指标对总体的作用和单项指标间的相互关系。

 

4.

因素决策树(Causal decision trees)

在因果决策树(CDT)中,非叶节点Q表示Q与结果属性Y之间的上下文特定因果关系,其中上下文是沿着从根和QA叶的父路径的属性的一系列值赋值。node表示Y的值赋值,Y是上下文特定数据集中Y的最可能值,其中上下文是沿着从根到叶的路径的属性的一系列值赋值。

CDT提供了一组谓词属性和结果属性之间的因果关系的紧凑和精确的图形表示。由CDT表示的上下文特定的因果关系具有很大的实际用途,并且它们不是由现有的因果模型编码的。

为构建CDT而开发的算法利用分而治之的策略来构建正常的决策树,因此可以快速扩展到大型数据集。用于选择CDT的分支属性的标准基于完善的潜在结果模型和部分关联测试,确保树的因果语义。

鉴于大数据的可用性越来越高,我们认为拟议的CDT将成为自动发现大数据中因果关系的有前途的工具,从而支持更好的决策制定和各个领域的行动计划。

anyShare分享到:
This entry was posted in 新闻动态. Bookmark the permalink.

发表评论