【例会】基于因果效应的贝叶斯网络结构学习方法

时间:2018.08.29

主持人:滕越

参会老师: 杨矫云

参会学生:贵芳、唐晨、滕越、肖勇博,明鉷,韩朋,刘杰,段优,李雨龙,程坤,刘硕,赵春阳

请假:江思源,景波

  • 背景(background)

贝叶斯网络是不确定知识表达的重要工具、是一些节点联合概率分布的有向无环图,它由有向无环图(directed acyclic graph)和条件概率表(conditional probability table)两部分组成。其中,有向无环图定性的表示了变量之间的独立关系,条件概率表则定量的表示了变量间的依赖程度。由于其图形可视化的特点,被广泛应用于生物医药领域、预测领域、分类、因果推断、视觉识别、信息检索[等。

贝叶斯网的构建方法主要分为通过专家知识构建和通过数据构建。通过专家知识构建贝叶斯网络是一项非常繁琐且容易出错的工作,而从数据中学习得到贝叶斯网络是一个NP-hard问题。因此,如何高效、高质量的从数据中学习贝叶斯网络成为了研究的重难点之一。近几十年来,涌现了很多结构学习方法,基于条件独立测试的算法[1、基于评分搜索的算法、以及混合条件独立性测试和评分搜索的方法。

  • 问题和假设(problem & hypothesis)

假设:两节点之间存在因果效应;

问题:能否通过两节点之间的因果效应得出节点优先次序,并学习贝叶斯网络

  • 方法(method)

1、定义了节点优先度向量

2、基于因果效应节点优先度学习方法

3、基于BDe评分的节点优先度计算方法

4、基于互信息的删边策略

5、基于BDe评分的调节策略

  • 实验(experiment)

基于因果效应的方法在两个贝叶斯标准数据库下测试(ASIA数据库、ALARM数据库),并与MMHC算法、MCMC算法、爬山法和随机K2算法进行对比。对于同一组数据,从正确边、丢失边、反向边、多边的平均值以及标准差进行对比。取不同样本量数据进行实验,样本量分别为(2000、4000、6000、8000、10000、12000、14000、16000、20000).实验表明,该方法在正确边个数、错误边个数均胜过其他贝叶斯网络学习方法。

  • 展望(future work)

贝叶斯网络是用来描述节点联合概率的图模型,贝叶斯网络中的箭头可以表示因果性。提出了基于pearl因果效应和基于BDe评分函数的节点优先度算法,结合K2算法在贝叶斯网络标准数据库上胜过MMHC等算法。基于因果效应的方法在调节反向边环节,是通过评分函数调节的。目前已有的评分函数,都需要假设数据服从某一个先验分布。这使得评分函数不能准确的描述数据和网络的拟合程度。考虑到在今后的研究中,可以通过文本挖掘关键词网络中有相关关键词的句子,用自然语言处理的方法识别出贝叶斯网络箭头的方向,从而调整从数据中学习得到的图的部分错误边方向。这也是今后贝叶斯网络学习的发展趋势。

anyShare分享到:
This entry was posted in 例会. Bookmark the permalink.

发表评论