实验室成员参加CCF ADL大数据机器学习

2015年11月26日,实验室成员前往中科院计算所,参加中国计算机学会举办的为期三天的《大数据机器学习》学科前沿讲习班(ADL)。ADL围绕计算机领域的不同方向开设,后续不同方向报告链接为 http://www.ccf.org.cn/sites/ccf/adl.jsp

本期会议邀请机器学习领域权威专家学者,从机器学习的经典理论、重要算法、性能分析、最新应用等角度出发,重点关注大数据环境下的机器学习在相关问题中使用的不同模型和关键处理方法,介绍领域内的最新发展以及所面临的挑战,探讨如何在本领域开展前沿研究。

IMG_0269

big learning时代,海量数据的获取与标注成为模型成功学习与否的关键。清华大学张长水教授,面对不同程度质量的标注,介绍了多示例学习、弱监督信息学习等学习方法。利用cross sourcing,从众多低质量的标签信息中获得高质量标签。其中,谈到的数据标注经典文章如下

  • Get Another Labels? Improving Data Quality and Data Mining Using Multiple Noisy Labelers
  • Supervised Learning from Multiple Experts:Whom to trust when everyone lies a bit
  • What if the Irresponsible Teachers Are Dominating?A Method of Training on Samples and Clustering on Teachers

 

普渡大学漆远副教授介绍了大数据背景下,针对贝叶斯非参数模型的一类高斯过程(GP)模型做出的改进。重点介绍了一种可扩展GP学习算法,EigenGP,以及贝叶斯在线学习、贝叶斯张量分解等。

微软亚洲研究院首席研究员刘铁岩博士从工业领域出发,介绍了团队所做的超大规模机器学习系统。比较现有分布式机器学习系统,提出一种参数服务器。

罗格斯大学副教授李平介绍了一些可在大数据背景下有效学习和搜索的新哈希算法,并对比了树模型机器学习与深度学习。

南京大学李宇峰博士介绍了面向大规模数据和安全性能的半监督学习技术,提出探索未标记数据的两种模式,active learning 和Semi-Supervised Learning,介绍四种常用半监督学习范式及未标注数据的代价敏感性学习。

通过听取专家所做工作,可大致归纳出几个机器学习的研究热点方向:1、数据标注问题;2、改进处理big learning的七种方法;3、数据采样问题;4、贝叶斯推理、5、分布式机器学习;6、半监督学习

anyShare分享到:
This entry was posted in 交流活动, 新闻动态. Bookmark the permalink.

发表评论