【公共卫生案例】啥!玩个互联网还能防流感?

 

啥!玩个互联网还能防流感?

一、导入主题——介绍流感的历史

1.大家有可能不知道,流感病毒,这个微小到没有细胞结构的东西,是人类历史上最致命的杀手。这些图片,为我们翻开了历史上黑暗的一页:1918—1919年横扫世界的西班牙流感,造成全世界约10亿人感染,(当时世界人口约17亿人),过去估计全球死亡人数约2000万,最新的权威估计数字为5000万-1亿。这个数字远远超过了在当时刚结束的第一次世界大战中死于枪炮的人数,高于历年来命丧艾滋病的人数总和,更远超中世纪因黑死病死亡的人数。然而,更加可怕的是,此后每隔大约10—20年,人类就要受到一次全球性流感的袭击。

  • 但这场被称为“全球性世纪瘟疫”的大流感也带来了医学研究、人才培养乃至整个自然科学研究领域的巨大变革。随着时间的推移,人类对于疾病的认识也发生了改变,在流感防疫上不断进步。为更好地防控疾病,各个国家都成立了相应的政府机构。例如,美国疾病控制与预防中心(简称CDC)是美国卫生及公共服务部所属的一个机构,总部设在乔治亚州的亚特兰大市。它的职能是为保护公众健康和安全提供可靠的资料,通过与国家卫生部门及其他组织的良好伙伴关系,提供促进健康的决策。

一般而言,CDC对流感病毒的监测大致要经过以下几个过程:首先,基层医疗卫生机构从患者身上采集病毒样本,新鲜采集的临床标本应在48h内运送至流感监测网络实验室,然后将病毒分离接种并培养。对于血凝滴度达到一定值的流感毒株,需要逐级送往上级疾病防控中心。国家流感中心收到毒株1个月内,通过监测信息系统对送检单位反馈复核鉴定结果。结果确认后,再对最初的基层医院所在地区的流感疫情做出判断。

3.CDC的工作对保障公民健康起到了很大的作用。但成本高,耗时长。时过境迁,进入二十一世纪,生活在互联网时代的人们开始探索通过计算思维更有效更经济地实现疫情防控。

二、Google Flu Trends

在流感季节,许多人都会在网上搜索与流感相关的信息。谷歌工程师发现,特定关键词可以较好地反映流感疫情。因此,谷歌在CDC的帮助下研发了Google flu trends,简称为GFT,利用关键词检索的数据来评估某个时期的流感疫情。

这是2004至09年CDC和GFT对流感疫情的预测比较情况,可以看到他们还是很相近的。GFT的优势一是在在实时性。例如,在这一天,GFT探测到了流感活动的显著增加。但CDC在两周后才报道了相同的疫情。GFT的优势二是在节省成本上,因为它只是使用了谷歌搜索日志里的地点、时间、关键词信息以及后期的计算分析能力,其成本远远小于CDC用于流感预测的人工和检测成本。

随后研究人员在《Nature》杂志上撰文表示,能够进行这种预测的关键在于很多人一旦患上流感,就会在谷歌中搜索关于流感的信息,进而描绘出流感的传播趋势。该文章还表示,如果把谷歌搜索引擎上的相关信息与美国CDC的流感监测信息进行调整对比,就可以提供更为精准的流感趋势预测。

然而GFT的成功却是暂时的,它没能预测到2009年的甲型H1N1流感大流行,并且在2012-2014年持续高估了美国流感的流行态势。2013 年 2 月,《Nature》杂志发文指出,GFT 预测的流感样病例门诊数超过了 CDC 根据全美各实验室监测报告得出的预测结果的两倍。

GFT搜集了如此海量的数据,可为何还是会出现错误呢?在一个名为“清华同衡规划播报”的微信公众号中,北京大学国家发展研究院的沈艳教授撰写了《大数据分析的光荣与陷阱》一文。她指出,GFT出错的原因可能是数据挖掘过程中的过度拟合(Overfitting)问题。在2009年,GFT已经可以观察到2007-2008年间的全部CDC数据,因此它会选择不惜一切代价高度拟合已经观察到的发病率。比如,用其他搜索词代替古怪的搜索词。文章还指出,GFT的追踪机制没能避免大数据的陷阱,包括数据傲慢,算法演化和看不见的动机。

大数据傲慢指盲目提高大数据的地位,而忽视了小数据的基础性作用。Google只是片面地统计搜索关键词,并没有结合某一地区医院的病例综合分析。第二,谷歌公司的商业模式的主要目标是更快速地为使用者提供准确信息。因此,谷歌工程师不断更新谷歌搜索的算法、为使用者提供推荐的相关搜索关键词。虽然这一模式在商业上非常有效,但却会使得使用者搜索的关键词并非出于他们的本意。此外,媒体对于流感流行的报道会增加与流感相关的词汇的搜索次数。也就不可避免地会带来误差。

由此可见,在这个复杂的大数据时代,我们很难通过单纯的关键词分辨用户的真正意图,而由关键词关联出的流感预测也就受其拖累,不再准确。那么,GFT从神坛上的坠落是不是意味着人们不会再去尝试使用互联网及其上流动的数据来去探索新的流感预测方法。在互联网时代,答案当然是个大大的NO。在计算思维中迭代概念的驱动下,人们已开始了对新的解决方案的探索。

三、Twitter

以Facebook 、Twitter等为代表的社交网络发展非常迅猛。Twitter,类似于中国的微博,用户可以在上面发布“推文”,分享自己的生活,并参与评论。目前,全世界的Twitter用户已经超过了2.8亿。Twitter还会分析推文,把最热门的话题滚动显示于其网站首页。你自然会想到,Twitter对热门话题的统计可以给流感追踪带来极大的帮助。

 

这一段视频是美国罗切斯特大学的一个流感研究项目。他们利用推文绘制出了纽约城的流感热点地图,颜色越接近红色的点表示在该地区的推文中,流感一词出现的频率越高。利用这张地图,他们成功预测了整个城市的流感趋势。

  • 总结

来自网站fastcompany.com的这篇文章为我们分析了与Google Flu Tracker相比,twitter的优势所在——Twitter对数据的搜集更加准确。Twitter等社交网络通过连接建立了明确的社交网络结构,用户之间的连接关系清晰。它通过详细分析用户推文,获取明确说明的数据,筛选掉无关内容,从而直接追踪流感本身,而GFT则是通过那些含蓄表达的迹象进行推测。

此外,twitter与用户直接相关。twitter拥有用户在注册时填写的个人信息。因此可以结合发文者的情况进行全方位、立体化的分析。

然而使用Twitter追踪流感也有它的缺点:第一,任何新媒体都有其生命周期,当Twitter的热度下降,通过其搜集的数据则会呈现出不足的态势。第二,推文受新闻事件的影响很大。当媒体报道与流感相关的新闻时,Twitter用户对流感的讨论也势必会激增。

看完了大公司如何利用大数据监测流感,那么具体到我们个人,该如何借助互联网预防流感呢?首先,到了流感季节,我们可以留意一下社交媒体上的相关动态。一旦发现可能疫情,我们就应该采取预防措施,比如:勤通风,少去人多的地方,加强锻炼等。此外,如果我们发现身边出现了许多流感患者,那么可以将这一情况发布在社交媒体上,一来提醒其他亲朋好友,二来也为相关机构提供了数据信息。

在抗击流感的道路上,如何充分挖掘现有数据得出准确的结果,更好地预测流感疾病,掌握计算思维又显得尤为重要,特别是这个案例中讨论的关联、连接和迭代这三个概念,值得大家深入了解。

 

本案例涉及的计算思维概念

1.Google flu tracker中涉及关联的概念。关联是现象之间的一种联系,主要有两种:一种是空间关系,即研究现象之间的位置关系;另一种是时间关系,研究现象之间的次序关系。在统计层面上,若事件A与事件B关 ,那么当A发生时,B并非一定发生,而是在一定程度上发生。不难看出,搜索关键词与流感疫情之间是关联关系,因为部分用户是因为患流感而搜索特定词汇,其余的用户则是出于与流感无关的原因。

2.Twitter对流感的检测则对应连接的概念。连接思维是指利用网络等方式将不同空间的物体连接在一起的思维方法。Twitter利用互联网,将世界各地的人们连接在一起,不同地区的疫情最新进展都可以同时被观测到。

3.迭代思维。迭代是指重复反馈某一过程,目的通常是为了逼近所需目标或结果。GFT迭代提高了CDC的工作,而分析Google flu trend中出现的问题后,用Twitter 又迭代替换了它。将来,Twitter在工作过程中可能会出现新的问题,就需要我们依靠进一步的创新去解决。如此循环往复,不断改进。或许我们永远都无法找到最完美的方案,但是也无需担忧,因为这就是探索的魅力。

 

 

6参考资料

[1] Available from: http://becuo.com/influenza-pictures-1918

[2] Available from Youku

[3] Available from: https://www.youtube.com/watch?v=6111nS66Dpk

[4]Available from: http://www.tuicool.com/articles/emuuY3Q   [5]

[5]Available from: http://www.fastcompany.com/3039541/elasticity/when-is-flu-season-how-twitter-beats-google-to-the-answer

[6] Available from: https://www.youtube.com/watch?v=w_j0VuJ-J9k

 

 

What else:

  1. http://tech.qq.com/a/20140315/004999.htm
  2. http://www.sickweather.com/
anyShare分享到:

About 时会升

14级本科生
This entry was posted in Health Computing, 新闻动态. Bookmark the permalink.

36 Responses to 【公共卫生案例】啥!玩个互联网还能防流感?

  1. 郑润琼 says:

    视频做的不错,衔接感觉有点不顺畅,并且没有旁白,有时没看完内容就开始播放下一张了。

  2. 宋鑫达 says:

    视频做的很好,很高大上,不过缺少了旁白,这是一点缺陷。(26组)

  3. 张月朦 says:

    视频做的很棒,具有吸引力,完成的早,质量也高,不过配些音进行解说可能效果更好,也更方便大家理解——by 36组 The gossip six

  4. 林贝欣 says:

    刚开始放视频,很棒,开门见山,而且视频做的很厉害,这个组格调很高。思路清晰,条理清楚,整体感觉很好–39组

  5. 胡亮 says:

    视频做得也太棒了吧….不仅视频的生动化程度很高,而且动画效果很酷炫。只是全程放音乐的话会不会影响我们看这个呢?最好有配音之类的,能够详细的解说一下这个

  6. 吴芸芸 says:

    视频做的很棒,形式也很新颖,正如以上同学提到的,视频拼接不够自然,背景音乐反而会起到干扰的作用,再者基于Facebook和Twitter的大数据判断这部分内容可能略显空洞。总体来说非常棒,无论是整体构思还是具体框架都很严谨。佩服!——fighting组

  7. 艾孜提艾力•麦麦提敏 says:

    做得真心不错,同学做得水准高,不愧是计算机学院的。不过注意版权问题,给你们组点个赞。
    ——第33组(蚁族)

  8. 周雁 says:

    感觉这个做的真不错,看得出来很用心,条理清晰,音乐很不错,不过我觉得如果添上人声会更好【15组】

  9. 徐晓龙 says:

    视频做的很好,音乐背景也很赞,内容介绍的也比较全面,但是视频中各个连接点处理不那么好,细节方面不够突出。 来自fighting组

  10. 张贵中 says:

    看来那么多,就这个感觉做得最好,内容很连贯,还有配乐,就是题目起的不太好,

  11. 陈俊彦 says:

    来自39组,
    与时下最热的大数据相结合,具有创新性,但缺少细节方面的赘述。

  12. 邹彬 says:

    来自12组。
    做得很棒,思路清晰。但我觉得你是否可以再增加一些细节呢?比如处理微博文本信息是怎样使用了自然语言处理。

  13. 江梓良 says:

    视频做的很创新,背景音乐也十分完美,但是我不知道视频究竟在讲什么,不够具体,或者说内容比较分散,缺少条理性。总的来说案例很好,值得学习

  14. 姚俊 says:

    这次看到的是视频,又是一种全新的展示方式,视频很不错,很细腻。所反映到的问题也很全面,唯一不足的是没有旁白,眼睛一直看着屏幕上的字,都快看花了。而且又被背景音乐带着节奏跑,所以,如果有一段旁白会更好一些呢。——19组

  15. 赵耀 says:

    感觉还是解释的较少把,有点空洞的感觉…38组【美丽的杏树林】

  16. 王昱博 says:

    视频标题取得很亮眼,很吸引人,视频中的案例条理清晰,知识也十分有用。但是缺少解说和视频的剪切拼接让人对一些画面有些摸不到头脑,同志仍需努力~~【美丽的杏树林】

  17. 刘言言 says:

    开头的音乐和图片很符合主题,在视频中引用了大量的数据,案例和事实,具有很强的说服力。制作团体的制作思路和制作能力是值得肯定的。但最后结尾有点突兀,另人不是一下就能接受。最好再附加解说那是极好的。【美丽的杏树林】

  18. 王昱博 says:

    视频标题取得很亮眼,很吸引人,视频中的案例条理清晰,知识也十分有用。但是缺少解说和视频的剪切拼接让人对一些画面有些摸不到头脑,同志仍需努力~~

  19. 张博皓 says:

    绝对高大上的案例,同时你们组做的速度也是蛮快的,我们组现在才开始上传,优点上面的人基本说的差不多了,我就提一些建议吧!视频内容方面,我觉得是不是可以强调一下疾病得可怕,只有片头几秒的介绍感觉不够引起重视。对于加入旁白,我建议原作者慎重考虑一下,因为你们的视频跳转的比较快,如果配音的话对配音员的语速会是个很大的挑战。视频文字介绍那部分写的很详尽,是不是可以考虑放弃一部分视频的简洁性取而代之加入更多文字方面的说明,让视频也做到图文并茂呢?这样或许可以缓解没有配音的问题。(第二组,胜夕队)

  20. 徐周上 says:

    同意楼上观点,其实我对于PPT的看法还是我自己的问题,对于所介绍的方面还是不够了解,看了PPT和楼上的说法再加上查的知识我感觉内容很好调理很好,结构方面再整理一下就好了。来自27组

  21. 高增月 says:

    好的地方就不多说了,视频方面与上面所说的观点一样,应该加点讲解。此外谷歌案例直接用图说明真的不好,首先有些图都还没看清,其次,图式讲解可以浓缩一下再加点配音说明最好。以上即为全部建议仅供参考(来自第36组)

  22. 刘恩生 says:

    上条评论来自第2组,刚才忘记了……

  23. 刘恩生 says:

    整个案例给我一种很高大上的感觉,是我们其他组的榜样,视频衔接很不错,配乐同样特别好,但是美中不足就是没有在视频中加入语音讲解,光是看视频可能没有视频与讲解结合更快让人理解接受。同时视频下方的教案书写的也十分有条理,值得我们组学习参考,总之,我认为这是一个十分不错的作品,期待看到你们加入新内容后的更加完美的作品。

  24. 刘宇轩 says:

    高大上的一个案例。在大多数人只会做PPT的现况下来看就领先了一大步。不说作品好坏(当然是好),就这个视频就应该加很多分。针对作品来看,我认为应该多一点对GTF遭遇的挑战的一个分析,突出自己对于GTF的一个思考。(来自Fighting组)

  25. 张彬彬 says:

    还有,上一条评论来自第六组

  26. 张彬彬 says:

    视频做的可以,让人耳目一新,要是加一些旁白就更出彩了,整个案例结构完整,形式比PPT更加吸引人,视频作为整个案例的核心,努力改进一下会让案例提升很多,加油!

  27. 汪婷婷 says:

    整个案例材料很齐全的,框架完整。榜样!个人有一些改善的的建议 视频音乐配的节奏过于强烈,可以把音乐放小点,我差点哼起来。音乐切换可以更自然点,中间留有适当过渡时间。当然课上安宁老师提到的缺少旁白确实比较明显。如果有旁白,就不会让音乐带走观众,并且视频最后一分钟没有文字配图,有些单调,观众会有些奇怪,莫名其妙。但是总的看来视频做的好用心,真心点赞。还有一点,题目中以微博开头,初见此题,我以为主要论述微博里的大数据,但从案例文本来看微博讨论较少,即使是案例,其他网络方式,如Twitter、Facebook等。个人觉得案例主要谈论网络和大数据,可以不用微博两字。当然,考虑到案例的具象化,可以用一个例子作为代表插入题目。文案整体格式排列好整齐,同时采用的字体是文献的常规字体,字体区分清楚,很用心,很规范。但考虑是上传但网页,应采用网页字体更合适。当然,这都是小问题。这个案例还是让我意识到了网络数据可以再医疗方面发挥的巨大作用。

  28. 范文瑞 says:

    “感觉视频好高大上,但是到后面很多图表信息部分,··看不懂,片段过的速度太快,又没有相应介绍,而且视频有强行拼接的感觉。。。不同片段转换应该需要优化的,总的来说做的很好了,反正我是没有水平做出来···········[悲伤]

  29. 赵丹青 says:

    针对视频:整体上做得很棒!但是,视频没有旁白,的确影响信息的传达,建议后续一定要完善。内容的安排上其他评论中有很多建议,我就不赘述了。视频在一些转场的部分不太精炼,黑屏的时间有点长。此外,视频中出现的一些截图,最好是将关键信息用红色框标记出来,利于引导视觉焦点促进观众快速了解这些信息。

  30. 杨美佳 says:

    刚开始的视频做得很出彩,运用的也是大家比较少用的软件,但是视频中缺少了讲解,只有单一的音乐感觉有些单调,可以加入人声。这个案例在讲解时有运用例子,可以生动和直观,但是所给出的解释太过单一,没有全面给出解释,只是着力在几个点,估计是时间所限。总之这个案例很不错。

发表评论