- 2018-03-26 10:13
- 作者:佚名
- 来源:HC3i中国数字医疗网、“无事生妃”微信号
3月24日上午,2018中华医院信息网络大会(2018CHINC)在杭州开幕。原国家卫生计生委副主任、中国卫生信息与健康医疗大数据学会会长金小桃在致辞中特别强调了网络安全和患者个人信息保护的重要性。他提到,脸书(Facebook)的数据泄密事件不是偶然,因为没有信用可言,现如今脸书的生存都成了问题。以此为鉴,每一个单位都要高度自觉维护网络安全,保护健康医疗数据和信息安全。
最近脸书事件沸沸扬扬,我们被这种标题包围了:
- “惊天泄露:他们窃取了 5000 万脸书用户数据诱导选票!”
- “美国再爆惊天大丑闻!窃取五千万脸书用户数据,为了操纵人心!”
新闻看进去,居然还在讲两年前的总统大选,据说一个名不见经传的小公司,一举盗取了脸书 5000 万个用户的信息,并以此操控了美国大选结果。
到底是怎么一回事?我们梳理了一下脸书数据失窃一事。
脸书事件时间线
2012 年
美国总统大选,奥巴马大胜。事后爆出,他在竞选过程利用大数据分析有效率有针对性地拉拢选民调动选民,成为了把最新科技应用到政治选举的教科书式范例。
2013 年
共和党痛定思痛,决心迎头赶上,他们资助下的数据分析公司遍地开花。
2014 年
班农(Stephen Bannon)和共和党大金主默瑟(Robert Mercer)创立了剑桥分析。
剑桥分析开始打算直接从剑桥大学负责这项研究的米夏尔·科辛斯基博士(Michal Kosinski)和戴维·史迪威研究员(David Stillwell)那里搞数据,没想到被这两位以研究数据不得泄露为由给拒绝了。最后还是在剑桥大学心理系的前苏联(!)研究员库甘(Kogan)那里打开了缺口,此人利用自己开发的脸书应用,伪装科学研究不道德获取了大量用户信息,连同自己的分析结果卖给了剑桥分析。
2015 年
共和党候选人泰德·克魯茲(Ted Cruz)率先使用了剑桥分析的服务。克鲁兹失败后,班农等人加入川普团队,开始使用剑桥分析的大数据结果,对脸书用户进行定点广告投入,以左右选民思想。
2015 年年底
脸书发现数据泄露。然而
第一,只是给库甘发信让他删除数据;
第二,没有通知受影响的用户;
第三,竟然聘用了剑桥分析的高管。
脸书数据是如何被盗取的?
2014年,有些脸书用户收到了这样一个邀请,下载一个应用,做一个心理测试,就可以随机拿到$2~$5 的红包。虽然大多数人路上看见一块钱也未必会去捡,但是本着网上一分钱也要抢的原则,还是争先恐后地去做了测试。当然这个测试门槛不低,必须是美国公民,而且需要朋友众多。最后有近 30 万幸运的美国人拿到了这笔 “巨款”。
这个测试的设计者就是前文提到的剑桥大学心理系研究员库甘,他的这款 “我的数字化生活” 应用背后的原理是前文提到剑桥研究小组的科研结果。这个号称的测试其实私底下悄悄地收集了大量的脸书用户个人信息。说到这里不得不提及脸书的缺省隐私设置。根据缺省值,脸书用户信息是朋友的朋友可见。翻译成白话就是当某用户同意提供某些信息的时候,除非他的朋友特别声明自己不愿分享信息,否则朋友信息也可以一并收集。
于是库甘凭借着初始那三十万人的许可,一举拿到了脸书 5000 万用户的信息。
一般情况下,脸书是不允许这种用户数据收集。当然任何时候都有例外,脸书的例外情况是,允许学术研究性质的信息收集。
库甘在短短几周的时间里从脸书扒下了海量数据,激活了脸书的安全警报。脸书发信问讯,获知是为了 “学术研究” 以后,也就没有在意。
这样也行?!
就好比有人在偷银行,保安过去询问,小偷回复 “在装修呢”,保安就走开了?
然而库甘可不是在进行什么学术研究。他此时已经怀揣了剑桥分析的银子。记得用户得到的红包吗?那就是用剑桥分析的订金支付的。库甘拿到这些信息以后,结合自己设计的心理测试的结果,外加一些从另外渠道买来的相关数据,用大数据分析建模分类,最后打包发给了剑桥分析。
剑桥分析通过脸书应用采集用户数据行为,以及采集数据的手段都违反了脸书的使用条例。明明说好只有我做测验,为啥暗搓搓地把我的老底给摸了,还把我的七大姑八大姨都给牵扯进来了?!最后我连同七大姑八大姨一古脑卖给了政客 A、B 还有 C!剑桥分析被起诉一点不冤。
这次收集的数据,说起来一点也不敏感,以至于脸书至今否认这是一场数据失窃,因为真正敏感的用户密码并未泄露。教授收集的不过是用户名,所在地,和一些无关紧要的点赞信息(就是那个你在朋友圈看见谁发的文章有意思,随便点的一个赞)。可是,这些都是全面公开谁都能看得到的信息。就靠这点信息,还能做出花来?
剑桥分析就能!政治竞选里用上选民数据分析完全不是个新鲜事。剑桥分析引以为豪的是,他们不是常规的从人口学的层面上给选民分类,他们采用了心理分析的方法,从行为预测上给选民分类,精准打击到个人,把传统的竞选方法秒成渣,这一切用到的不过是最不起眼,完全公开的点赞。
库甘根据大家的点赞记录,把这些用户精细分类。这些类别不仅包括了一个人的政治立场,也涵盖了对此人性格的分析以及如何在选举中照方抓药的对策。用户的政治倾向分析出来,竞选过程中,就可以通过精准的广告投放,影响这个人的选择。
比如倾向民主党的人,尽量发让他对民主党候选人失望的消息,最好不要去选举。
倾向共和党的人,则可以发一些激动人心打鸡血的文章。
……
竞选本身我们不予置评,但有一件事很清楚,在网络无所不在,社交媒体铺天盖地的今天,我们所拥有的隐私会越来越少,总有一天,我们醒来发现,人工智能比自己还懂自己。在大数据的覆盖下,每个人终将无所遁形。