这五年来,只要你生活在地球上,就一定听说过大数据这个词。大数据就是说,我们所做的一切事,不论在线上还是线下,都会留下数字脚印。每一次刷卡购物,每一次网络搜索,手机上的每一次点击,乃至社交网络上的每一个点赞,都会被记录下来。
有很长一段时间,我们都不太清楚这些数据的用途——只是有时,在搜过“高血压”一词后,降压药广告就会紧紧跟随在你浏览的网页上,但仅此而已。
11月9号那天,大数据所带来的巨大效益开始浮出水面。特朗普在线竞选活动的背后,就有这家叫做Cambridge Analytica的大数据公司。在英国脱欧运动的早期,它就曾服务于Leave.EU组织。
要理解美国大选的结果,以及政治传播的未来,我们还得从2014年的剑桥大学说起。事情发生在科辛斯基的心理测定学中心。
心理测定学有时又称心理风貌学,专注于心理特质的测量,比如性格。上世纪80年代,有两组心理学家开发了一种模型,名为“五大性格特质”。
它们是:开放性(你对新的经验有多开放?),尽责性(你有多完美主义),外向性(你有多合群?),亲和性(你有多体贴、多愿意配合?),神经过敏性(你有多容易不开心?),统称“OCEAN”。
基于这些维度,我们可以对每个人作出相对准确的评估。这包括他们的需求、恐惧和行为方式。五大性格特质已成为心理测定的标准手段。
但长久以来,这种办法都有一个问题,即数据收集的难度——需要让被调查者填写一份涉及隐私的复杂问卷。之后,互联网诞生,继而是Facebook,再接着,科辛斯基这样的学者出现了。
米哈尔·科辛斯基
2008年,还在华沙念书时,米哈尔·科辛斯基迎来一个转机。他被剑桥大学心理测定学中心录取,它是全球同类机构中历史最悠久的一家。最开始,是他的同学大卫·史迪威(David Stillwell,现在是剑桥大学商学院的讲师)发布了一个小小的Facebook应用,那时候的Facebook还没有成长为如今这头巨兽。
发布一年后,科辛斯基加入其中。这个应用名为MyPersonality(我的性格),用户可用其填写心理测定问卷,其中有五个问题就来自五大性格特质问卷(“我很容易慌张”,“我爱跟别人唱反调”等)。根据这些评估,用户们可以得到自己的“性格风貌”,五大性格特质分列其上。用户还能选择是否将Facebook个人主页的数据分享给研究人员。
科辛斯基原以为,能从同学那儿回收几十份问卷就已经很好了,但没过多久,成百上千、乃至数百万人都对该应用敞开了心扉。突然之间,这两位博士生就拥有了结合Facebook个人主页数据和心理测定学分数的最大数据集。
后来几年,科辛斯基和同事们又开发了一种手段,说来十分简单。首先,他们以网络调查的形式,向十名被试提供问卷。通过他们的回馈,这些心理学家们计算出五大性格特质的分值,然后将结果与被试的各类网络数据加以对照:他们在Facebook上“赞”过、分享过或发布过什么,或他们列明的性别、年龄、住址等。这样一来,研究人员就可以对号入座、描绘出一个人的性格风貌了。
根据人们在网上的举动中,这套分析法能作出准确的推断。举个例子,“赞”过化妆品牌MAC的男子相对更有可能是同性恋;最准的同性恋预测指标之一,是喜欢“武当帮”这个嘻哈乐队。Lady Gaga的歌迷最有可能是外向者,给哲学点过“赞”的往往是内向者。
单独起来,这些信息都不足以提供可靠的预测,但一旦将成百上千的个人数据点整合起来,预测结果就可以十分准确。
科辛斯基和团队孜孜不倦地完善着他们的模型。2012年,科辛斯基证明,基于一名Facebook用户的68个“赞”,该模型可以预测出用户的肤色(准确率95%)、性取向(准确率88%),以及该用户是支持民主党还是共和党(准确率85%)。
但模型的能耐并不止步于此。用户的智力、宗教信仰,以及烟酒、毒品的使用情况,这些都可以被预测出来。通过这些数据,它甚至能推断用户的父母是否离异。
从这些预测中,我们就能看出这个模型的厉害。科辛斯基没有停止过改进的脚步:没过多久,他就能凭借Facebook上的十个“赞”,赛过某个人身边同事对此人的了解;70个“赞”就足以赛过好友;150个赞赛过父母;300赞赛过另一半。再多一点的话,甚至可以赛过一个人对自己的了解。
这些结果发布的那一天,科辛斯基接到两通电话。一通威胁要起诉他,另一通则是工作邀约。滑稽的是,两个电话都来自Facebook。
没过几周,用户在Facebook上“赞”过的内容就变成了默认不可见。在此之前,你“赞”过哪些内容是默认全网公开的。
但这可难不倒数据收集者们:科辛斯基始终都会事先征求Facebook用户的同意,但如今很多应用和网络调查都要求访问私密数据,以此作为提供性格测试的条件。(如果你想分析一下自己 “赞”过的内容,可以上科辛斯基的网站,然后将结果与经典OCEAN问卷相对照,比如剑桥心理测定学中心的问卷)。
但他们研究的不光是点赞记录,也不仅限于Facebook:如今,科辛斯基和团队可以仅看一个人在Facebook上发布的照片数(一个很好的外向性指标),就评估出他们的五大性格特质。但即便不在上网,我们其实也在透露各种信息。
举个例子,手机上的运动传感器能暴露出我们的移动速度和位移(与情绪稳定性相关)。科辛斯基说,我们的智能手机本身就是一份庞大的心理问卷,我们在有意无意之间,一直在填写着这份问卷。
更重要的是,反过来也行得通,而且这才是关键:我们既可以从数据中得出一个人的心理风貌,也可以反过来,用这些数据搜寻特定心理风貌的人群:比如所有坐立不安的父亲,所有愤怒的内向者,乃至于所有摇摆不定的政党支持者。
说白了,科辛斯基发明了另一种“人肉搜索引擎”。他开始看到这项工作的潜力,但也逐渐意识到它固有的危险性。
对他来说,互联网一直都是上天的恩赐。他真正想做的是回馈和分享。既然数据可以复制,何不让所有人都从中受益?这是振奋一整代人的想法,是一个新时代的开端,它超越了物理世界的限制。
但科辛斯基不禁疑惑:若有人滥用他的搜人引擎,用它摆布他人,结果又会怎样?他开始在大部分研究中加入警示语。他警告称:这种方法“可能会对个人福祉、自由乃至生命构成威胁”。但似乎没人理解他的语重心长。
那一阵子,也就是2014年初,心理学系有一位年轻的助理教授名为亚历山大·高根(Aleksandr Kogan)。他找到科辛斯基,说有一家公司对科辛斯基的分析方法感兴趣,并想访问MyPersonality的数据库,让他代为询问。但受到保密协议的约束,高根不能透露这些数据的用途。
起初,科辛斯基和团队考虑接受邀约,因为这样一来,中心就能获得一大笔钱,但随后,他犹豫了。
最后,科辛斯基回忆说,高根披露了这家公司的名字:SCL,全程战略传播实验室。该公司的网站上写着:“我们是首屈一指的竞选管理机构”。SCL基于心理学建模,提供市场营销服务,核心焦点之一:影响大选。影响大选?科辛斯基惴惴不安起来,他继续翻看网页——这究竟是家什么机构?这些人都在谋划些什么?
当时的科辛斯基并不知道,SCL是一群公司的母公司。至于SCL和旗下众多分支的老板是谁,人们并不清楚,因为企业结构错综复杂,跟英国公司注册局、巴拿马文件和在特拉华州注册的公司名册类似。
SCL的一些子公司曾涉足乌克兰和尼日利亚等国的大选,帮助尼泊尔君主打击反政府组织,有的则帮北约影响过东欧和阿富汗居民。2013年,SCL分拆出一家新公司,涉足美国大选,这家公司就是Cambridge Analytica。
科辛斯基那时候对此一无所知,但他有一种不好的预感。“事情开始让人反感。”他回忆说。经过进一步的调查,他发现,亚历山大·高根秘密注册了一家公司,与SCL做生意。
有赖于2015年12月英国《卫报》的一篇报道,以及《杂志》期刊拿到的公司内部文件,事情才渐渐浮出水面:SCL从高根那里了解到了科辛斯基的研究方法。
科辛斯基开始怀疑,高根的公司可能抄袭了他基于Facebook点赞记录的五大性格特质测量工具,并将其卖给了这家影响大选的公司。科辛斯基立刻与高根断绝联系,并向中心主任汇报情况。这在大学内部激起了错综复杂的矛盾冲突。
最后,亚历山大·高根后迁居新加坡,在那里成家,并改姓斯派克特(Dr. Spectre,直译为“幽灵博士”)。米哈尔·科辛斯基则读完博士,接受了斯坦福大学的工作邀约,移居美国。
“脱欧先生”