只听说过政府监听民众,没听说过政客反被“监听”?数据的威力到底能有多大?有丹麦记者突发奇想“偷窥”政客,还做成了好玩的可视化作品,并斩获大奖。想知道他们是怎么搜集数据又是怎么玩转可视化?深度君带来独家解读。
2013年,中情局前雇员斯诺登揭发了美国政府对普通公民进行的大规模监听计划“棱镜”,让很多人心惊胆战:每个人的手机、邮件原来都受到了监控。不过美国国家安全局声称他们只监控元数据(metadata)信息,即对数据及信息资源的描述性信息,而非数据本身。
一个人身上有多少元数据信息?从元数据信息又可以了解到什么?这些数据如果落入不法分子手中,是否会有危险?
为了解答这些问题,丹麦一家名叫“Berlingske”的日报别出心裁,以两名政客为“实验标本”,收集了他们的邮件、手机和银行卡等所有可获取的元数据,进行分析、整理,最终以图表、地图、视频、图片以及其它可视化的方式呈现。这个名为“Sporet”(被追踪)的多媒体新闻于2014年发布,由四名记者、一名互动设计师和一名程序员协作完成,最终获得了2015年全球编辑网络(GEN)颁发的数据新闻奖。
那他们是怎么做到的呢?
为了让报道产生影响力,记者有意将“实验标本”锁定为公众人物。他们找到两名丹麦国会议员Sofie Carsten Nielsen和Jens Joel。对于记者来说,这两人是理想人选:一男一女,都是惯用互联网的较年轻一代。而在报道过程中,Sofie更晋升为丹麦高等教育和科学部部长。
这两名议员了解项目之后,同意将大量个人的元数据交给媒体。除了从议员本人处获取资料,记者还从土地登记法院、电信公司、税务局、警察局等机构获取与二人相关的信息。
这些元数据包括电话数据(电话记录、短消息、网络记录)、手机备份信息(手机应用、苹果短讯iMessage、照片、记事本、Wifi上网记录)、电子邮件、网页浏览历史、银行和信用卡数据、社交媒体(脸书和推特)、旅行数据(飞机、火车和出租车)、网上购物、纳税和住房数据,甚至是警方记录。涉及两人的数据总量不小,共包括18000封邮件、31000条电话数据、2400条信用卡和银行数据、34000条地理位置数据和2800 条日历信息。
读者看到的最后效果是一个互动新闻专题:网页上自上而下显示着二人的家居照片,一些闪动的黄色圆点则代表了可提供他们信息的各类终端,如手机、电话、护照、银行卡、电脑甚至角落摆放的球鞋等。读者拖动照片,点开黄色圆点,就可以看到与物品相关的元数据解释。
以Sofie为例,基于一段时间内其手机和银行卡的元数据,记者拼凑出她在这段时间里的位置图:每次她用手机打电话或者发短讯,电信服务供应商就会追踪到她的位置;iPhone手机上的跑步和相机app会记录她所在的经纬度;而每当她使用Dankort消费(丹麦境内广泛使用的支付平台,大量取代现金)时,她的银行就会知道她在哪里。
记者们挑选了2013年夏天前后两周的元数据,制作了一款名为“紧跟Sofie脚步”的动画,点击日期,你就可以看到她当天在什么位置打了电话、给谁发短信、用手机拍了什么照片、在哪里跑步、去哪儿购物等等。
手机短信
通过分析Sofie的短讯,记者发现她保存了所有消息,从来没有删过。记者制作了一个与她联系最密切的20人名单,从中可以看到Sofie与哪些政治顾问和家庭成员联系最频繁。点击对话框就可以看到详细介绍。
社交媒体
脸书也记录着用户的一举一动:哪些好友被拒绝通过、没有公开的订阅新闻、甚至是点击过广告,都能在脸书的数据记录中找到。
无线网
除此之外,每次用手机连接无线网wifi,手机都会生成一个备份文件,显示位置信息。记者把Sofie在全球各地使用过的无线网信息用地图展现出来,可以看到大概位置、wifi名字、使用时间以及时长。地图显示,她在曼哈顿的咖啡店、酒店、酒吧等地方都连接过wifi,可谓一目了然。
跑步app
Sofie有慢跑的习惯。她常带手机在哥本哈根中部的湖边跑步。记者将app记录的信息做了地图,展示她的跑步习惯,包括跑步的精确位置、具体时间和时长。
同时,记者对社会民主党成员Jens Joe的元数据做了不同的可视化分析。
工作邮箱
记者获得了Jens从2011到2013年工作邮箱的邮件元数据。邮件内容无法看到,但可以看到邮件收发人、日期以及标题。记者提取了与Jens联系最频繁的政治人物,并按类划分,其中有市长、有同党派成员以及不同团体的人。
银行卡交易
从Jens一年的Dankort交易信息可以分析出他的消费习惯。记者将他的个人消费与丹麦普通市民做了对比,可以看到Jens用Dankort在餐厅消费最多,是普通人的五倍;他喜欢喝酒,是普通人的30倍;另外,他在打车和买衣服上面也比一般人花得多。
浏览网站
记者获得了从2013年10月8日到11月14日这段时间Jens工作电脑的浏览器数据,可以知道Jens平时常去的网站和关注的内容。他最关注的内容包括丹麦国会、社会民主党、政治新闻、飞机和火车的班次、优质的食物、摩托车,还有他自己。
相信看到这里不少小伙伴都会感叹:他们太幸运了!能拿到如此独家的材料!这项目的确可遇不可求,难得有文中两位政客把数据全盘托出。而在此之前,项目组也曾遇挫,因为他们最初目标是获得斯诺登的监听数据。两年前,这家报社的两名记者在参加里约热内卢全球深度报道大会时曾拜访帮助斯诺登的《卫报》撰稿人Glenn Greenwald,希望拿到数据,但是被拒绝。不过他们没有气馁,并坚信这个元数据项目的潜力。最后,他们找到这两个政治人物,虽然过程中也有一些小曲折,但最终顺利完成。这充分说明:数据可视化,只有想不到,没有做不到。