由全球编辑网络(Global Editor Network)主办的2017年数据新闻奖近日揭晓入围名单。阿根廷《民族报》报道《检察官之死》(Death of A Prosecutor)聚焦前检察官阿尔贝托·尼斯曼因调查阿根廷与伊朗政府高层而神秘死亡的案件,调动120多人的志愿者团队听取四万多条电话监听录音,从中抽丝剥茧还原涉案权贵的攻守同盟,入围竞逐“最佳数据调查奖”。
这个涉及庞大数据的调查项目如何展开?其中的挑战和亮点又在何处?下面由深度网为你编译《民族报》数据团队的分享。
一、调查背景:
一切需追溯到20多年前。1994年7月,阿根廷布宜诺斯艾利斯的犹太人互助中心(AMIA)发生剧烈爆炸,造成85人死亡,300多人受伤。这起事件后来被定性为恐怖主义袭击。直至2006年,经过漫长的调查,阿根廷当局发现涉案人员中有伊朗官方人士。
国际刑警组织很快发出红色通缉令来协助阿根廷警察的行动。然而,尽管阿根廷政府一再要求伊朗政府对嫌犯进行审判处理,后者始终拒绝配合。
2013年1月,事态出现惊人逆转。时任总统克里斯蒂娜·基什内尔(Cristina Kirchner)与伊朗当局签订协议,表示将与后者一起调查AMIA爆炸案。此举在阿根廷民众及国会内部引发了巨大的争议。
2015年1月,调查事件近十年的阿根廷检察官阿尔贝托·尼斯曼(Alberto Nisman)公开指控基什内尔及其他阿根廷官员与伊朗合谋,妨碍对爆炸案的调查。尼斯曼称,当局意在撤销国际刑警组织的红色通缉令,确保伊朗嫌犯无罪,以修复与伊朗的商业联系。
在他公开作出指控的三日后、原定出席国会听证会提供调查证据的前夕,尼斯曼被发现在自己家里中枪身亡,身旁是那把致命的凶器。究竟是自杀还是被杀?虽然疑点重重但警方调查却寸步难进;而同时,民众则走上街头进行“静默游行”,要求当局公正调查尼斯曼之死。案件悬而未决的两年里,尼斯曼之死成为阿根廷民众心头的一根刺。直到2016年12月,随着新总统毛里西奥·马克里(Mauricio Macri)上台,尼斯曼的案子才重新开启。
尼斯曼生前收集、用来指控基什内尔的证据在这时进入了公众视野。
二、证据:40,354个录音文件
尼斯曼的证据是窃听得来的电话录音,共计40,354条。2012年至2014年间,得到法庭批准后,阿根廷中央情报局介入AMIA爆炸案调查,开始对定居于布宜诺斯艾利斯的伊朗人Jorge Yussuf Khalil的四部电话进行窃听。据尼斯曼生前调查,Khalil深受爆炸案嫌犯之一Mohsen Rabani的信任,同时也是阿伊两国政府间的秘密谈判代表。
这批录音随着案件重启而泄漏,很快阿根廷国内一些媒体对此进行报道,公开了全部录音。而《民族报》的数据团队则“不走寻常路”,决定对每一条录音进行挖掘、整理与分析,以还原录音背后完整的故事。
三、数字技术:VozData
面对庞大的音频数量,《民族报》数据团队在一开始尝试了机器学习和声音分析技术,但并没有获得理想的结果。因此,团队转而采用自主开发的开源网络协作平台VozData,上传所有音频,召集志愿者来听取录音,并让他们根据已建立的分类进行整理。
这批录音证据中,只有30%是“元数据”,即包含通话双方号码,以及移动电话号码所属地区等信息。因此,要“解剖”这批录音,最大的挑战在于辨别人声,找出涉案者身份。由于通话双方或互相熟悉,或惯以昵称互相称呼,在一些电话通讯中,通话者身份并不可知。下一步,记者们还需要把每个电话号码与相关的人、工作机构、办公室等信息一一对应。
两年间,团队从阿根廷国内到乌拉圭、厄瓜多尔、墨西哥等地选出了120多名值得信任的志愿者,他们中有大学生和非营利机构人士,在各地远程协助《民族报》数据团队进行录音听取工作。《民族报》还在编辑室里举办了四场“音频听取马拉松”(Audiothons),邀请部分志愿者前往参加,以更好地分享案件相关信息。
有些人士因常出现在媒体上,声音比较好认;但对大部分声音来说,听音很不容易;有一些让人模棱两可的声音,报纸会特别让志愿者网络和团队里对个别人物比较了解的“专家”来处理。
完成初步的分类整理后,《民族报》数据团队选出2,000多条包含潜在证据的音频进行再次听取,然后精选出两类:一是提供了新证据,二是为尼斯曼生前选作指控证据的音频补充了更多背景信息,以此建立了一个电子表格数据库。这样,数据记者就能在该表格上使用筛选功能输入关键词,调取相关信息。
团队还整理了一个电话号码指南,囊括了所有辨认出的号码。通过在电子表格上根据接收方号码*2747(移动电话公司的语音信箱号)进行筛选,听取语音信箱中的口信,记者便能得到拨出方号码及通话日期与时间,因为人们通常习惯在留口信时留下他们的姓名信息。
四、故事与呈现:新闻应用
2017年1月,在尼斯曼逝世两周年纪念之际,《民族报》在其全平台发表了特别报道《历时两年的尼斯曼监听分析》(Dos años de análisis de las escuchas de Nisman)。该报道包含四篇头版文章,披露在录音中发现的原始信息,包括曝光阿根廷政府及国会内部的游说者、涉嫌参与间谍活动的官员,及某场亲政府游行的背后金主等。
此外,团队还制作了一个新闻应用,根据人物和主题整理出169条录音音频供受众检索。为了避免断章取义的嫌疑,团队上传的是完整录音,但同时摘取了揭露关键信息的重要对话内容及其出现的时间点,便于受众选择性听取。点击听取任何一个对象或主题的录音,受众都可通过信息卡中的外部链接,阅读更多有关该人物或主题的信息,或向《民族报》提供报料。为使该平台能为未来跟进尼斯曼案所用,记者还可为人物和主题添加任何标签,建立单个播放列表。
据《民族报》介绍,他们所用到的数字工具还包括HTML、Javascript Isotope、 Wavesurfer.js、 Excel、XMind,以及谷歌表格和表单。
五、影响
该报道在阿根廷国内引起巨大反响,为推进尼斯曼案起到了重要作用。报道不仅一度跻身阿国社交媒体最热门话题之一,形成舆论影响,还提供了足以佐证尼斯曼指控的真实有力的证据。
联邦法官克劳迪奥·玻纳迪奥(Claudio Bonadio)申请以《民族报》报道作为对前外长埃克托尔·蒂梅尔曼(Héctor Timerman)的庭审证据,蒂梅尔曼被控在AMIA恐怖袭击事件中叛国。调查还引起了阿根廷安全部长帕特里夏·布里奇(Patricia Bullrich)的关注,她表示,《民族报》的积极调查弥补了司法部门的失职。
报道还有望推动进一步的调查,目前已有23名读者通过报道中的谷歌表单向记者提供了有关录音的更多新线索。
对《民族报》数据团队而言,这份调查让他们更加确信“没有不可能完成的项目”。有了坚韧的团队,正确的技术,良好的项目规划,全身心的投入,任何规模与形式的数据都有可能被转化为具有影响力的故事。
编译/梁思然
编辑/Ivan Zhai