在2023年,坚毅、团队合作、逐户敲门这些老派方法,依然是世界各地调查报道项目的主要技巧,即便是《纽约时报》就俄军在乌克兰小镇布查(Bucha)涉嫌犯下战争罪行的高科技视像取证调查过程也依赖这些老派技术——两位年轻记者 Yousur Al-Hlou 和 Masha Froliak 每家每户敲门,查询幸存者有没有记录和保存了去年3月俄军对当地侵略行动的手机视频。
然而在许多情况之下,开源工具可以为进一步追查新闻事件提供了线索,而通过传统新闻报道技巧取得的初步证据,也有赖开源工具来进一步验证和分析。此外,一些易于使用的大型工具,包括免费的数字工具广受欢迎,例如 Google 地球、Aleph 数据库、Boolean 搜索术语等。在过去一年,我们也看到拉丁美洲和非洲的记者愈来愈多地使用 PinPoint 等先进数据平台进行调查,例如 News24(南非的英语新闻网站)的《Silenced》系列报道——报道揭示了南非政府一位“吹哨人”如何因尝试揭穿贪污腐败丑闻而遭谋杀灭口。
精通先进电脑技术的记者都会同意——2023年的网站挖掘资源有显著的扩展,例如 DNSDB Scout、RiskIQ 等可以将 IP 地址和网域双向对应的“被动的 DNS 数据”历史工具。
不过,本篇文章要重点介绍的,是几款几乎任何记者都可以应用的工具。它们都是易于使用的数字解决方案,要么是在今年发布的全新工具、要么是在今年推出了新功能的旧工具,或者是在今年才被应用到调查报道的工具。
在2023调查记者与编辑大会(NICAR23)、第13届全球深度报道大会(GIJC23)等会议上取经,以及访问无数的获奖记者后,全球深度报道网(GIJN)为你介绍以下10款容易使用的调查工具和技术,或者你可以考虑在下一个调查项目中好好利用它们。
一、搜寻 LinkedIn 上潜在吹哨人的“空白键”
今年,线上调查专家 Henk van Ess 为 GIJN 撰写了包含7个章节的《线上调查指南》,其中详细介绍了在主流社交平台上进行搜索的数十个进阶提示和技巧。
在这一大堆技巧当中,Henk van Ess 提出的 LinkedIn“空白键”技巧可能是所有记者在日常工作上最能受惠的,因为这个技巧非常简单,而 LinkedIn 这个平台也愈来愈重要。原来,你只需要点击 LinkedIn 的空白搜寻格,先敲一下“空白键”,然后按下“Enter 键”,即可绕过 LinkedIn 平台的算法来集中搜寻人物。根据以上操作,平台页面会弹出一个“All filters”菜单,此时记者可以点击弹出的“People”选项卡,并且应用其他筛选过滤选项,在无需被算法重新定向之下直接挖掘搜索目标人物。
正如 Henk van Ess 在指南中提到,你也可以利用 LinkedIn 平台上的“Past Company(旧东家)”搜寻功能,寻找某家公司的前雇员。这些前雇员可能会愿意谈论和分享档案文件,或者能为你引荐目前仍然在职的“吹哨人”。另外,Henk van Ess 建议记者好好利用 LinkedIn 的各种“Consulting(咨询)”标签来寻找相关领域的顾问。
二、用于 Telegram 调查的“超级工具” Telepathy
俄罗斯入侵乌克兰以来,通信平台软件 Telegram 同时在相关的公共讨论和虚假信息传播中发挥了关键作用,说明了这个平台对记者之重要性正在与日俱增。一款全新的、由新闻工作者开发的工具 Telepathy 迅速被誉为“Telegram 工具类别中的瑞士军刀”,因为它不仅可以展示多个 Telegram 频道背后的关连,还有存档整个聊天记录、识别热门发文用户、收集频道成员清单等多项功能。虽然一些虚假信息调查专家会说 Telepathy 是一款“用户友好”工具,但安装和运行它确实要求有基本的开源电脑技能。另外,它有免费和收费两个级别。
在 GIJC23 上,虚假信息调查专家 Jane Lytvynenko 形容 Telepathy 是“一款建构在 Telegram 的 API 之上的超级工具,对于想要开始从事 Telegram 调查的记者来说是一款很好的工具”。她还建议记者使用 metadata2go.com 这一类网站,直接挖掘 Telegram 上的视频和图像。
其他值得信赖的、免费的 Telegram 调查工具包括 Tgstat,以及可以识别相关频道的 Google 捷径:“site:t.me/*”。
三、寻找电邮地址和手机号码关连的工具 Osint.industries
被问到“你正在使用的、最热门的挖掘工具”时,有组织犯罪与贪腐报道项目(OCCRP)的企业调查员 Lara Dihmis 明确地回答:“Osint.industries。”这是一款寻人工具,更是那种用来寻搜互联网上的自己时,搜索结果会让你毛骨悚然的工具。你可以输入一个电邮地址或电话号码,找出与其有关连的许多网站,甚至该个用户名称背后的真实身份及其数字足迹。“假如你手上有一个电话号码或电邮地址,能够找到任何与它相关连的注册账户,都会令人惊奇。”Lara Dihmis 说:“我会极力推荐这款工具,最棒的是它是免费的。”经过认证的记者可以通过 contact@osint.industries,要求获得这款工具的额外存取权限。
四、Aleph 的相互参照功能
许多数据记者都知道,Aleph 是由 OCCRP 创建的一款庞大的金钱流向追踪数据平台,也是一个泄密数据储存库。它包含了140多个国家的3.7亿条公共记录,包括银行对账单、制裁名单、法庭档案、公司电子邮件等,还设有一个用于即时专案的协作平台,不少独立媒体会利用它来挖掘故事线索和数据。
现在,Aleph 更新了一个相互参照工具——你可以在 Aleph 现存数以百计的数据集中,搜寻你感到兴趣的名称或公司。你只需要单击一下,然后等待平台花一分钟的时间进行计算,就可以找到跟你的目标主题相关的、出乎你意料之外的隐藏联系。要让搜寻过程得以正常运作,你在上载数据之前的确要整理好特定的格式。不过,OCCRP 最近发布了一份逐项检查表格,帮助用户使用这款工具。此外,OCCRP 还发布了一份详细的入门应用指南,解释如何在数据集中进行搜寻。
五、Bellingcat 的视频证据自动归档工具
公共新闻事件发生后,要迅速地从众多的社交平台下载相关的视频片段,可以是一件复杂、耗时和麻烦的事情。一些下载选项要求具备编码技能,也有一些帖文因为早已被发帖用户或平台移除,而令重新找出帖文并下载视频的时间变得十分长。为了解决这些问题,Bellingcat 的技术团队创建了一个自动归档系统,能让用户在数秒之间完成上述工作过程——你只需要复制帖文的 URL,将它贴到专用的 Google 表格中,然后⋯⋯就是这样!工具会自动就每个 URL 选择最理想的下载和存档策略,并且自行在背景执行下载,不妨碍你继续搜寻其他证据。此外,这款工具还使用了 Wayback Machine 作为备份。
Bellingcat 的调查技术团队负责人 Johanna Wild 表示:“我们在有关乌克兰的调查工作使用了它。你只需要复制粘贴来自 Telegram、TikTok、Twitter 等平台的视频和帖子的链接,将它们投进工作表格中,将能将它们存档。”应用这款工具,只需要在设定阶段具备一点电脑科学技能。记者(或者他们的 IT 部门同事)可以遵循这个网页底部的几个教学步骤,或者观看这段教学视频,来为这一款工具进行设定。
六、借助 Google 点评来追踪不良行为者的工具 Epieos
贴合人性的工具始终是 GIJN 最喜欢的类别,其中 Craig Silverman 的“Pub/UA”技巧就是一个很好的例子,它可以为你找出网站的幕后拥有者——你只需要在任何网站上右键点击一下,然后在 Control-F 字段中输入“pub”,便可以查看 Google 源代码中的 Adsense 识别码,了解从这个网站获取广告收益的是谁。这个方法之所以有效,是因为许多隐瞒其不良网站拥有权的人,都无法抗拒收取网站广告费,即便那只小微薄的收入。
同样地,事实证明许多受制裁的个人、寡头和其他不良行为者虽然一方面在掩藏他们的恶行,一方面却无法控制自己,非要在 Google 上发表他们在个人生活上对企业和餐厅的负评。因应他们的这种习惯,一款名为 Epieos 的新型反向电邮搜寻工具,以类似 Google 地图的呈现方式,提供某个用户的服务评论历史记录,例如显示他们曾经评论过某家餐厅的地点和时间。这款工具的创始人 Sylvain Hajri 告诉 GIJN,这款搜索引擎对调查记者来说特别有吸引力,因为它永远不会惊动被调查的用户,而且工具刻意不会保留记者的搜寻记录。不过,你确实需要调查对象的电邮地址来进行搜索,但你可以使用 Hunter.io 工具来“猜”一下这些电邮地址。
七、追踪走私路线的实惠 GPS 设备
一些新推出的 GPS 追踪设备既可靠、轻巧也廉价,它们令调查记者感到兴奋,同时陷入道德考虑。不过,这些设备的确已经成为揭示有组织犯罪分子走私货物和违禁品的活动和路线的有用工具。今年,瑞典顶尖调查节目《Mission Investigate》揭露了警方怠于关注的一种犯罪模式——节目发现有捐赠衣物和玩具经常从慈善箱中被盗,经调查发现了一批价值数百万欧元的捐赠物品的下落。调查团队将追踪设备 Yepzon 缝进衣物,并将衣物捐赠出去,进而通过手机应用程序,追踪到这批物品被运到了东欧。
据《Mission Investigate》记者在 GIJC23 研讨会上介绍,应用这些追踪设备时最需要注意的技巧,是了解设备的电池寿命,并基于电池特性设定你想达到的目标。如果你只想要追踪最终的目的地,那么你就应该启用设备的“休眠”模式,或者使用应用程序上的“历史视图”功能来查看追踪设备的过去运动摘要。
八、目标成为“万能的 CrowdTangle”的工具 Junkipedia
Junkipedia 最初是为监控虚假信息和“垃圾新闻”而设计的,但这款工具在迅速扩展功能之下,现已成为全球通用的社交媒体分析和挖掘引擎。除了一个有问题的社媒内容共享数据库,Junkipedia 现在还容许用户就12个社交媒体平台追踪并建立账户列表,包括 TikTok、Facebook、Telegram 等主流平台,以至 GETTR、Gab 等边缘网站。不过,Junkipedia 不像 CrowdTangle 那样拥有最全面的数据集,也无法存取 Facebook 的每一个公开页面,更无法对 LinkedIn 进行挖掘。然而,Junkipedia 是由“算法透明度研究所”(ATI)专门为记者开发的,也确实有记者参与开发过程,其不断扩充的功能都以调查新闻故事为目的,值得记者关注和探索。例如,很少有媒体有闲暇和“胃口”收听数十个小时的极右翼播客内容,Junkipedia 的英语播客自动转录功能正好派上用场,你还可以在其中搜寻一些常用术语。你可以使用所属机构的电邮地址,在此处登记申请这款工具。
九、用于林木砍伐调查的“全球森林观察”和 MapBiomas Alert 数据库
“全球森林观察”(Global Forest Watch)在过去九年持续发展,但最近有愈来愈多跑环境新闻条线以外的调查记者加入使用这款工具,并且将它转变成为一个开源平台,用于近乎实时地跟踪全球森林面貌的变化,以及识别跟森林变化模式有关连的不当行为。现在,“全球森林观察”有一个开源数据入口,以及一个免费的 MapBuilder 工具,让媒体可以将自家掌握的资料跟网站上可用的大量土地应用数据集整合在一起。
与此同时,自由调查记者 Fernanda Wenzel 在2023年使用了一款名为 MapBiomas Alert 的强大卫星工具,揭露了亚马逊地区隐蔽的土地掠夺行为。她为《The Intercept Brasil》撰写的新闻故事《Ladrões de Floresta(森林窃贼)》描述了土地掠夺者如何利用官僚体制的漏洞,掠夺面积相当于一个西班牙的“未指定的公共森林”。这个数据库还提供一个森林砍伐警报和座标,记者可以跟土地拥有权登记处的公开资料作相互参照,或者跟 EcoCrime Data 工具交叉应用,后者包含与畜牧场、非法采矿等相关的各种数据。
十、DocumentCloud 不断扩充的新功能
第一手信源文件管理平台 DocumentCloud 最近为数据记者添加了一系列不错的新功能。
在 NICAR23 上,MuckRock 基金会的开源数据学者 Sanjin Ibrahimovic 提到,DocumentCloud 社群(用户、研究员、记者等)在核心功能的基础上创建了附加元件,以解决他们在处理实际专案时遇到的问题。更好的是,正如 Sanjin Ibrahimovic 所说:“(DocumentCloud 的)开发意念,是规模较小的媒体也可以使用它,而不需要程式设计技能。”
新增附加元件包括:
- 自动搜寻和突出显示分散在庞大数据集中的个人可识别资讯(PII)的功能。这些资讯可能是你的新闻故事的线索,也可能是你想要排除的无用信息,包括电子邮箱地址、社会安全号码、邮政编码、信用卡号、地址等。
- Bad Redactions。这个附加功能可以在两个关键方面为记者提供帮助。它可以自动分析经过编辑的内容段落,并将分析结果显示在一个电子表单上,让你可以揭示某个机构想要隐藏的内容。另外,它也为你提供选项,让你手动完成编辑工作。
登入 DocumentCloud 需要先创建一个账户(最好是使用你所属机构的电子邮箱地址),然后通过快速验证步骤。若要存取其不断扩充的新功能库,你只需要点击一下“附加元件”,然后按一下“浏览所有附加元件”。
Rowan Philp 是全球深度报道网的资深记者,他也是南非媒体 Sunday Times 的前首席记者。作为一名驻外记者,他曾在全球20多个国家报道新闻、政治、腐败和冲突。