记者有不同的方法来寻找有助于调查的开源工具。一个最简单的途径就是去找那些通常受到记者们信任的、开发成熟的工具。例如:
- 用于安全通讯的工具: Signal, Protonmail, VeraCrypt.
- 用于提取数据的工具: Google Pinpoint, Tesseract, Google Sheets.
- 用于视觉取证的工具: Google Earth Pro, TweetDeck, and youtube-dl.
- 用于社交媒体分析的工具: WeVerify Twitter SNA, NodeXL, and CrowdTangle.
如果想要寻找围绕特定主题或功能的工具,一种不错的方法是浏览相应的工具仪表盘——例如,BBC 非洲之眼的调查仪盘,Marc Kranat OSINT 仪表盘,或是 Craig Silverman 的事实核查手册。
如果你需要新技术或工具的应用案例,另一个很好的选择是搜索或浏览 GIJN 资源库和 GIJN 工具箱系列。
但在很多时候,记者可能是很偶然地发现了一个工具,无论这个工具是全新的还是为人所熟知的,而这个工具的表现超出了自己原本的预期,并成为了他们最喜爱使用的工具。
在这篇文章中,我们邀请了来自不同国家的八名调查记者分享了他们今年发现的最有用的工具或开源资源。
Malina McLennan 和 Nimra Shahid — 全球见证(Global Witness) 的调查员
McLennan: “最近,我一直在使用 4cat 社交数据采集平台,创建社交媒体上帖文的数据集,以确定调查范围和研究新线索。我还使用 Visualping,当你监测的网站更新时,它会向你发出通知——这样的监测对于那些不经常更新的网站来说是很有意义的。
她还补充说:“这可能有点答非所问,但到目前为止,我觉得最有趣的是提高我自己在地理信息系统 QGIS 上的技能,并弄清楚如何为我们组织即将进行的一些调查创建地理空间数据文件。”
另一个深受记者喜爱的企业网站监测工具是 Trackly,它允许免费监测有限数量的 URL,并对投资者关系网页的变化发出通知,并且包括公司希望不被注意的一些强制性披露。
Shahid: “我目前最常用的调查工具是 Refinitiv Eikon,它是一个实时的金融数据分析工具,它的基本订阅费用是每月约300美元。”事实证明,在调查森林砍伐和大公司之间的联系时,对于资金的追踪是非常有价值的,这些公司并不总是随时公开披露与其交易有关的信息。另外,Refinitiv 围绕大宗商品的数据对调查与化石燃料有关的供应链也有极大的帮助。”
Axel Gordh Humlesjö — 瑞典公共广播公司(SVT)的调查记者
Humlesjö 说:“记者们使用得不够充分的一个开源数据库是英国公司注册处(Companies House UK),它对所有涉及到洗钱的调查至关重要。因为多年来,英国所属的群岛是离岸公司的避税天堂,那些开设在伦敦的 LLP 公司(有限责任合伙公司)可以给设在开曼群岛或巴哈马等地的公司充当一个看似体面的幌子。”
他补充说:“在获取基础文件的意义上,英国公司注册处的数据库是简明和操作友善的,你可以很容易知道一个公司是真的还是假的。这个数据库是免费的,如果你发现一个可疑的有限责任公司的所有者,你就可以把这个名字输入数据库,然后就可以看到这个人持股的所有公司。另外,追踪海运数据的 MarineTraffic 也是非常出色的工具,它帮助我们完成了好几个报道,包括一个在中美洲采矿的故事。”
David McSwane — ProPublica 的调查记者
“对于联系人,我使用 Hiretual(也被称为 hireEZ,其中包括有限的免费服务)。这是一个 Chrome 扩展,如果你进入某人的 LinkedIn 页面,可以借由它找到他们的个人电子邮件地址,有时甚至是电话号码。我直到几年前才知道它,而这是一个非常好的找人方法。”
“对于处理记录,我使用 Tableau,DocumentCloud 也很棒。对于搜索,我会在不同的引擎中进行同样的搜索。人们常常会忘记,如果你使用不同的引擎,就会得到不同的结果,因为它们的索引方式不同,所以偶尔我会使用 Ask Jeeves、DuckDuckGo 或者 Bing 来进行搜索。”
McSwane 还指出,通常由书籍作者使用的写作工具 Scrivener,可以成为复杂内容或连续调查的写作工具。虽然它需要一次性付费才能使用,但它的索引功能可以在“卡片”中显示与每个事件或采访有关的内容,使得记者可以轻松地为系列报道中的每个故事移动引语和证据。
“在这个程序中,你可以在各个章节中跳来跳去;我可以看一下原始记录,找到我需要的引文,不会错过任何东西。我发现它是一种灵活的方式,让你可以在写作时浏览大量的材料。但如果你和另一个城市的其他记者一起工作,或者想和编辑一起协作,那么 Scrivener 可能并不是一个理想的工具。”
McSwane 补充说:“我们需要一个好的开源社交网络分析工具,我真的很怀念几年前关闭的 Google Fusion Tables — 它是一个非常精简、易于理解的工具。你可以去透过它建立调查对象之间的关系。
Martha Mendoza — 美联社(Associated Press)调查记者,普利策奖获得者
“在过去一年中,我意外地发现自己经常使用的一个工具是 Pigeonly,这是一个由曾被监禁过的人创办的项目。美国有囚犯定位器,但你必须知道他们处于哪个系统中。Pigeonly 的创始人创建了一个应用程序,家庭成员可以在其中找到他们的亲人。如果你想发送照片和沟通,每月就需要支付大约11美元,但该网站也提供一个免费的囚犯定位器,而且细致程度远高于我之前所见的任何东西,其中包括了县级设施、联邦设施等等。如果你正在寻找来自其他国家的被监禁在美国的人,例如来自德里或东京的人,你也可以在这里找到他们。你只要输入名字就可以,它将有提供被搜索对象的种族和年龄。”
Mendoza 补充说。“我目前最喜欢的另一个工具是基于订阅的、CNSplus 法院新闻的搜索功能。在美国,PACER 是针对我们的联邦法院系统,但如果你在州系统中寻找,你必须知道案件在哪个法院。但 CNSplus 尽可能多地从州和联邦法院收集信息。我可以只用 “N95” 这样的词来搜索,就能找到很多诉讼、刑事案件和假货案件。搜索结果会给我一个案件的简要描述、案件编号,以及它在哪个法院,然后我就可以去那个法院的网站找到相应的文件。
Anastasia Valeeva — 马歇尔计划的研究员,曾是吉尔吉斯斯坦“数据学校”(School of Data )的记者
“我认为 Tabula 现在已经成为许多数据记者的首选工具,它是一个免费的工具,可以提取PDF 格式中的数据表格,也可以自动检测电脑屏幕上的表格。与我们使用的许多工具不同,它是专门为记者创建的。政府很多时候提供的都是 PDF 格式的文件,而不是表格,所以你需要这样的工具,而不是花很多时间来要求他们发送表格。Tabula 非常简洁易用,使用它不需要任何编程知识。”
“我最喜欢的数据库是我们为所有中亚国家创建的数据库,它被称为 OpenData.kg,包含大约200个数据集,并且一直在增加。议会的记录、公共招标、学校状况等等都涵盖其中。我们把这些数据库放在一起,并邀请人们继续贡献,所有记者都可以使用它。”
Rosa Furneaux — 调查新闻局(The Bureau of Investigative Journalism)的医疗健康记者
“我目前最喜欢的工具是 Panjiva,它是一个人工智能驱动的供应链信息平台,拥有800万家公司和超过10亿条货运记录的数据。我对医疗供应链非常感兴趣,如果没有 Panjiva,我正在做的报道就不可能做成。不太好的是,它很贵,它的定价是每月 999 美元,无限制查询,或者每年10000美元。不过,在没有订阅的情况下,你也可以通过 Google 搜索找到单个的 Panjiva 数据点,在你的想要搜索的数据后面加上 site:panjiva.com 就可以。”
“一般来说,我们想要的数据库并不真正存在,所以我们必须从头开始制作,或者从已有的数据库中拼凑出你需要的数据,我做的最后一项调查是关于 COVAX 的——这个组织希望在全世界范围内公平地分配疫苗,但我发现大多数国家都没有中央数据库显示你已经发放了多少疫苗,以及发去了哪里。”
Vladimir Thorik — 调查新闻机构 RISE Moldova 的俄语编辑
今年早些时候,Thorik 发现了三个免费的拨号应用在识别非法招募摩尔多瓦公民加入俄罗斯武装部队方面特别有用。这项招募涉及到街头广告和 Telegram 帖文,其中有招募者的电话联系方式。
“我在对于俄罗斯雇佣军招募摩尔多瓦公民加入的调查中使用了一些很酷的工具。这些雇佣军位于俄罗斯占领的德涅斯特河地区。通过免费的应用程序:Eyecon、Truecaller 和 Getcontact,你可以找到那些招募者的电话号码,而 Getcontact 在识别拥有俄罗斯手机号码的用户方面非常有效。”
Thorik 的团队拨打了招募者的号码,假装对加入雇佣军感兴趣,他们还使用了各种 Telegram 机器人,我们也在另一篇文章中报道了这些机器人的用法。
Rowan Philp 是全球深度报道网的记者。他曾是南非《星期天时报》(Sunday Times)的首席记者。作为一名驻外特派员,他报道过全球20多国的新闻、政治、贪腐和冲突事件。