2023年 GIJN 精選10大調查工具

Print More

English

在2023年,堅毅、團隊合作、逐戶敲門這些老派方法,依然是世界各地調查報道項目的主要技巧,即便是《紐約時報》就俄軍在烏克蘭小鎮布查(Bucha)涉嫌犯下戰爭罪行的高科技視像取證調查過程也依賴這些老派技術——兩位年輕記者 Yousur Al-HlouMasha Froliak 每家每戶敲門,查詢倖存者有沒有記錄和保存了去年3月俄軍對當地侵略行動的手機視頻。

然而在許多情況之下,開源工具可以為進一步追查新聞事件提供了線索,而通過傳統新聞報道技巧取得的初步證據,也有賴開源工具來進一步驗證和分析。此外,一些易於使用的大型工具,包括免費的數字工具廣受歡迎,例如 Google 地球、Aleph 數據庫Boolean 搜索術語等。在過去一年,我們也看到拉丁美洲和非洲的記者愈來愈多地使用 PinPoint 等先進數據平台進行調查,例如 News24(南非的英語新聞網站)的《Silenced》系列報道——報道揭示了南非政府一位“吹哨人”如何因嘗試揭穿貪污腐敗醜聞而遭謀殺滅口。

精通先進電腦技術的記者都會同意——2023年的網站挖掘資源有顯著的擴展,例如 DNSDB ScoutRiskIQ 等可以將 IP 地址和網域雙向對應的“被動的 DNS 數據”歷史工具。

不過,本篇文章要重點介紹的,是幾款幾乎任何記者都可以應用的工具。它們都是易於使用的數字解決方案,要麼是在今年發布的全新工具、要麼是在今年推出了新功能的舊工具,或者是在今年才被應用到調查報道的工具。

在2023調查記者與編輯大會(NICAR23)、第13屆全球深度報道大會(GIJC23)等會議上取經,以及訪問無數的獲獎記者後,全球深度報道網(GIJN)為你介紹以下10款容易使用的調查工具和技術,或者你可以考慮在下一個調查項目中好好利用它們。

一、搜尋 LinkedIn 上潛在吹哨人的“空白鍵”

今年,線上調查專家 Henk van Ess 為 GIJN 撰寫了包含7個章節的《線上調查指南》,其中詳細介紹了在主流社交平台上進行搜索的數十個進階提示和技巧。

在這一大堆技巧當中,Henk van Ess 提出的 LinkedIn“空白鍵”技巧可能是所有記者在日常工作上最能受惠的,因為這個技巧非常簡單,而 LinkedIn 這個平台也愈來愈重要。原來,你只需要點擊 LinkedIn 的空白搜尋格,先敲一下“空白鍵”,然後按下“Enter 鍵”,即可繞過 LinkedIn 平台的算法來集中搜尋人物。根據以上操作,平台頁面會彈出一個“All filters”菜單,此時記者可以點擊彈出的“People”選項卡,並且應用其他篩選過濾選項,在無需被算法重新定向之下直接挖掘搜索目標人物。

正如 Henk van Ess 在指南中提到,你也可以利用 LinkedIn 平台上的“Past Company(舊東家)”搜尋功能,尋找某家公司的前僱員。這些前僱員可能會願意談論和分享檔案文件,或者能為你引薦目前仍然在職的“吹哨人”。另外,Henk van Ess 建議記者好好利用 LinkedIn 的各種“Consulting(諮詢)”標籤來尋找相關領域的顧問。

二、用於 Telegram 調查的“超級工具” Telepathy

俄羅斯入侵烏克蘭以來,通信平台軟件 Telegram 同時在相關的公共討論和虛假信息傳播中發揮了關鍵作用,說明了這個平台對記者之重要性正在與日俱增。一款全新的、由新聞工作者開發的工具 Telepathy 迅速被譽為“Telegram 工具類別中的瑞士軍刀”,因為它不僅可以展示多個 Telegram 頻道背後的關連,還有存檔整個聊天記錄、識別熱門發文用戶、收集頻道成員清單等多項功能。雖然一些虛假信息調查專家會說 Telepathy 是一款“用戶友好”工具,但安裝和運行它確實要求有基本的開源電腦技能。另外,它有免費和收費兩個級別。

在 GIJC23 上,虛假信息調查專家 Jane Lytvynenko 形容 Telepathy 是“一款建構在 Telegram 的 API 之上的超級工具,對於想要開始從事 Telegram 調查的記者來說是一款很好的工具”。她還建議記者使用 metadata2go.com 這一類網站,直接挖掘 Telegram 上的視頻和圖像。

其他值得信賴的、免費的 Telegram 調查工具包括 Tgstat,以及可以識別相關頻道的 Google 捷徑:“site:t.me/*”。

三、尋找電郵地址和手機號碼關連的工具 Osint.industries

被問到“你正在使用的、最熱門的挖掘工具”時,有組織犯罪與貪腐報道項目(OCCRP)的企業調查員 Lara Dihmis 明確地回答:“Osint.industries。”這是一款尋人工具,更是那種用來尋搜互聯網上的自己時,搜索結果會讓你毛骨悚然的工具。你可以輸入一個電郵地址或電話號碼,找出與其有關連的許多網站,甚至該個用戶名稱背後的真實身份及其數字足跡。“假如你手上有一個電話號碼或電郵地址,能夠找到任何與它相關連的註冊賬戶,都會令人驚奇。”Lara Dihmis 說:“我會極力推薦這款工具,最棒的是它是免費的。”經過認證的記者可以通過 contact@osint.industries,要求獲得這款工具的額外存取權限。

四、Aleph 的相互參照功能

許多數據記者都知道,Aleph 是由 OCCRP 創建的一款龐大的金錢流向追蹤數據平台,也是一個泄密數據儲存庫。它包含了140多個國家的3.7億條公共記錄,包括銀行對賬單、制裁名單、法庭檔案、公司電子郵件等,還設有一個用於即時專案的協作平台,不少獨立媒體會利用它來挖掘故事線索和數據。

現在,Aleph 更新了一個相互參照工具——你可以在 Aleph 現存數以百計的數據集中,搜尋你感到興趣的名稱或公司。你只需要單擊一下,然後等待平台花一分鐘的時間進行計算,就可以找到跟你的目標主題相關的、出乎你意料之外的隱藏聯繫。要讓搜尋過程得以正常運作,你在上載數據之前的確要整理好特定的格式。不過,OCCRP 最近發布了一份逐項檢查表格,幫助用戶使用這款工具。此外,OCCRP 還發布了一份詳細的入門應用指南,解釋如何在數據集中進行搜尋。

五、Bellingcat 的視頻證據自動歸檔工具

公共新聞事件發生後,要迅速地從眾多的社交平台下載相關的視頻片段,可以是一件複雜、耗時和麻煩的事情。一些下載選項要求具備編碼技能,也有一些帖文因為早已被發帖用戶或平台移除,而令重新找出帖文並下載視頻的時間變得十分長。為了解決這些問題,Bellingcat 的技術團隊創建了一個自動歸檔系統,能讓用戶在數秒之間完成上述工作過程——你只需要複製帖文的 URL,將它貼到專用的 Google 表格中,然後⋯⋯就是這樣!工具會自動就每個 URL 選擇最理想的下載和存檔策略,並且自行在背景執行下載,不妨礙你繼續搜尋其他證據。此外,這款工具還使用了 Wayback Machine 作為備份。

Bellingcat 的調查技術團隊負責人 Johanna Wild 表示:“我們在有關烏克蘭的調查工作使用了它。你只需要複製粘貼來自 Telegram、TikTok、Twitter 等平台的視頻和帖子的鏈接,將它們投進工作表格中,將能將它們存檔。”應用這款工具,只需要在設定階段具備一點電腦科學技能。記者(或者他們的 IT 部門同事)可以遵循這個網頁底部的幾個教學步驟,或者觀看這段教學視頻,來為這一款工具進行設定。

六、藉助 Google 點評來追蹤不良行為者的工具 Epieos

貼合人性的工具始終是 GIJN 最喜歡的類別,其中 Craig Silverman 的“Pub/UA”技巧就是一個很好的例子,它可以為你找出網站的幕後擁有者——你只需要在任何網站上右鍵點擊一下,然後在 Control-F 字段中輸入“pub”,便可以查看 Google 源代碼中的 Adsense 識別碼,了解從這個網站獲取廣告收益的是誰。這個方法之所以有效,是因為許多隱瞞其不良網站擁有權的人,都無法抗拒收取網站廣告費,即便那隻小微薄的收入。

同樣地,事實證明許多受制裁的個人、寡頭和其他不良行為者雖然一方面在掩藏他們的惡行,一方面卻無法控制自己,非要在 Google 上發表他們在個人生活上對企業和餐廳的負評。因應他們的這種習慣,一款名為 Epieos 的新型反向電郵搜尋工具,以類似 Google 地圖的呈現方式,提供某個用戶的服務評論歷史記錄,例如顯示他們曾經評論過某家餐廳的地點和時間。這款工具的創始人 Sylvain Hajri 告訴 GIJN,這款搜索引擎對調查記者來說特別有吸引力,因為它永遠不會驚動被調查的用戶,而且工具刻意不會保留記者的搜尋記錄。不過,你確實需要調查對象的電郵地址來進行搜索,但你可以使用 Hunter.io 工具來“猜”一下這些電郵地址。

七、追蹤走私路線的實惠 GPS 設備

一些新推出的 GPS 追蹤設備既可靠、輕巧也廉價,它們令調查記者感到興奮,同時陷入道德考慮。不過,這些設備的確已經成為揭示有組織犯罪分子走私貨物和違禁品的活動和路線的有用工具。今年,瑞典頂尖調查節目《Mission Investigate》揭露了警方怠於關注的一種犯罪模式——節目發現有捐贈衣物和玩具經常從慈善箱中被盜,經調查發現了一批價值數百萬歐元的捐贈物品的下落。調查團隊將追蹤設備 Yepzon 縫進衣物,並將衣物捐贈出去,進而通過手機應用程序,追蹤到這批物品被運到了東歐。

據《Mission Investigate》記者在 GIJC23 研討會上介紹,應用這些追蹤設備時最需要注意的技巧,是了解設備的電池壽命,並基於電池特性設定你想達到的目標。如果你只想要追蹤最終的目的地,那麼你就應該啟用設備的“休眠”模式,或者使用應用程序上的“歷史視圖”功能來查看追蹤設備的過去運動摘要。

八、目標成為“萬能的 CrowdTangle”的工具 Junkipedia

Junkipedia 最初是為監控虛假信息和“垃圾新聞”而設計的,但這款工具在迅速擴展功能之下,現已成為全球通用的社交媒體分析和挖掘引擎。除了一個有問題的社媒內容共享數據庫,Junkipedia 現在還容許用戶就12個社交媒體平台追蹤並建立賬戶列表,包括 TikTok、Facebook、Telegram 等主流平台,以至 GETTR、Gab 等邊緣網站。不過,Junkipedia 不像 CrowdTangle 那樣擁有最全面的數據集,也無法存取 Facebook 的每一個公開頁面,更無法對 LinkedIn 進行挖掘。然而,Junkipedia 是由“算法透明度研究所”(ATI)專門為記者開發的,也確實有記者參與開發過程,其不斷擴充的功能都以調查新聞故事為目的,值得記者關注和探索。例如,很少有媒體有閑暇和“胃口”收聽數十個小時的極右翼播客內容,Junkipedia 的英語播客自動轉錄功能正好派上用場,你還可以在其中搜尋一些常用術語。你可以使用所屬機構的電郵地址,在此處登記申請這款工具。

九、用於林木砍伐調查的“全球森林觀察”和 MapBiomas Alert 數據庫

“全球森林觀察”(Global Forest Watch)在過去九年持續發展,但最近有愈來愈多跑環境新聞條線以外的調查記者加入使用這款工具,並且將它轉變成為一個開源平台,用於近乎實時地跟蹤全球森林面貌的變化,以及識別跟森林變化模式有關連的不當行為。現在,“全球森林觀察”有一個開源數據入口,以及一個免費的 MapBuilder 工具,讓媒體可以將自家掌握的資料跟網站上可用的大量土地應用數據集整合在一起。

與此同時,自由調查記者 Fernanda Wenzel 在2023年使用了一款名為 MapBiomas Alert 的強大衛星工具,揭露了亞馬遜地區隱蔽的土地掠奪行為。她為《The Intercept Brasil》撰寫的新聞故事《Ladrões de Floresta(森林竊賊)》描述了土地掠奪者如何利用官僚體制的漏洞,掠奪面積相當於一個西班牙的“未指定的公共森林”。這個數據庫還提供一個森林砍伐警報和座標,記者可以跟土地擁有權登記處的公開資料作相互參照,或者跟 EcoCrime Data 工具交叉應用,後者包含與畜牧場、非法採礦等相關的各種數據。

十、DocumentCloud 不斷擴充的新功能

第一手信源文件管理平台 DocumentCloud 最近為數據記者添加了一系列不錯的新功能。

在 NICAR23 上,MuckRock 基金會的開源數據學者 Sanjin Ibrahimovic 提到,DocumentCloud 社群(用戶、研究員、記者等)在核心功能的基礎上創建了附加元件,以解決他們在處理實際專案時遇到的問題。更好的是,正如 Sanjin Ibrahimovic 所說:“(DocumentCloud 的)開發意念,是規模較小的媒體也可以使用它,而不需要程式設計技能。”

新增附加元件包括:

  • 自動搜尋和突出顯示分散在龐大數據集中的個人可識別資訊(PII)的功能。這些資訊可能是你的新聞故事的線索,也可能是你想要排除的無用信息,包括電子郵箱地址、社會安全號碼、郵政編碼、信用卡號、地址等。
  • Bad Redactions。這個附加功能可以在兩個關鍵方面為記者提供幫助。它可以自動分析經過編輯的內容段落,並將分析結果顯示在一個電子錶單上,讓你可以揭示某個機構想要隱藏的內容。另外,它也為你提供選項,讓你手動完成編輯工作。

登入 DocumentCloud 需要先創建一個賬戶(最好是使用你所屬機構的電子郵箱地址),然後通過快速驗證步驟。若要存取其不斷擴充的新功能庫,你只需要點擊一下“附加元件”,然後按一下“瀏覽所有附加元件”。


Rowan Philp, senior reporter, GIJN

Rowan Philp 是全球深度報道網的資深記者,他也是南非媒體 Sunday Times 的前首席記者。作為一名駐外記者,他曾在全球20多個國家報道新聞、政治、腐敗和衝突。

Print Friendly, PDF & Email

發表回復

您的電子郵箱地址不會被公開。 必填項已用 * 標註