全球的調查記者們都在使用什麼工具?在「工具箱」這個欄目中,我們將邀請世界各地的調查記者和讀者們分享他們最愛使用的工具。

Proyecto Inventario 直觀地展示了古巴總統的官方 Twitter 賬號的社交關係圖表。照片。屏幕截圖
古巴的互聯網基礎設施建設和透明度都很差,這讓記者很難開展工作,有時甚至無法為報道找到最基本的數據。Maseda 曾在哈瓦那大學學習新聞,目前在英國伯明翰城市大學等地研究定量方法在新聞領域的應用。

Barbara Maseda在2018年創立了Proyecto Inventario。
她於2018年在斯坦福大學作為奈特新聞獎學金獲得者訪學期間,創立了 Proyecto Inventario 項目。該項目旨在讓獨立記者方便獲取關於古巴方方面面的數據和文件。
自從新冠疫情爆發以來,Proyecto Inventario 已經成為了解古巴病毒傳播的重要數據來源。他們將報告的病例轉化為結構化的數據,並按日期、地域和患者特徵進行了分類。Proyecto Inventario 公司所採用的 Flourish 平台可視化技術,也已經被古巴的一些小型媒體所採用。

Proyecto Inventario正在將古巴的新冠病毒傳播數據進行可視化。t
Maseda最近被選為 TED2020 獎學金成員,自己經營管理着 Proyecto Inventario,在社交媒體上回應記者們的請求,並計劃通過眾籌和捐助維持這一項目的運作。
以下是 Maseda 最喜歡的一些調查工具,以及她如何利用這些工具來克服古巴的數據報道困境。
Klaxon
在市面上眾多自動檢測網站變化的工具中,我們使用的是 Klaxon,這是一個由馬歇爾計劃(The Marshall Project)創建的工具。因為我們監測了很多網站,以及網頁的不同部分,Klaxon 提供的定製化和對細節的調控水準,讓我們能夠專註於很具體的元素,對我們來說非常好用。
這對於從事新聞業的人來說是很有用的,在古巴更是如此,因為大多數官方網站都不提供新聞訂閱服務。另外,獨立進行新聞采編在古巴也並不合法,所以記者與官方機構的媒體聯絡關係幾乎是不存在的。因此,自動監測官方網站的變化,無疑是我們以快速了解到官方發布了新消息最好的辦法之一。
例如,我們監測的網站之一就是古巴的法律資料庫。藉助 Klaxon,我們在一小時內就會收到新法規發布的通知,我們利用這一信息提醒采編人員,我們知道他們可能正在報道相關的新聞。
我們還會用 Klaxon 來作用數據爬蟲(scraper),如果你不會或是沒有時間自己部署爬蟲程序,Klaxon 可以作為替代品,儲存特定網站的數據。

Klaxon 可以用來監測政府網站的變化,從而快速了解官方發布的消息。
Sublime Text
我喜歡 Sublime Text 是因為它可以成為你電腦本地文件的一個搜索引擎。如果你有成百上千的文檔,你可以用它來尋找匹配的文件,如果你想學習如何做到這一點,可以閱讀 Friedrich Lindenberg 的精彩教程 A Poor Journalist’s Text Mining Toolkit(一個可憐記者的文本挖掘工具包)。
作為一名來自網絡信息閉塞國家的記者,我們的文件流通在很大程度上依賴於在U盤轉儲,所以它這是一個非常有用的工具。而即使是在信息豐富的情況下,它也很有用,只是在搜索一些文本格式時效果並不理想。
再舉一個例子,古巴的法律資料庫長期以來一直把 PDF 格式的法例文件壓縮成 RAR 格式發布。在這種情況下,一個好的解決方案是下載整個網站的資料,將所有內容轉換成更方便檢索的文件格式。

Sublime Text 允許你搜索成千上萬的文件,例如,搜索包含「電信」這一關鍵詞的相關法律。
Wayback Machine
Wayback Machine 是個人人都喜歡的工具,在一個公共記錄保存非常缺乏的國家,我們當然更喜歡它。在古巴,部分網頁甚至整個網站經常無法使用,因此有一個像 Wayback Machine 這樣的工具來查看網站緩存是非常寶貴的。
我們在數據完整性方面面臨的問題之一是,有時一些政府機構在發布新版本的數據集時,會刪除舊的記錄/條目。例如,新版的非農業合作社註冊記錄中沒有包含最近註銷的合作社記錄。我們利用 Wayback Machine 獲取了註冊記錄的歷史版本,並將所有不活躍或已註銷的合作社納入到數據集中,供記者以及其他有興趣的人查閱。
Wayback Machine 也可以是一個很好的第三方工具,把你擔心可能消失、或者被篡改的網站還原回來,這些網站對你的調查很關鍵。我們建立了一個數據集,記錄了古巴醫生在2018年底取消「更多醫生計劃」(Mais Médicos Program)後從巴西飛回古巴的所有航班,確保我們新聞報道中提到的醫務人員數據在 Wayback Machine 抓取的數據中都有跡可循。
視頻街景

使用「我的谷歌地圖」來整理你所找到的視頻。
嚴格來說,這不是一個工具,但對於古巴這樣沒法使用谷歌街景的地方來說,可能會很有用。我們在YouTube、Facebook、Twitter等社交媒體平台上找到了拍攝古巴街道的視頻,這些視頻通常都是長期生活在國外的古巴人回來探親時拍攝的,通常都是一些未經剪輯的懷舊場景或是曾經的上班路線,之後我們再在谷歌地圖上標註這些視頻的位置。
DocumentCloud
我們在 Proyecto Inventario 所做的工作的很大一部分是對文檔中的信息進行結構化處理,所以整合了多種文檔處理功能的 DocumentCloud 讓我們的工作變得更加輕鬆。
除了這些功能之外,我還喜歡它讓我能夠訪問其他用戶共享的文檔。在這些文檔中,有時我可以找到關於古巴的信息。搜索這些公開文件是一個很好的方法,可以找到更多關於古巴的細節,這些細節可能對分享這些文件的新聞編輯部或記者來說無關緊要,但它對我來說是非常重要的。

古巴電信公司(ETECSA)在 DocumentCloud 中公開文檔的搜索結果
Kumu.io
Kumu.io 可以將社交聯繫、公司結構等內容進行可視化。我們在工作中會做大量的社交網絡分析工作,你只要更新 Google Sheet 文檔,Kumu.io 就可以自動生成和更新社交關係圖表。
如果你從可用選項中選擇的數據源類型是這樣的,那麼Kumu.io的網絡地圖可以很方便地嵌入和更新,只需更新包含地圖背後的數據的公共 Google Sheet 文檔,就可以輕鬆地生成和更新社交關係圖表。
Kristina Puga 是一名紐約記者。她為NBCNews.com撰稿,關注美國的拉丁裔社區。她還創辦了 WiserWithAge.com,採訪一些60歲以上的人士,將他們的智慧傳遞給年輕一代。