人臉識別以外,調查記者還應用到哪些尖端科技呢?

Print More

English

在 #GIJC23 的一場研討會上,討論了人臉識別等尖端科技和工具可以如何幫助調查報道。圖:Wiktoria Gruca, GIJN

調查新聞事業的蓬勃發展,有賴於傳統調查技術和尖端科技工具的結合。在這個格局發展快速的領域,擁有最好的技術和工具,可以幫助媒體和記者保持領先位置,並且講述具影響力的新聞故事。

在第13屆全球深度報道大會 #GIJC23 一場關於尖端科技調查技術的研討會上,dataLEADS 首席執行官 Syed Nazakat、有組織犯罪及貪腐報道計劃(OCCRP)研究項目負責人 Karina Shedrofsky 和國際調查記者同盟(ICIJ)培訓經理 Jelena Cosic 討論了他們最近進行的調查,以及他們最喜愛使用的方法和工具,包括人臉識別服務、檔案分類工具等。

超越人臉識別

Karina Shedrofsky 以她的一項最新調查項目——涉及俄羅斯教師的加密貨幣騙局,來展示她如何應用她最喜歡的調查工具。她只有一張可疑目標人物的照片,其他什麼線索都沒有,於是她利用 PimEyes 入手進行人臉識別。PimEyes 是一項具有人臉識別功能的反向影像搜尋服務。

OCCRP 的 Karina Shedrofsky 介紹了她最近進行的一些調查,以及過程中應用到的人臉識別技術。圖:Smaranda Tolosano, GIJN

PimEyes 反饋了可能源於目標人物的大量結果和連結,包括一個人名和另一張照片。Karina Shedrofsky 於是轉向使用亞馬遜的工具 Rekognition(可以比較兩張照片上的人臉,辨認兩張臉是否屬於同一個人),並且得到98%吻合的結果。不過,Karina Shedrofsky 強調了反覆驗證人臉識別結果之重要,即使這些工具的辨識結果可信度非常高,但也有失敗或出錯的機會。

在另一次調查案例中,PimEyes 沒有給 Karina Shedrofsky 反饋任何結果,於是她轉嚮應用 search4faces。那是一項專門為俄羅斯流行社交媒體平台 VKontakte 建立索引的服務。這一次,她得到了所需要的搜索結果。

Karina Shedrofsky 分享的第三個調查案例中,她提到一名商人被指充當一名受制裁的俄羅斯寡頭的代理人。一名記者曾經跟這名商人的兒子交談,但對方否認商人是他的父親。記者於是請 Karina Shedrofsky 幫忙,希望證實兩人的關係。

Karina Shedrofsky 所知道的信息,包括該名商人及其兒子的全名、兒子的出生日期,以及兒子工作的單位——俄羅斯一家主要國有銀行。這一次,她使用了 Pipl。這是一款擅於將人們的現實存在和線上足跡結合的工具,只要輸入電郵地址、電話號碼等信息,就可以得出目標人物的社交媒體賬號、實際地址等。

由於該名兒子有一個相當平凡的名字,Pipl 給出了許多的搜尋結果,包括一封帶有銀行網域的電子郵件。由此,Karina Shedrofsky 找到了一個她認為屬於該名兒子的 Facebook 賬號,但那是一個沒有任何資訊的私人賬號。當調查似乎走進了一個死胡同,Karina Shedrofsky 再次使出了她所知道的一個重要調查技巧——即使是 Facebook 私人賬號,你仍然可以通過單擊個人資料頁面右上角的三點圖標,搜尋賬號時間軸上公開發布過的所有內容。

Karina Shedrofsky 搜尋了她能聯想到的所有東西,例如生日、相關人名等。她發現,在她所知的該名兒子的生日日期當天,該個 Facebook 私人賬號也收到了生日祝福信息。

至此,Karina Shedrofsky 已經非常有信心,認定找到了正確的賬號。通過搜尋關鍵詞“love”,她進一步找到該名兒子的妻子之名字。通過在 Google 上搜尋他們的姓氏和名字,她找到一家攝影公司的網站,上面有他們的結婚照片。驚喜地,該公司發布了整個婚禮相冊,讓 Karina Shedrofsky 發現了一張照片,裡面有懷疑是兒子父親的那一名商人。藉助 PimEyes 的辨識和反向搜圖功能,Karina Shedrofsky 找到了匹配的照片。

Karina Shedrofsky 表示,她近期最喜歡使用的工具,除了 OCCRP 的 Aleph database,就是 OpenCorporates。此外,她也喜歡使用聯絡信息應用程序,例如 TruecallerRocketreach

老派技術與尖端工具

來自國際調查記者同盟(ICIJ)的 Jelena Cosic 表示,她經常會結合使用老派技術和現代工具。她介紹了 ICIJ 一項關於森林砍伐的最新跨境調查項目。該項目揭露了一些取得環境認證、標榜業務推動“可持續發展”的企業,實際上被指控從事破壞森林和侵犯人權的生意。這不是一項簡單的調查項目,Jelena Cosic 及其調查團隊必須使用大量的信源來自行建立數據庫,這些信源包括:

  • 發出環境認證的機構和審核員;
  • 《歐盟木材法規》(EUTR)依國家列出的違規行為清單;
  • 非政府組織針對破壞環境行為所作出的舉報,以及相關的官方報告;
  • ImportGenius 上的貿易資料;
  • 自由資訊(FOIs)、企業文件、市場行銷資料、法庭文件等;
  • 通過 Orbis 和 Factiva 存取到的母公司資料。

調查團隊需要將這些數據都整理到一起,建立起單一的主數據庫,以便存取資訊。Jelena Cosic 強調了在展開此類調查之前就確定好研究方法之重要。

Jelena Cosic 表示,她一直以來最喜愛的工具是 ICIJ 的 Datashare。那是一款可能運行 OCR(光學字元辨識)技術的工具,能讓上傳的文檔可以被搜尋。它還可以按人物、組織、位置等自動檢測和過濾文檔,從而提升搜尋效率。

充滿不確定性

Karina Shedrofsky 和 Jelena Cosic 都承認調查新聞事業正面臨許多挑戰。前者觀察認為,這個領域是“more art than science(大意是指充滿不確定性,只能靠經驗直覺來進行)”,而且不斷發生變化。她警告:“要保持領先於持續進化的犯罪行為,是一項持續的挑戰。”

至於 Jelena Cosic,她點出了從中國獲取信息的困難、歐盟資料保護法規(GDPR)的限制,以至瀏覽離岸數據和網域註冊的複雜性。

不過,他們都指出有一些方法可以克服困難,保持調查記者的領先地位。以下是他們給予調查記者的一些建議:

  • 電子試算表是你的最佳朋友,利用試算表來組織你的數據;
  • 尋求數據專家的指導,以進行有效的資料管理;
  • 對下載到的文件作出標籤,並將它們分類組織到不同的文件夾里;
  • 探索 Chrome 的插件,用它們來擷取整個網頁,並且使用 Wayback Machine 的插件來保存搜尋記錄;
  • 對大量文檔建立起架構,善有標籤來作有效的分類;
  • 使用有雙重加密的開源平台來進行安全的協作;
  • 充份認識到調查新聞事業中,多元化技能和背景的價值。
Print Friendly, PDF & Email

發表回復

您的電子郵箱地址不會被公開。 必填項已用 * 標註