
在線調查專家 Paul Myers. 圖片:Nina Weymann Schulz (nina-weymann-schulz.com)
當 BBC 的在線調查專家 Paul Myers 將某位知名人物的個人信息用投影展示的時候,整個會場的人都發出了驚嘆聲。
他剛剛找到了7個電話號碼,8個電子郵箱地址,以及其他許多個人隱私細節——這些信息全部屬於全英國最有名、也最受保護的名人之一(Myers 要求不公開此人姓名)。
而 Myers 只花了短短三分鐘,用兩個搜索工具就做到了這一切。
不過,當 Myers 用一般方法搜索 BBC 網站域名所有者的信息時,得到的結果卻是「根據隱私條例不予顯示」,現場又傳來失望的嘆息聲——大家本來預期的是,這種信息是最容易獲取的。
這兩次搜索就像 Myers 在這次工作坊傳達出的中心思想:即便新鮮強大、不斷湧現的數字工具能夠讓受過訓練、富有耐心的人挖掘出藏在地表以下的數據,然而新的法律、公司的限制,以及全球範圍內對於隱私保護的運動,這些都將數量龐大的數據庫從記者能夠接觸到的範圍內被隱藏了。
然後就是歐盟國家去年開始實施的《通常數據保護規定》(GDPR)。這個規定的影響無處不在,例如它讓谷歌不得不停用了一些搜索功能,也讓臉書停用了社交圖譜搜索(Graph Search)功能。
這對於罪犯或是貪官來說可能是個好消息,因為這樣一來他們就能更容易地逃過偵查——當然,記者們也都是非常「狡猾」的,Myers 說,而且他們明白怎麼能遊走在灰色地帶的邊緣,甚至漂亮地繞開有些限制。
為了高效地完成搜查檢索,記者除了使用高階編程與付費服務以外,Myers 還強調了基礎工具與好奇心的重要性。拿一張 Paul Whelan(疑似美國間諜,目前被拘於俄羅斯)的臉書相片舉例說明:相片上面 Paul Whelan 在一架飛行機中。Myers 希望知道當時 Whelan 當時身在何處,隨後注意到 Whelan 腦後可以看見有一張灰暗模糊的飛行地圖,上面依稀可辨有「Georgian」的字樣以及河口的海岸線。於是他在網上找到了沒有被裁剪的版本,將圖片用 Photoshop 打開,調整對比度與亮度,然後就是見證奇蹟的時刻了——Myers 從 Whelan 身後的地圖上辨認出了他正飛往的目的地是密歇根。

2019年9月25日,Paul Myers 在漢堡的全球深度報道大會上帶領在線搜查的工作坊。 圖片:Nick Jaussi / Netzwerk Recherche
接下來是輕鬆一刻。當 Myers 在 pipl.com 上搜索自己的個人資料時,發現他不知什麼時候在網上有了一個「別名」。在網頁上,他的別名一欄里寫的是「Hugh Jarse」——一旦讀快就成了不是什麼好意思的詞。全場聽罷大笑。他表示他後來才回憶起來,很久很久以前他曾經在遊戲憤怒的小鳥里給自己取了這樣一個昵稱。
Myers 同樣在他的個人網站上刊載了大量豐富的貼士與調查工具。在第十一屆全球深度報道大會上,我們對他進行了專訪。
深度網:西方世界最近對於數據隱私的呼聲對深度調查報道有怎樣的影響?
Paul Myers:在隱私與透明之間,有一場仗要打。
作為一個調查者,我個人的觀點是,重視個人隱私的意義是很重大的,但我擔心的是一旦矯枉過正,你也將保護那些罪犯、極端分子、恐怖組織以及任何你應該調查的那些人。這樣一來,調查工作就只能由官方執法機關來執行,而最終這種情況會傷害到整個社會。我們現在明顯就已經在往這個方向走了。在隱私與透明之間,有一場仗要打。
這麼說吧,假如你在調查一個有黑社會在背後撐腰的公司。他們在全世界都有據點,但他們的總部在華沙。過去,你可以搜查到這家公司在華沙的那些僱員。現在由於對隱私保護的呼聲,你在臉書上已經沒法這樣做了。所以你也證實不了你的想法,而這些人該洗錢的繼續洗錢,甚至犯下更糟糕的罪行。或許你可以找到一個折衷的辦法,例如臉書應該提供一個特殊的搜索功能供調查記者使用,這樣合理合法的調查是會讓社會變得更好的。
當然,更大的挑戰還在於,許多國家還沒有將他們的數據電子化,所以你想搜索都沒有地方搜。
深度網:社交媒體公司和管理者應該怎樣反省他們推出的這些限制條件——他們有沒有可能做點什麼來尋求一個更好的平衡呢?
Paul Myers:比如,Bellingcat 的記者當時正在對發生在也門的人權侵害事件進行調查,在臉書上搜集那些目擊者發布的貼文。我還記得那天是6月6號——沒有任何事先通知或者任何協調餘地地,不知道是誰一點鼠標,一切就都沒了。(當天,臉書突然關停了社交圖譜搜索功能)這對於也門那些人權踐踏者來說是值得彈冠相慶的一天,我覺得很可能他們還就真狂歡了一晚來慶祝這事。所以尋求一個平衡是很重要的。
對於域名註冊也是同樣的道理。在過去,如果你從某某網站訂了一堆球鞋,你給了錢以後對方捲款就跑,這種時候你就可以去查看域名註冊的詳細資料,弄到他們的地址,然後再尋求解決方案。但拜《通常數據保護規定》所賜,現在這樣行不通了。因為美國的網絡監管部門不想交兩千萬歐元的罰款,也不想冒這個險。比起判斷哪個是公司哪個是個人,他們乾脆一刀切地來處理。
想要改變這種現況是有辦法的,可以建立起一套系統,系統里人們可以選擇將自己的信息向所有人公開。而如果他們沒有做出確切選擇的時候,我們就可以當做他們是默認分享個人具體信息的。這套系統已經存在有數十年了,在我看來其實是很合理的。如果你拒絕商業公司進行匿名註冊,我不覺得這有什麼錯;反正商業公司也不會受《通常數據保護規定》保護。不過現在這個情況,找一個域名註冊信息比登天還難。
深度網:如果你只能向一個網絡知識很有限的記者推薦四個搜索工具,你會選擇哪四個?
Paul Myers:如果願意付費、或者和別人一起分攤費用的話,我強烈推薦 pipl.com,因為現在每個人都有會手機,這個以手機號為基礎線索的網站就顯得非常出色。當然還有其它工具,但由於歐盟國家的《通常數據保護規定》,差不多十億個歐洲電話號碼都已經被從這些網站上移除了。
如果是反向圖片搜素,我推薦 Yandex。
當然,還有谷歌的高級搜索功能——谷歌還有很多你平時很少使用的功能,例如限定時間範圍,限定搜索結果的語言或地區。Twitter 的高級搜索也能讓你追蹤兩個賬號之間的對話,這些功能都很厲害。可惜現在臉書已經沒有進階搜索了,不過 LinkedIn 上還有。LinkedIn 上還提供「名」和「姓」的獨立輸入框,讓你能更精確地縮小結果範圍。例如你想找 Harrison Ford,在「名」、「姓」框分別輸入輸入「Harrison」和「Ford」,領英網就不會讓姓 Harrison 的「Rex Harrison」出現在你的結果頁當中。
有一個很棒的免費搜索域名工具,叫 DomainBigData.com,使用上非常靈活方便。
然後謹記!在你做反向圖片搜素的時候,一定要用 Photoshop 裁剪圖片,只留下圖片的關鍵信息部分!
深度網:為了更好地實現線上搜查,記者們應該養成怎樣的習慣?
Paul Myers:除了學習使用搜查工具、鍛煉調查技巧,可以嘗試去用一種搜索引擎的方式去想問題,而不是直接把你腦海中蹦出的第一個詞輸到檢索欄里。所以,如果你想知道有哪些人參加了全球深度報道大會,不要在引擎里搜「清單 人 GIJC」——這沒什麼用的。你應該試試「GIJC 參加者」或「與會人」——去搜索那些有可能出現在你要找的網頁上的詞。這其實是個很少人能意識到的事,我們從事線上調查的人比較喜歡將手頭已有的信息用不同的方式排列組合。