編者按:《調查報道信息核實手冊》(Verification Handbook for Investigative Reporting)是一本有關網絡搜索和調查技巧的新鮮實用指南,指導人們如何利用UGC(user-generated content, 即用戶生產的內容)和開源信息進行網絡搜索和調查。此手冊由總部設於荷蘭的GIJN成員“歐洲新聞中心”(European Journalism Centre)出版,共有10章,均可免費下載。以下是獲得授權轉載並編譯的該書第2章,由網絡搜索專家Henk van Ess編寫。
網絡搜索是傳統調查記者、新聞教師和學生經常面臨的棘手問題,因為網絡信息可能不真實,有偏頗、或者不完整,這幾個弊端也可能同時出現。
線下也是一樣,給我們提供信息的人不可能毫無偏見,政府也做不到毫無隱瞞。無論線上線下,問對問題是關鍵。那怎麼用網絡搜索搞定新聞的三大要素(人物、地點和時間(3W))呢?專家告訴你有哪些好工具和巧方法,讓你搜索不再愁。
1. TA是誰?(Who?)
試試用谷歌寫出一份殼牌公司CEO Ben van Beurden的背景介紹吧:
a.尋找資料和評價
“is”這個簡單的詞是個神奇的小提示,能“命令”谷歌顯示出和人物相關的資料和評價。為了避免結果雜亂,搜索時最好加上公司名稱或其他細節,用AROUND指令告訴谷歌:這兩個詞離得近才行。
AROUND()指令必須大寫,以保證搜索詞之間的距離不超過兩個詞。
b.其他人的評價?
這個搜索指令讓谷歌 “顯示除了殼牌內部文件,還有哪些PDF文件含有殼牌CEO名字?” 所以最後出現的是與搜索對象相關、但不是由他/她公司發布的文件。你能看到反對者、競爭者和異議者對他的評論。如果你覺得還不夠,不妨輸入以下指令試試:
inurl:pdf “ben van beurden” –site:shell.*
這樣你還能找到filetype找不出來的PDF文件。
c.官方數據庫
再一步就是搜索全球關於他的官方文件。在網上搜索gov.uk(英國),.gov.au(澳大利亞), .gov.cn (中國), .gov (美國)和世界上其他國家的政府網站。如果你的所在國沒有以.gov為結尾的政府網站鏈接,試試這樣的組合:當地詞彙+指令site: operator. 例如搜索德國的政府網站可以用:site:bund.de,要是荷蘭的就用:site:overheid.nl。
按照此法,我們發現了van Beurden倫敦寓所的建築許可證,按圖索驥,就找到了他的完整住址和其他細節信息。
d.聯合國資料
現在試試在聯合國相關組織網站里搜索信息。還是以殼牌CEO為例,我們搜索發現,他的名字出現在一份關於“國際化學品管理戰略方針”(Strategic Approach to International Chemicals Management)的文件里,由此找到了他的全名,妻子全名和當時的護照號碼。神奇吧?
e.尋找名字的不同拼法
按照這個指令,你可以發現使用不同名字拼法的結果。你會搜到含有“殼牌(Shell)”字樣的文件,但把稱他為“Ben”的排除在外了。如此一來,你會發現他也被稱為“Bernardus van Beurden”(你不必在名字里打點[.],因為點在谷歌搜索里是忽略不計的)現在Get到技巧了嗎?不如換個名字,重新按照a,b,c,d的順序試一遍吧。
2.TA在哪兒?(Where?)
a.使用Topsy的圖片搜索功能
用www.topsy.com 找出主人公所在的地點,用三項搜索條件鎖定結果:分析他過去一段時間內(2)提到的地方(1),查看別人在Twitter上發的圖片(3)。如果你想調查一個特定時間段,在時間菜單里選擇“特定時段”(Specific Range)就可以了。
b.使用Echosec
你可以在Echosec上免費搜索社交媒體信息。比如搜索殼牌,我輸入了總部地址(1),希望能找到近期(2)在那裡工作的人所發的狀態(3)。
c.使用谷歌圖片搜索功能
把你知道的相關信息濃縮成一個精鍊的詞。在如下例子中,我想搜一位名叫@ MuhajiriShaam的伊斯蘭聖戰者(1),但並不想查Twitter(3)上名為@MuhajiriShaam01 (2)的賬戶。我想查看這個人在2014年9月25日到29日之間在Twitter上發的圖片(4)。
3.TA在什麼時間(做了什麼)? (Time?)
a. 搜索日期
多數情況下,你的調查是以發生過的事實為基礎。所以要告訴你的搜索引擎搜索過去的信息。
我們來調查一場發生在荷蘭Chemie-Pack(一家化學工廠)的火災,它發生的日期是2011年1月5日。假定你想調查工廠是否儲存過危險化學品。登陸images.google.com,輸入Chemie-pack(1),搜索2011年1月之前的圖片(2)。搜索結果給出了上百張照片,都是幾天前來過這家工廠的青年消防隊拍的。在一些照片里出現了寫着化學品名稱的圓筒。我們以此能列出火災前工廠里儲存的化學品清單。
b. 用archive.org尋找舊數據
想必大家也經常碰到網站“404 not found”的囧事,除了掀桌,你還可以去archive.org碰碰運氣。不過這招只有在你知道網站URL的情況下才管用。問題是網站失蹤了,URL鏈接也就找不着了。這時想找回看似消失的URL,該怎麼辦呢?
我們有辦法!假設要找已逝女演員Lana Clarkson的個人主頁。
第一步:找到索引網頁
找一個跟消失網頁相關的消息源。這裡我們就用她的維基百科頁。
第二步:把索引網頁放到“時光機”里去
登陸archive.org,輸入維基百科頁的URL: http://en.wikipedia.org/wiki/Lana_Clarkson
選中最老的版本:2004年3月10日。這個版本顯示的個人主頁地址為:http://www.lanaclarkson.com
第三步:找到原始網頁
再把這個鏈接輸入archive.org,加一個反斜線和一個星號,如下所示:
URL: https://web.archive.org/web/*/http://www.lanaclarkson.com/*
咻,現在所有的鏈接都蹦出來啦。但在這個例子里,你找不到很多她的信息。因為Clarkson在死後才出名。她於2003年2月被著名音樂製作人Phil Spector槍殺。現在方法到手了,快找一些頭疼不已的例子試試吧。
生於荷蘭的Henk van Ess是資深客座講師和培訓師,他在歐洲多地開設網絡調查工作坊,教授網絡調查、社交媒體和多媒體/跨媒體內容。他參與的項目包括“網站信息核實(CSI Internet)”、《數據新聞手冊》,以及社交媒體和網絡調查專家的經驗分享欄目。