最近谷歌“解禁”與否的討論又成了朋友圈熱點,不過不論如何,我們的確可以利用越來越強大的引擎搜索尋找線索、驗證信息,一些原理也可以相互遷移。深度君特別精選網絡搜索專家的分享,教你get引擎搜索的要招。
該帖僅介紹利用引擎搜索的技巧,如果想知道更多網絡搜索工具?可以參考:《網絡搜索專家:有了這些網站,在中國做調查報道會更容易(yomapic和Banjo)》、《網絡搜索專家:有了這些網站,在中國做調查報道會更容易(Geofeedia和Echosec)》和《BBC搜索專家:十款強力“人肉”搜索工具》。
1. 如何搜網頁?
搜索引擎是我們常用的“開源”搜索工具中最重要的部分之一。結合社交網絡,域名查找,以及更傳統的搜索方式比如報紙和通訊錄查找等,有效的網頁搜索將會幫你找到調查過程中至關重要的信息。
BBC的互聯網研究專家Paul Myers《調查報道信息核實手冊》(Verification Handbook for Investigative Reporting)上分享了自己使用谷歌搜索的一些妙招,一些方法也可以遷移到百度試試。
何為有效的網頁搜索?谷歌之類的搜索引擎其實並不知道它們幫你找出來的網頁是關於什麼內容的。它們知道的是,這些頁面上出現了哪些詞。所以,要有效利用搜索引擎,你需要找出目標網頁中應該會有的關鍵詞。
要點:使用高級檢索語法
大部分搜索引擎都有這類“隱蔽功能”,助你鎖定搜索範圍,改善搜索結果。
技巧1:非必需關鍵詞(Optional keywords)
如果你沒有一個特別確定的關鍵詞,你可以嵌入一些可能的關鍵詞,並使它們不損壞結果的完整性。
舉個例子:你想查找有關德克薩斯州海洛因使用情況的網頁,但它們不一定都含有“德克薩斯”這一關鍵詞,有些頁面可能只會提到德州不同城市的名字。
技巧來了:你可以用一個大寫的“OR”將這些城市名分開,使它們成為檢索詞中的“非必需關鍵詞”,如下圖所示:
你也可以用這個技巧通過不同名稱或拼寫搜索同一個公司、機構或個人,如搜索“伊斯蘭國”(ISIS / Isalamic State):
技巧2:利用域名搜索(Search by domain)
如果你想集中查找一個特定網站上的相關內容,可以使用的高級搜索語法是在“site:”後面輸入網站域名。
比如,你只想查找Twitter上的相關結果,那麼在關鍵詞後輸入“site:twitter.com”即可,如下圖所示:
如果想在Twitter之外加上Facebook的相關結果,只要再用上“OR”就可以搞定,如下圖所示:
這個技巧也可以用來集中搜索某個特定公司的網站。谷歌將只會從該站點返回結果。
你還可以用這個技巧來搜索政府或者學術網站上的資源。當你所研究的國家中政府和高校網站使用特別域名類型時,這一招尤其有效。如下圖所示,搜索英國學術網站上的資料時,輸入“site:ac.uk”:
注意:搜索學術網站時,記得檢查一下你所找到的網頁是由某所高校、某位教授、還是某個學生編輯和維護的。具體的信源是誰,一向都很重要。
2. 如何搜文件?
有些信息會以特定的文件格式類型出現。比如,數據出現的格式通常是Excel電子表格;專業製作的報告常以PDF文件的形式出現。
技巧來了:在“filetype:”後面加上目標文件類型的拓展名(如Excel表格的xls,Word文檔的docx,幻燈片的pptx等),就可以在搜索過程中鎖定某一特定格式的資料了。比如,搜索英國航空公司網站上(ba.com)PDF格式的年度報告(annual report),可搜索——”annual report” site:ba.com filetype:pdf,如下圖所示:
更多技巧,也可參考下面介紹的“如何查人?”這一部分。
3. 如何查人?
網絡專家告訴我們:會用搜索引擎,也可挖掘人物諸多背景。
試試用谷歌寫出一份殼牌公司CEO Ben van Beurden的背景介紹吧:
a.尋找資料和評價
“is”這個簡單的詞是個神奇的小提示,能“命令”谷歌顯示出和人物相關的資料和評價。為了避免結果雜亂,搜索時最好加上公司名稱或其他細節,用AROUND指令告訴谷歌:這兩個詞離得近才行。
AROUND()指令必須大寫,以保證搜索詞之間的距離不超過兩個詞。
b.其他人的評價?
這個搜索指令讓谷歌 “顯示除了殼牌內部文件,還有哪些PDF文件含有殼牌CEO名字?” 所以最後出現的是與搜索對象相關、但不是由他/她公司發布的文件。你能看到反對者、競爭者和異議者對他的評論。如果你覺得還不夠,不妨輸入以下指令試試:
inurl:pdf “ben van beurden” –site:shell.*
這樣你還能找到filetype找不出來的PDF文件。
c.官方數據庫
再一步就是搜索全球關於他的官方文件。在網上搜索gov.uk(英國),.gov.au(澳大利亞), .gov.cn (中國), .gov (美國)和世界上其他國家的政府網站。如果你的所在國沒有以.gov為結尾的政府網站鏈接,試試這樣的組合:當地詞彙+指令site: operator. 例如搜索德國的政府網站可以用:site:bund.de,要是荷蘭的就用:site:overheid.nl。
按照此法,我們發現了van Beurden倫敦寓所的建築許可證,按圖索驥,就找到了他的完整住址和其他細節信息。
d.聯合國資料
現在試試在聯合國相關組織網站里搜索信息。還是以殼牌CEO為例,我們搜索發現,他的名字出現在一份關於“國際化學品管理戰略方針”(Strategic Approach to International Chemicals Management)的文件里,由此找到了他的全名,妻子全名和當時的護照號碼。神奇吧?
e.尋找名字的不同拼法
按照這個指令,你可以發現使用不同名字拼法的結果。你會搜到含有“殼牌(Shell)”字樣的文件,但把稱他為“Ben”的排除在外了。如此一來,你會發現他也被稱為“Bernardus van Beurden”(你不必在名字里打點[.],因為點在谷歌搜索里是忽略不計的)現在Get到技巧了嗎?不如換個名字,重新按照a,b,c,d的順序試一遍吧。
4. 如何確認地點?
使用谷歌圖片搜索功能
把你知道的相關信息濃縮成一個精鍊的詞。在如下例子中,我想搜一位名叫@ MuhajiriShaam的伊斯蘭聖戰者(1),但並不想查Twitter(3)上名為@MuhajiriShaam01 (2)的賬戶。我想查看這個人在2014年9月25日到29日之間在Twitter上發的圖片(4)。
5. 如何確認時間?
多數情況下,你的調查是以發生過的事實為基礎。所以要告訴你的搜索引擎搜索過去的信息。
我們來調查一場發生在荷蘭Chemie-Pack(一家化學工廠)的火災,它發生的日期是2011年1月5日。假定你想調查工廠是否儲存過危險化學品。登陸images.google.com,輸入Chemie-pack(1),搜索2011年1月之前的圖片(2)。搜索結果給出了上百張照片,都是幾天前來過這家工廠的青年消防隊拍的。在一些照片里出現了寫着化學品名稱的圓筒。我們以此能列出火災前工廠里儲存的化學品清單。
6. 如何核查信息?
Google等搜索引擎:
1)只看第三方信息:核實網站X時,採用搜索語句“X”+“-”(減號)+ “site:’X.com’”,排除網站本身提供的信息;
2)從政府網站核實:搜索語句“X”+ “site: Y.gov”;
3)核實地址信息:進入提供街景的網站,如instantstreetview.com,輸入需核實地址,查看圖片,並判斷是否合理;
4)查看歷史信息:利用谷歌等搜索引擎,搜索特定時間以前的內容,找出信息源頭;
5)核實照片信息:用Picasa等圖像工具將彩色照片轉成黑白,再上傳至谷歌圖片,進行搜索,利用得到的圖片進行二次搜索,確認圖片與描述符合。
10個核查定事實的小貼士:
1)找到推特信息源;
2)判斷信息發布者的可信度;
3)核實背景信息;
4)不盲從;
5)核實陌生信息源;
6)核實圖像(最好找到原版);
7)核實新聞中的具體信息:如地址和時間,對照已知事實;
8)有照片時,去視頻網站查找相關視頻;
9)查找其他人是否證實過信息為假:搜索關鍵詞加“假”、“錯誤”等字眼;
You really make it seem so easy with your presentation but I find this matter to be actually something that I think I would never understand.
It seems too complicated and very broad for me.
I’m looking forward for your next post, I will try to get the hang
of it!