2015調查新聞新招:網絡搜索技法大全

Print More

工欲善其事,必先利其器。進入網絡時代,遠距離、短時間內核實信息怎麼辦?互聯網研究專家告訴你:掌握工具性能、搜索和判斷要領,“人肉搜索”能驗證信息、尋找線索,說不定助你搶先一步得到獨家。

曾經在一小時內起底ISIS劊子手聖戰約翰的搜索專家Henk van Ess,以及網絡搜索資源網站“互聯網搜索診所”(The Internet Research Clinic)”的開辦人Paul Myers為您奉獻搜索指南+工具+案例,快打開搜索引擎,學起來吧!【點擊文中鏈接,更多人肉工具+案例細節等你收藏】


1. 網絡搜索原理+技巧:教你查網頁、人和域名

搜索引擎是我們常用的“開源”搜索工具中最重要的部分之一。結合社交網絡,域名查找,以及更傳統的搜索方式比如報紙和通訊錄查找等,有效的網頁搜索將會幫你找到調查過程中至關重要的信息。

book-cover2BBC的互聯網研究專家Paul Myers《調查報道信息核實手冊》(Verification Handbook for Investigative Reporting)上分享了自己使用谷歌搜索的一些妙招,一些方法也可以遷移到百度試試。

何為有效的網頁搜索?谷歌之類的搜索引擎其實並不知道它們幫你找出來的網頁是關於什麼內容的。它們知道的是,這些頁面上出現了哪些詞。所以,要有效利用搜索引擎,你需要找出目標網頁中應該會有的關鍵詞。

要點:使用高級檢索語法

大部分搜索引擎都有這類“隱蔽功能”,助你鎖定搜索範圍,改善搜索結果。

技巧1:非必需關鍵詞(Optional keywords)
如果你沒有一個特別確定的關鍵詞,你可以嵌入一些可能的關鍵詞,並使它們不損壞結果的完整性。

舉個例子:你想查找有關德克薩斯州海洛因使用情況的網頁,但它們不一定都含有“德克薩斯”這一關鍵詞,有些頁面可能只會提到德州不同城市的名字。

技巧來了:你可以用一個大寫的“OR”將這些城市名分開,使它們成為檢索詞中的“非必需關鍵詞”,如下圖所示:

1

你也可以用這個技巧通過不同名稱或拼寫搜索同一個公司、機構或個人,如搜索“伊斯蘭國”(ISIS / Isalamic State):

2

技巧2:利用域名搜索(Search by domain)
如果你想集中查找一個特定網站上的相關內容,可以使用的高級搜索語法是在“site:”後面輸入網站域名。

比如,你只想查找Twitter上的相關結果,那麼在關鍵詞後輸入“site:twitter.com”即可,如下圖所示:

3.5

如果想在Twitter之外加上Facebook的相關結果,只要再用上“OR”就可以搞定,如下圖所示:

4.5

這個技巧也可以用來集中搜索某個特定公司的網站。谷歌將只會從該站點返回結果。

你還可以用這個技巧來搜索政府或者學術網站上的資源。當你所研究的國家中政府和高校網站使用特別域名類型時,這一招尤其有效。如下圖所示,搜索英國學術網站上的資料時,輸入“site:ac.uk”:

3

注意:搜索學術網站時,記得檢查一下你所找到的網頁是由某所高校、某位教授、還是某個學生編輯和維護的。具體的信源是誰,一向都很重要。

技巧3:搜索文件類型(Searching for file types)
有些信息會以特定的文件格式類型出現。比如,數據出現的格式通常是Excel電子表格;專業製作的報告常以PDF文件的形式出現。

技巧來了:在“filetype:”後面加上目標文件類型的拓展名(如Excel表格的xls,Word文檔的docx,幻燈片的pptx等),就可以在搜索過程中鎖定某一特定格式的資料了。比如,搜索英國航空公司網站上(ba.com)PDF格式的年度報告(annual report),可搜索——”annual report” site:ba.com filetype:pdf,如下圖所示:

4

【想知道如何有效找人、確認域名主人?請點擊標題鏈接來獲取技巧吧!】

2. 巧用搜索指令和後綴,搞定新聞三大要素

怎麼用網絡搜索搞定新聞的三大要素(人物、地點和時間(3W))呢?網絡搜索專家Henk van Ess告訴你有哪些好工具和巧方法,讓你搜索不再愁。

1) TA是誰?(Who?)
試試用谷歌寫出一份殼牌公司CEO Ben van Beurden的背景介紹吧:

a.尋找資料和評價

5“is”這個簡單的詞是個神奇的小提示,能“命令”谷歌顯示出和人物相關的資料和評價。為了避免結果雜亂,搜索時最好加上公司名稱或其他細節,用AROUND指令告訴谷歌:這兩個詞離得近才行。

AROUND()指令必須大寫,以保證搜索詞之間的距離不超過兩個詞。

b.其他人的評價?

6這個搜索指令讓谷歌 “顯示除了殼牌內部文件,還有哪些PDF文件含有殼牌CEO名字?” 所以最後出現的是與搜索對象相關、但不是由他/她公司發布的文件。你能看到反對者、競爭者和異議者對他的評論。如果你覺得還不夠,不妨輸入以下指令試試:

inurl:pdf “ben van beurden” –site:shell.*

這樣你還能找到filetype找不出來的PDF文件。

c.官方數據庫

7再一步就是搜索全球關於他的官方文件。在網上搜索gov.uk(英國),.gov.au(澳大利亞), .gov.cn (中國), .gov (美國)和世界上其他國家的政府網站。如果你的所在國沒有以.gov為結尾的政府網站鏈接,試試這樣的組合:當地詞彙+指令site: operator. 例如搜索德國的政府網站可以用:site:bund.de,要是荷蘭的就用:site:overheid.nl。

按照此法,我們發現了van Beurden倫敦寓所的建築許可證,按圖索驥,就找到了他的完整住址和其他細節信息。

d.聯合國資料

8現在試試在聯合國相關組織網站里搜索信息。還是以殼牌CEO為例,我們搜索發現,他的名字出現在一份關於“國際化學品管理戰略方針”(Strategic Approach to International Chemicals Management)的文件里,由此找到了他的全名,妻子全名和當時的護照號碼。神奇吧?

e.尋找名字的不同拼法

9按照這個指令,你可以發現使用不同名字拼法的結果。你會搜到含有“殼牌(Shell)”字樣的文件,但把稱他為“Ben”的排除在外了。如此一來,你會發現他也被稱為“Bernardus van Beurden”(你不必在名字里打點[.],因為點在谷歌搜索里是忽略不計的)現在Get到技巧了嗎?不如換個名字,重新按照a,b,c,d的順序試一遍吧。

2) TA在哪兒?(Where?)

a.使用Topsy的圖片搜索功能

10
www.topsy.com找出主人公所在的地點,用三項搜索條件鎖定結果:分析他過去一段時間內(2)提到的地方(1),查看別人在Twitter上發的圖片(3)。如果你想調查一個特定時間段,在時間菜單里選擇“特定時段”(Specific Range)就可以了。

b.使用Echosec

11你可以在Echosec上免費搜索社交媒體信息。比如搜索殼牌,我輸入了總部地址(1),希望能找到近期(2)在那裡工作的人所發的狀態(3)。

c.使用谷歌圖片搜索功能

把你知道的相關信息濃縮成一個精鍊的詞。在如下例子中,我想搜一位名叫@ MuhajiriShaam的伊斯蘭聖戰者(1),但並不想查Twitter(3)上名為@MuhajiriShaam01 (2)的賬戶。我想查看這個人在2014年9月25日到29日之間在Twitter上發的圖片(4)。

12

【想知道最後一個要素:TA在什麼時間(做了什麼)怎麼查?請點擊《實用貼:如何用網絡搜索搞定新聞要素?》查看吧!

3. 新浪微博檢索不夠強?社交媒體檢索新利器幫你忙:

覺得以上的檢索不適合中國?Van Ess推薦了數個社交媒體信息檢索的好工具,匹配新浪微博,地圖語言也顯示中文哦:

利器1:網站Geofeedia

Geofeedia是社交媒體監控網站,其特殊之處在於,除主流英文媒體外,它還監控了新浪微博。它以地圖界面取代了微博精確度不強的條件框檢索。

12.5

在右上角的搜索欄(search)中輸入地名(中英文皆可,可具體到街道名,也可輸入城市名),回車搜索,就能自動跳轉到搜索地點。右方的放大縮小工具可用於調整地圖比例。

12
中間的圓圈表示選擇地區範圍,也可以選用右上角的四邊形工具,自定邊界。同時在右邊可自定想要搜索的社交媒體類型(這裡我們選擇微博),點擊區域中心方塊內的放大鏡圖案,搜索就開始了。

這裡,我們搜索了北京城區及周邊區域,發現這個區域內過去一個月左右時間內產生過12.2萬條微博。點擊上方標籤中的“拼貼(collage)”,可以看到由近及遠排列的微博具體內容、發布者以及發布時間。找到你關心的話題,點擊發布者名字,就能進入他的微博主頁。

13
不需要看具體內容,只想知道整體趨勢,可點擊標籤欄第三位的“分析(Analytics)”,就會出現微博和用戶的總數、平均數統計,甚至還有關鍵詞和最常發布的用戶排名。美中不足的是關鍵詞沒能採用中文分詞技術,只能出現中文單字,不具參考價值——建議結合微博官方的微數據使用,效果更佳。

14
Geofeedia還有一些功能,如日期選擇、關鍵詞存儲、用戶名存儲等。

其他值得發掘的應用功能還包括搜索突發事件目擊者、獲取豐富實時信息、聯繫遙遠國家特定地區的公民、分析特定地區社交媒體發布趨勢等。不過,它是一個收費網站,可以申請試用,但想持續使用還需付費。

不過別擔心,Van Ess還推薦了另一件免費的利器。

利器2:網站Echosec

Echosec的使用方法和功能與Geofeedia類似,均採用地圖和搜索。

比起Geofeedia,它的優勢在於地圖語言顯示為中文,更便於確定地點。

13
目前,其免費版本可追蹤推特和Flicker,使用新浪微博則需要註冊。

此外,還有免費搜索網站Yomapic.com和手機應用Banjo也是檢索信息的好工具。若想了解詳情,請點擊《網絡搜素專家:有了這些網站,在中國做調查報道會更容易》查看吧!

4. 網絡搜索神器:查域名、爬網頁、驗社交媒體

除了搜索引擎和社交媒體檢索平台,BBC互聯網研究專家、搜索大牛Paul Myers還祭出IP搜索等多功能神器,讓你分分鐘get“人肉”搜索技能。

1)搜索電話IP:Aql.com

誰在發送大量垃圾短信?騷擾電話又是從哪裡打過來的?別急,Aql.com幫你忙。該網站專供搜索電話IP所屬地、供應商信息和目前位置、地區編號、連接網絡的名稱,甚至還有最近改變網絡的日期等。只要按格式輸入電話號碼,以上信息一鍵搞定。此外,如果想查找與Skype相關的信息,用SkypeGrab就能得到打出Skype電話的IP地址。

16

2) 查找相似域名:TCPIPUTILS.com

主要用於查找與目標網址相類似的域名。例如,小編鍵入“全球深度報道網”的網址(cn.gijn.org),馬上找到了21個類似的域名,包括gijn.cn,gijn.com,gijn.net等等。如果試試中國銀行的網站“www.boc.cn”,出來的域名更多達50個,不乏混淆視聽的boc.co.kr和bo.co.uk,,它們並不是中銀在韓國或者英國的分網站,而全都是美國一個IP造出來的虛假地址。拿其他網站來試試吧,不光是域名,ipv4、ipv6、網絡供應商ip和所在地的信息也一查俱全,還可以單獨點開域名,看看它有沒有包含在DMOZ這樣的公共網頁目錄裡面。這樣大概就能幫你找到那些藉著大網站名頭行詐騙之實的釣魚網站了。

17

3)搜索網站域名:Domaintools

也是一款功能強大的域名搜索工具。例如,我們在Facebook網站上經常能看到特價皮包銷售的網站,例如下圖的Loveukbags.com就標明Michael Kors的皮包4折銷售,網站的貨幣單位和.com的後綴都看起來貨真價實,而這麼誘人的價格到底是真是假呢?讓我們用Domaintools來測一測。

18

登錄Domaintools查詢網絡Whois信息,能查出眾多含有關鍵字“bags”的購物網站,例如HandbagsSale.com、ShoesBags.com、PursesHandbags.com 等等,網站www.loveukbags.com上出現的服務郵箱則掛靠在多達2988個域名上,註冊商竟是珠海某公司。該公司同時註冊了2987個域名,而IP地址則設置在美國亞特蘭大以掩人耳目,這足以證明我們要查的是一家虛假購物網站。而從Facebook用戶的反饋上也可以看出,這家公司騙人不少。(Domaintools同時還能查詢ip、Whois更換,服務器更換等歷史信息,功能強大吧。)

Myers推薦的其他類似IP神器還包括Whatismyip.com,能馬上檢索目標IP所處的國家、城市、城區、郵政編碼、網絡提供商、時區和經緯度等信息,定位也相當準確。

4)抓取網站信息:Black Widow

想從網站抓取信息但不懂編程?19

5)獲取網站後台文件:Pentest Tools

這個工具分為信息收集(Information gathering)、網站應用檢測(web application testing)和基礎設施檢測(infrastructure Testing)三部分。鍵入要查詢的網站域名,就能找到子域名(subdomains),或者下載關於網站服務器、鏈接漏洞信息(URL Fuzzer)的pdf報告等,甚至可以找到網站背後的文件目錄(directory and files),可以知道網站更詳細的內容信息。
20
6)搜索相似圖片:Fuskr

是Chrome插件,安裝之後,右鍵點擊圖片,可以找到圖片鏈接背後隱藏的一系列相似圖片,支持下載、排除受損照片、重新調整圖片大小以適應網頁等。
21

7)虛假定位炫地點:Pleasedontstalkme.com

Myers還提供了一個虛假定位的小工具Pleasedontstalkme.com(請不要跟蹤我):登錄Twitter賬戶,可以做到想讓網友看到自己在哪裡發推就在Google Map上點哪個地址,非常逼真。假裝自己週遊世界技能get!

22

還有三個強大工具可供查看圖片元數據、搜索臉書照片、下載視頻,欲知詳情,請點擊《BBC搜索專家:十款強力“人肉”搜索工具》查看相應介紹吧!


5. 核查事實技巧清單:搜索引擎+社交媒體+整合工具一個不能少

掌握了強大的檢索工具,核查事實的要領就成為搜索有效與否的關鍵。網絡搜索專家Henk Van Ess以谷歌和推特為例,展示了核查事實過程中常用的一些工具和準則。內地讀者可以借鑒他使用搜索引擎和社交媒體的思路,運用到內地常用的工具,如百度和新浪微博,或許會發現新大陸!

22

  • Google/其他搜索引擎:
    1)只看第三方信息:核實網站X時,採用搜索語句“X”+“-”(減號)+ “site:’X.com’”,排除網站本身提供的信息;
    2)從政府網站核實:搜索語句“X”+ “site: Y.gov”;
    3)核實地址信息:進入提供街景的網站,如instantstreetview.com,輸入需核實地址,查看圖片,並判斷是否合理;
    4)查看歷史信息:利用谷歌等搜索引擎,搜索特定時間以前的內容,找出信息源頭;
    5)核實照片信息:用Picasa等圖像工具將彩色照片轉成黑白,再上傳至谷歌圖片,進行搜索,利用得到的圖片進行二次搜索,確認圖片與描述符合。
  •  Twitter/微博:
    1)核實個人信息:微博認證、私人鏈接等;
    2)了解其網絡聊天對象:利用谷歌高級搜索;
    3)查看其好友圈:進入網站http://moz.com/followerwonk,搜索好友信息;
    4)查看信息發布時間與其所在時區是否吻合;
    5)查看其以前的推特:網站http://topsy.com;
    6)分析其帳號的影響力:網站http://klout.com。
  • 10個核查定事實的小貼士:
    1)找到推特信息源;
    2)判斷信息發布者的可信度;
    3)核實背景信息;
    4)不盲從;
    5)核實陌生信息源;
    6)核實圖像(最好找到原版);
    7)核實新聞中的具體信息:如地址和時間,對照已知事實;
    8)有照片時,去視頻網站查找相關視頻;
    9)查找其他人是否證實過信息為假:搜索關鍵詞加“假”、“錯誤”等字眼;
    10)到實時搜索網站搜一搜。
6. 教皇有個“獨裁者”密友?專家:多方搜索+查證破謠言

網絡信息又多又雜,核實信息破費功夫,如何快速、有效地驗證信息?專家是如何實踐剛剛提到的搜索要領的?Henk van Ess以簡單幾步破除教皇和阿根廷前軍事獨裁者Jorge Rafael Videla交情不淺的傳言。看看他是怎麼做的:

2013年3月13號,梵蒂岡選出了他們的新教皇方濟各、來自阿根廷的耶穌會士Jorge Mario Bergoglio

23

消息發布僅僅5分鐘,《衛報》記者Matt Seaton就在推特上轉發一條推文爆料,稱新教皇曾縱容甚至支持阿根廷的獨裁統治,並引用了《衛報》同行Hugh O’Shaughnessy的文章作證據。

Matt Seaton的這條推文很快被媒體人轉發。一小時後,臉書上也出現了許多譴責新教皇的轉發帖。兩小時後,已有3500人在推特上轉發此條消息,包括許多媒體的賬號。三小時過去,一些網站諸如Consortiumnews.com出現同主題文章。

而在第一條推文發布3小時59分鐘後,一張標題為“教皇方濟各,獨裁者Videla的親密夥伴”的照片在推特上出現。圖中,疑似教皇者在為阿根廷前軍事獨裁者Jorge Rafael Videla布施聖餐。它的發布者,是美國著名紀錄片導演Michael Moore25

面對洶湧澎湃的網絡信息,Henk Van Ess梳理了事件發酵的時間線,並提出問題:作為關注此事的記者,你會選擇在什麼時間發布該新聞呢?是各大媒體轉發推文之後,還是爆料照片出現的時候?

26
他給出的建議是:在確認以下事實之前,不要發布。

1) 消息源是誰?
想在紛擾的傳聞中抓住重點,Van Ess做的第一件事就是尋找消息源。首先,他用信息檢索網站topsy.com檢索流言中重複出現的語句“new pope was an accessory to murder(新教宗是殺戮的同謀者)”,選擇“Twitter”作為檢索範圍,並選擇“sort by oldest(最舊)”以尋找最早的推文。
27
另外,他還使用了相似工具backtweets.com,做了同樣的檢索:

28

所有檢索結果都指向《衛報》記者Hugh O’Shaughnessy發佈於2011年1月4日的一篇文章:《阿根廷教堂的原罪》(The sins of the Argentinian church)。
29Hugh O’Shaughnessy在文中引用一位阿根廷記者的證詞,稱在擔任耶穌會領袖的1973-1979年間,Bergoglio不僅支持當時由獨裁者Jorge Rafael Videla領導的軍政府,還對軍政府迫害教士的行徑保持沉默,甚至捲入兩起耶穌會士的綁架案。

2)消息源可靠嗎?
Hugh O’Shaughnessy是何許人也?Van Ess在《衛報》官網維基百科上搜索他的信息,發現他是一位獲過獎的老記者,報道拉丁美洲超過40年。因此Van Ess認為他的背景是可靠的。
30但這會不會是一個好記者的粗心大意之作呢?Van Ess觀察報道頁面,發現文章的分類有些奇怪:

31
這篇文章被歸在“自由評論(Comment is free)”欄目下。根據欄目介紹,這個欄目提供的不是嚴肅新聞,而是記者和觀察家們發布的洞見。

既然這不是一篇新聞,而只是評論文章,那麼其信息準確性就大打折扣了。

3)照片可信嗎?

文字信息真假難辨,那麼照片總該是真槍實彈吧?Van Ess告訴我們,Michael Moore發布的照片,也不能全盤當真,要核實核實再核實。

Michael Moore對照片的描述是:“新教皇向阿根廷獨裁者Jorge Rafael Videla布施聖餐”。對此,Van Ess提出兩個疑問,照片上的人是否如描述所言,是教皇和獨裁者?照片拍攝的時間和地點又在哪裡?

32
若讀過Van Ess之前的搜索指南,你大概知道接下去要做什麼——通過上載圖片進行谷歌圖片搜索,但Van Ess說,這樣還不夠。在圖片搜索時,務必注意選擇搜索工具中的“自訂日期範圍”,為照片規定一個時間底線,這樣才能找到照片最早發布的平台。

33
Van Ess找到的原始照片來自AFP。照片描述顯示,圖中接受聖餐的確實是阿根廷的軍事獨裁領袖Jorge Rafael Videla,時間是1990年12月30日,地點在布宜諾斯艾利斯。然而,描述中沒有出現圖中牧師的名字,只稱其為“當地教堂的一名牧師”。
34
這位牧師是否就是梵蒂岡的新教皇呢?Van Ess找到了問題的突破口——就看教皇1990年的時候是不是身處布宜諾斯艾利斯了。

他找出教皇的簡歷,發現1987年到1992年間,他曾在距離布宜諾斯艾利斯700公里以外的科爾多瓦市(Córdoba)做牧師,而非照片中所說的布宜諾斯埃利斯當地教堂。

35
嚴謹起見,我們還不能排除教皇當年心血來潮趕去布宜諾斯埃利斯,做幾個月牧師的可能性。

Van Ess採用了另一種核實照片的方法:尋找當年視頻。獨裁者Videla作為著名人物,必然有留下一些新聞報道和記錄。在視頻網站YouTube上搜索“Videla Iglesia(“教堂”的西班牙文) 1990”,發現確實有一個當年的視頻。

36
視頻下方的說明顯示,主持儀式的是牧師Carlos Beron,而非教皇方濟各。

如果以上證據還沒有說服你,那麼Van Ess還提供了一種簡單的判定方法:圖中布施的牧師從外表上看,年紀顯然大於受施的Videla。
37

而只要稍解教皇和Videla的生平,就會知道,教皇出生於1936年12月17日,而Videla出生於1925年8月2日,足足比教皇年長11歲。

四、有比你還快的聰明人嗎?
在你大費周章地求證時,也許有人早已經證偽了這條消息。這通常是因為他們離信息源更近,或者有語言上的優勢。

這個例子里,Van Ess用谷歌簡單檢索了“Jorge Videla”,就找到了一篇法語文章,顯示該照片並非教皇本人。

38

Van Ess的建議是,搜索時還可以加上“騙局”、“錯誤”、“假消息”等字眼,並嘗試使用新聞發生國家的官方語言,那樣會更快找到你想要的信息。

只要熟練掌握以上四個步驟,那麼在不到30分鐘時間內核實一條消息,將會是件非常容易的事。

正是由於記者們的質疑和核實手段之迅速,在爆料出現30個小時之後,最初爆料的《衛報》文章經修改後重新發布,文末註明,原文中提到的“阿根廷記者指控新教皇‘參與過幫助軍隊藏匿政治犯’的罪名”信息不實,該記者並未作過如此指控。

Van Ess總結說,“謊言重複一千遍就成了真理”,不能因為一個消息被大量轉發就盲目相信。網絡搜索中最重要的策略,一是找到原始材料,二是核查不同來源信息的匹配程度,三是靈活運用各種搜索工具。在搜索核查中要學會“另闢蹊徑”,用多種方法核實,才不至於產生錯漏。

還想知道他是如何一小時內通過各種互聯網工具找到恐怖分子“聖戰約翰”的家人?調查團隊Bellingcat是如何以視頻記錄、網絡搜索驗證馬航MH17是被“山毛櫸”(Buk)導彈擊落的?請點擊左邊的鏈接查看吧!

Print Friendly, PDF & Email

1 thoughts on “2015調查新聞新招:網絡搜索技法大全

  1. Simply wish to say your article is as astonishing.
    The clarity on your submit is simply nice and that i could suppose you’re a professional
    on this subject. Well along with your permission allow me to grab your RSS feed to stay up to date with coming
    near near post. Thanks a million and please keep up the
    rewarding work.

發表回復

您的電子郵箱地址不會被公開。 必填項已用 * 標註