
線上調查特級大師保羅-邁爾斯主持GIJN的最新網絡研討會。圖:Nina Weymann-Schulz / GIJN
2020年5月底,英國政府一名高級顧問公開宣稱,2019年已就冠狀病毒的危險性發出書面警告。
讀者可以在該顧問於2019年3月4日撰寫的博客中看到這一警告,內容包括了 「冠狀病毒(coronavirus)」一詞,這似乎是明確無誤的證據。
但BBC的一項調查顯示,原來的博文中並沒有寫上「冠狀病毒 (coronavirus)」這個詞,而在2020年4月9日,也就是疫情已經全面爆發的時候,警告才「突然地」出現在了文章中。
BBC 的首席互聯網研究專家保羅·邁爾斯(Paul Myers)表示,現在有很多有效的工具和技術可以幫助記者挖掘數字網絡在過去的狀態,包括戳穿該顧問聲稱自己曾「警告謊言」的 Wayback Machine;而另一種方法,則是利用谷歌街景,記者可以在過去的場景中「走動」並進行觀察。
在最近一次為來自94個國家的700多名記者舉辦的在線大師班上,邁爾斯介紹了一些實用的開源工具、語法技巧和搜索技術,以幫助記者發掘與此次疫情相關的、難以捉摸的內容,包括文字、圖片和發布在社交媒體上的帖文。此次活動是 GIJN「調查新冠疫情(Investigating the Pandemic)」系列網絡研討會的第十場。
GIJN 圍繞疫情舉辦的大多數網絡研討會都可以在 GIJN 的YouTube 頻道上觀看。但由於特別的原因,我們無法對此次的研討會進行錄製。但我們為你從中收集了一些最強大且易用的 takeaways —— 簡單,但鮮為人知的語法技巧(用於普通的谷歌和 Twitter 搜索,而非高級或基於訂閱的搜索工具。如果你對高級搜索/訂閱搜索感興趣,可以在GIJN網站的過往文章中找到,也可以訪問邁爾斯的個人網站:Research Clinic)
例如,有多少記者知道,在一個詞語的前後加上引號 —— 或在不需要的關鍵詞前加上一個減號——可以消除數不勝數的多餘搜索結果?又或者,一個大寫的”OR”就可以防止你不小心毀掉你的搜索結果?再或者,加上”site: “這個前綴可以將搜索結果限制在指定域名上?
邁爾斯目前是 BBC Academy 調查支援項目的負責人。他邀請與會的記者們思考社交媒體平台在現實中的使用情況。因此,雖然 Instagram 的搜索功能體驗較差,但活躍於該平台的年輕用戶比其他平台用戶更傾向於標記自己的位置,這使得 Instagram 值得引起記者關註:在突發新聞事件中,記者可以利用該平台尋找現場人員。他同時鼓勵記者通過使用標籤雲(word clouds)來尋找某些社區成員才會使用的標籤,從而了解到該社區的最新動態。
雖然他在90分鐘的會議中提到了十幾種工具(且在此前GIJN主辦的演講中還描述了更多的工具)但邁爾斯強調,「搜索思維」才是線上搜索最根本的能力。
「大多數會人用自然語言(natural language)在谷歌上搜索,但這樣有時會讓它誤解你的問題。所以,我認為用邏輯和特殊工具來『控制』谷歌所得出的結果會好得多。」
「谷歌是不知道我們想要什麼的。要進行有效的搜索,你需要制定一個專門的策略和正確的關鍵詞。搜索很容易,但真正要找東西很難。每次你搜索什麼的時候,原則上你需要看看你得到了多少結果。如果結果太多,你還需要輸入更多的細節。」
為了說明邏輯思維方式,邁爾斯提供了一個搜索比較著名暗殺事件的例子。輸入搜索詞「Kennedy」和「Lennon」——意思是 John F. Kennedy 和 John Lennon——那就會獲得大量搜索結果,包括英國足球隊的網站。但如果加上「Caesar」這個詞,搜索的結果就會突然只圍繞着暗殺展開。對此,邁爾斯解釋說:「除了暗殺,這三個詞還有什麼理由會出現在同一頁上呢?邏輯引導了我們的搜索,並直接導致我們的搜索結果會有質的不同。」
同時,在社交媒體上搜索個人時,花上一分鐘,用邏輯想想,你就應該知道:如果想搜索一個青少年的資料,在 TikTok 或 Instagram 等平台上開始會更有效,而不是LinkedIn;而如果你想找一個大公司的 CEO 則相反。而在 Twitter 上,由於字數限制,用戶傾向於使用簡寫。打個比方,以“info” 為關鍵字,而非 “information”,這樣可能更有效。
以下是邁爾斯與大家分享的大量技巧和工具的一些總結:
使用搜索引擎的小貼士
-
- 謹記,谷歌並不能看到網絡上的所有內容。有些網頁隱藏在付費牆後面,而有些網頁則隱藏在站點索引文件 robots.txt 中;
- 不要直接去以你想要的東西為關鍵字進行搜索。相反,你要先想,你想要的東西會出現在哪種網頁/社交媒體帖文中,然後再去搜索這些網站/社交媒體帖文中更可能出現的關鍵字;
- 你可以通過在單個單詞周圍使用引號來縮小搜索範圍(引號將指示谷歌只搜索完全匹配的詞語,而將同義詞排除在外);或在特定詞組前面添加減號,這樣可以排除你不想包含在搜索結果的內容;
- 你可以通過在選項之間添加大寫的 “OR” 一詞來增加搜索的靈活性,避免將一些想要的搜索結果排除在外;
- 在需要的時候,你可以使用 “site:” 在特定的域名上搜索內容。
- 嘗試了解谷歌搜索的標籤頁(tabs)、工具(tools)和高級搜索功能,包括指定搜索結果的日期範圍等;
- 先找出最確定的關鍵詞,再找出「有可能」的關鍵詞;
- 你可以在 archive.org 和 archive.is 上查找被刪除的頁面——尤其是社交媒體帖文。
- 你可以用 ext:pdf 這個短語查找pdf文件。當搜索被刪除的文件時,可以考慮尋找緩存版本。如果你知道該文件中確定出現的幾個詞,就在谷歌搜索欄中把它們加上引號,看看是否有其他來源的同一文件。
- Bing 可以做一些谷歌做不到的事情。邁爾斯說,它「允許一種『鳥瞰』視角——它允許你越過柵欄看問題。」它允許你通過IP地址(而非域名)進行搜索。他提到,「如果在同一台電腦上有50個不同的域名,這一功能將很有用。(但是)谷歌也是很出色工具,我們可以根據自己的需要來選擇。」
搜索社交媒體的小貼士
- 雖然你可以從外部對特定社交媒體平台內容進行搜索,但用平台自帶的搜索框來進行搜索效率更高:因為它與自己的數據庫相連,可以提供更多最新的結果;
- 在尋找某個人時,首先要嘗試確定他們的電子郵件地址。電郵地址除了可能為我們提供關於該人的一些個人信息線索外(如姓名、生日等),它通常還是人們在網絡上唯一的標識符,通常兼作用戶名,可以被Pipl.com 等尋人數據庫有效利用。
- 在email-format.com中輸入你的目標人物就職的公司名稱,網站就有可能根據公司,為你提供該公司電子郵件地址的標準格式。結合你目標人物的姓名,你就可能找到他們的個人電郵地址;
- 使用在線地圖中自動生成的經度和緯度數字,找出特定地區的人對特定話題的看法。將經緯度數字複製到 Twitter 上,並將它們(不含空格地)添加到前綴 “geocode: “中。然後在數字串的末尾加上你需要的半徑——例如,”1km”(一公里)。
- 想要在谷歌搜索 Youtube 上的內容,可以輸入site:youtube.com,或者直接在其視頻標籤頁中搜索;
- 適應每個平台不同的用戶偏好。例如,如果想在 Instagram 成功搜索到想要的內容,你往往需要在詞語間採用下劃線 “_” 或直接用複合詞形式,而連字符 “-” 則不常用。雖然你不能從 Instagram 複製圖片,但它們確實提供了可用於繼續搜索的元信息。
- Picbabun 是提供 Instagram 內容搜索服務的網站之一。它支持複製 Instagram 圖片並以全尺寸打開。
- Echosec 是一個對記者相當友好的網站。在上面你能夠找到通過 Twitter 發送的 Instagram 帖文。網站的搜索功比 Instagram自帶的要好用得多。
- 要想時刻關注 Twitter 社區的最新動態,你需要找到只有這些社區成員才會使用的標籤。你可以從 Hashtagify.me 上的文字中找到特定的標籤。比如,搜索航空公司客艙人員使用的標籤,就會發現 #crewlife 是這個社區成員主要會使用的標籤。再回到 Twitter 用這些 tag 進行搜索,你馬上就能看到航空公司人員發布的帖文。
- 在谷歌使用 “intitle: ” 前綴,可以限制只在標題中搜索;
- 如果你預感到有人對 Facebook 帖文進行過編輯,點擊右上角的三個小點,看到「編輯歷史」,你就能看到以前的版本;
- 如果你懷疑整個帖文都被調整了時間,你可以將光標懸停在 Facebook 帖文旁邊的小時鐘圖標上,該帖文的創建日期便能顯示出來:
- 使用前綴 “url: “,你可以找到帶有其他網站鏈接的Twitter帖子。基於此,你可以找到人們對自己在亞馬遜上掛賣的面膜進行推銷的帖子,例如,在搜索中加上 url:amazon;
- Followerwonk 允許你在 Twitter 中搜索人們的個人簡介,而且還可以找到兩個不同賬戶的共同關注者。
- 雖然 Facebook 的搜索功能很不好用,但它確實允許通過任何關鍵詞進行搜索,包括公司名稱。所以你可以在最初不知道一個人的名字的情況下,通過他所就職的公司最終搜索到他;
- Facebook 還能讀取上傳圖片中嵌入的文字和數字,所以即使是車牌號也有可能被搜索到;
- 提供可靠的 Facebook 高級搜索的網站,包括 FBsearch 和 Graph.tips;
- 有時候,登入你的個人賬號進行搜索時,搜索引擎會根據你的過往記錄進行頂點推送,這時「最相關(most relevant)」的篩選條件會限制你的搜索。在這種情況下,使用谷歌時可以打開「避免過濾泡沫(avoiding the filter bubble)」功能,來避免開啟這項功能;而在 Facebook 想要解決這一問題,你需要註冊一個沒有朋友和個人信息的賬戶並清除你的 Cookies。
- 一個相當先進的(但要收費的)搜索網站是 Social Links ,它的工作基於 Maltego。邁爾斯說:「它確實要花錢。但我已經用它做了很多事情。你可以在不同的社交網絡上進行面部識別搜索;搜索被標記的帖子或照片。(許多記者)對 Facebook 決定取消用戶圖譜搜索功能的能力感到失望。(但)你以前藉助 Graph Search 能做的所有事情,現在你都可以用一款 Maltego 程序和在其上運行的 Social Links 就能做到。」
Rowan Philp 現在是 GIJN 的記者。他曾是南非媒體 Sunday Times 的首席記者。作為一名駐外記者,他迄今已經在二十多個國家進行過新聞報道。