10月初,金秋好時節,第三屆亞洲調查記者大會在韓國首爾召開。
儘管“調查報道”仍是大會主旨,但“數據”的獲取、使用和展現,已成為另一個重要議題。演講期間,記者們分享了各種各樣的常用工具。下面,我們以三個話題為例,整理了一份詳細的工具清單:
一、貿易追蹤:如何鎖定走私貨?
全球貿易,使商品流通更快捷也更複雜化。要了解全球的宏觀貿易情況,UN Comtrade Database (聯合國商品貿易統計數據庫),可提供目前最權威的國際商品貿易數據。數據庫收集了超過6000種商品、約17億個數據記錄,數據最早可回溯至1962年。各國家地區上報的數據均被轉換成聯合國統計署的統一標準格式。
在它的Knowledge base菜單中,可以查到各種商品所對應的編碼(廣泛通行的HS-Code,由國際海關理事會制定,每樣商品對應唯一一個code,例如“大米”對應“1006”)。該網站支持在線查詢,或下載有所有編碼的Excel。
而如果要追蹤具體的運輸行為,則須知道一些能夠識別到這趟運輸、相關貨船、甚至某個集裝箱的信息:
1.提單號。英文為bill of lading,簡稱B/L,它是一種貨物所有權的憑證,也是託運人與承運人之間所訂的運輸契約的證明。通過提單號,可以直接辨識出承運公司。

來源:wikipedia
此外,提單上一般會寫清此次運輸的託運人、收貨人、貨物描述、毛重、凈重、裝運港、卸貨港等等。一旦獲得提單號,可以在網上進行查詢(如 https://www.shipmentlink.com/、箱訊等),獲得提單上的豐富信息。
2.集裝箱號。指裝載貨物進出境的集裝箱兩側標識的全球唯一的編號。其組成規則是:箱主代號(3位字母)+設備識別號“u”+順序號(6位數字)+校驗碼(1位數字)。例如:EASU9809490。
換言之,知道集裝箱號就知道箱主是誰。也可以據此到運輸公司/船舶公司網站上進一步查詢。
3.船舶編碼。每艘船都有唯一的編碼(IMO number),據此搜索可得到船舶信息(名字、噸位、種類、旗幟、建造時間)。Equasis (歐洲優質船運信息系統),是目前最全的船舶資料庫。
例如,搜索IMO number為9238765的船隻,可以得到這艘船的基本信息,例如名字、噸位、類型、建造時間、旗幟等。
在Equasis的Statistics菜單中,還可以查到全世界各年度的船舶統計報告。
另外,Tokyp MOU/東京備忘錄(http://www.tokyo-mou.org/)有全面的PSC數據庫(Port State Control,即港口國監控,對外國船舶及船員技術狀況及能力進行檢查),方便查詢船舶的滯留情況、老舊船隻信息等。
還是搜索IMO number為9238765的船隻,可以看到各項基本信息,以及在港口國檢查的記錄,例如今年5月在上海有滯留,9月又被評定為高風險船隻。
除了靠自己順藤摸瓜以外,記者們也可以尋求專業公司的幫助。例如,Panjiva是一家能夠提供世界各國詳細的貨運數據、公司數據、方位數據的商業公司。
此外,還有一些網站支持實時航運信息、港口信息的查詢。如shiptracking.eu,船訊網(http://www.shipfinder.com/)等。

shiptracking.eu頁面

船訊網頁面
二、信息挖掘:如何合法“查戶口”?
spokeo(https://www.spokeo.com/)於2006年成立,聲稱自己從公開社交信息搜集記錄或個人信息。在該網站上,只需搜索姓名,地址,電子郵件,電話或用戶名之一,即可找到搜索對象的詳細信息,甚至包括對象曾在哪些地方住,以及誰和他們一起住,或者更多意想不到的信息。
比如查找John Anderson,可以看到這些名字的分布、年齡、親戚以及更多的聯繫方式,事實上還有相關社交信息,並能通過圖片確定這個人是否是你尋找的人。
同類型的網站還有:
……
比如想查找川普的信息,通過peekyou得到如下:
同時,它可以跳轉到其他同類型網站,為你提供接近的信息。
OCCRP data (https://data.occrp.org/)是一個關於犯罪和腐敗的文件數據庫,擁有超過42億公共記錄和鏈接,背靠OCCRP平台,該平台由40個非營利性調查中心,數十名記者和全球幾個主要區域新聞機構組成,他們的網絡遍布歐洲、非洲、亞洲和拉丁美洲,主要揭露全球有組織犯罪和腐敗。
比如搜索俄羅斯總統普京的信息,可得到如下結果,並提供如信源、材料類型、國家、語言等多種檢索方式。
至今為止,OCCRP的報道曾推進政府凍結或扣押問題資產57.35億美元,84次刑事調查和政府調查,促使發布147個逮捕令,並影響過20次重大解僱,包括總統,總理和主要跨國公司的首席執行官,可謂碩果累累。
此外假如想了解社交網站的信息,還有如下查找方式:
stalkscan.com查詢Facebook數據
tweetbeaver推特數據查詢
followerwonk推特關係查詢
Geofeedia基於地理位置的社交媒體信息搜尋
pipl.com通過搜索姓名/郵件/電話查找社交媒體信息
archive.org / aichive.is查詢被刪除的社交媒體記錄
有時候,除了人以外,網站的身份也需要核實。
domaintools(https://www.domaintools.com/) 是一個在線域名信息查詢工具,包含:Whois 查詢 (Whois Lookup)、域名查詢 (Domain Search)、IP 反向查詢 (Reverse IP)、DNS 工具 (DNS Tools)、域名歷史 (Domain History)、域名服務器監測 (Name Server Spy)等。
以whois為例查詢一家域名為Loveukbags.com的購物網站,儘管看起來真實可靠,但用 https://whois.domaintools.com/查詢後發現眾多含有關鍵字“bags”的購物網站,例如HandbagsSale.com、ShoesBags.com、PursesHandbags.com等,同時發現這家購物網站的服務郵箱掛靠在多達2988個域名上,註冊商是珠海某公司,但IP地址在美國亞特蘭大,證明是一家虛假購物網站。
dnslytics(https://dnslytics.com/)用於 IP信息、域名信息、ipv4、ipv6等查詢,還可以單獨點開域名,看看它有沒有包含在DMOZ這樣的公共網頁目錄裡面,有助於發現釣魚網站。
此外還有:
Whatismyip(https://www.whatismyip.com/)用於檢索目標IP所處的國家、城市、城區、郵政編碼、網絡提供商、時區和經緯度等信息,定位相當準確。
icann whois 則可以用於查詢網站持有者信息(https://whois.icann.org/en)。
三、衛星圖:如何獲得上帝視角?
近兩年,衛星圖頗受追捧。人們用它來觀測位置、評估整體環境,通過拖動時間軸,往往還能看到滄海桑田的變化。就工具而言,Google Earth最為常用,但是存在清晰度不高、年份缺失、維度單一等問題。有哪些工具可以作為補充呢?
首先是NASA(美國國家航空航天局)。它提供豐富的圖片庫,以及可交互的衛星圖網站,如https://search.earthdata.nasa.gov/、https://worldview.earthdata.nasa.gov/等等,可供慢慢探索。
此外,一些觀測衛星的主頁上也會公布數據集。例如,NASA的Terra衛星,攜帶了5種觀測工具,從不同角度觀測地球,獲得的圖片可以適用於不同的需求:
在它們各自的網站上,可以不同程度的下載到衛星圖像,甚至原始數據。例如,這是ASTER分別拍下的,1984年和2015年的蘇州。

來源:https://asterweb.jpl.nasa.gov/
如果專門尋求氣象方面的衛星圖像,NOAA(美國國家海洋和大氣管理局)有友好的查詢功能。通過交互頁面,我們可以查看全球實時的氣象狀況,並下載圖片。

全球實時氣象狀況
另外,NOAA還提供專門追蹤大西洋颶風的在線工具(https://www.nesdis.noaa.gov/content/hurricane-imagery),既能觀測實時的情況,也包含以往颶風的動態衛星圖像。

今年十月的颶風Michael
如果這些開放數據源都無法滿足需求,可能需要求助於商業公司。著名的如DigitalGlobe、Planet等。儘管多數服務需要付費,但他們有時也會放出部分受關注的衛星圖像,或者給予一定的試用期。
例如,DigitalGlobe推出的Open Data Program,在遇到大型災害時,一般都會放出衛星圖。例如颶風、海嘯等。

印尼海嘯前夕的衛星圖
Planet則提供14天試用其在線工具的機會,並可下載特定尺寸的衛星圖像。
此外,還有一些社區類網站,致力於識別衛星圖。
Tomnod是一個志願者社區,致力於用衛星圖像探索地球、解決現實問題。例如,目前正在進行的項目是尋找韋德爾氏海豹。作為南極洲的標誌之一,韋德爾氏海豹很可能受氣候變化和商業漁業的影響。通過在衛星圖上尋找海豹,有助於人們了解其種群規模、以及現今的居住地。

來源:Tomnod
此外,一些高校、研究所的網站上,也會公開一些衛星圖像或研究成果。
為了挖數據,真的是很拼了…趕快把你的工具箱豐富起來吧!
相關閱讀:
本文原載於微信公眾號“一頭倭瓜精”,全球深度報道網經授權轉載。