當下,全球各地政府、企業等機構每天都在製造海量信息,可供記者利用的數據越來越多。信息化時代的深度報道記者必須懂得如何去獲得、整理以及準確地分析這些“結構化的信息”,進而從中挖掘出最有價值的新聞。 全球深度報道網為此專門整理出一份數據新聞(Data Journalism)的實用清單,幫助各位大家推開大數據之門。我們會持續更新這份清單,以便提供業內最前沿的資訊。如果你有任何尚未被我們收錄的資料,無論用何種語言撰寫,都歡迎你通過電子郵件發送給我們:hello at gijn.org。衷心感謝你的支持。
入門必讀
1989年在美國成立的計算機輔助新聞報道協會(http://www.ire.org/nicar/)是一個致力於在全球培養深度報道記者的組織,目標是通過提升數據應用技巧來拓寬記者們的調查渠道。除了開展“新手訓練營”等課堂培訓項目,協會還設有電子圖書館和練習用數據庫,並負責主辦一年一度的計算機輔助新聞報道研討會。此外,協會還出版了一部暢銷書籍:《計算機輔助新聞報道實用手冊》(http://store.ire.org/) 而對剛接觸計算機輔助新聞報道的朋友,美國的Poytner網站(http://www.poynter.org/)則推出了有效地分析數據的五個秘訣和十個工具。 在英國,深度報道新聞學中心(CIJ)也出版了一本有關數據新聞學的手冊(http://www.tcij.org/resources/handbooks/data-journalism),以幫助感興趣的記者進一步分析挖掘數據。同時,CIJ在其網站上提供了大量關於數據新聞學的其它書籍、指南和視頻資源。 著名的數據新聞學網站(http://datadrivenjournalism.net/)同樣為記者們提供了完整的學習資料。 國際記者網(http://ijnet.org/)上也可以找到數據新聞有關的課程、輔助工具和其它資料。 Hacks/Hackers (http://hackshackers.com/)是一個聚集大批程序員和深度報道記者的全球性組織,推動用數據發掘有影響力的新聞報道。該組織通過各地分支機構向記者提供培訓課程。 The Investigative Dashboard網站(http://www.investigativedashboard.org/)提供了數據挖掘、數據可視化以及人機關係網分析等方面的工具。你可以通過網絡搜索引擎迅速找到這些工具的對應入門教程。
數據新聞學手冊(http://datajournalismhandbook.org/)是一本由來自世界各國的數十位數據新聞學專家合作編纂而成的教材。你可以在網上免費下載包括中文(http://datajournalismhandbook.org/chinese/)在內的各語種版本。
數據挖掘
codecademy.com是一個提供互動式編程培訓的免費網站。你可以在上面零基礎學習幾種常見編程語言的基礎知識,包括HTML, CSS, JavaScript, Python, Ruby, 和PHP. 麻省理工大學官方網站提供了若干免費在線課程,講解如何使用Python,Java和C++這些計算機語言編寫程序。 Michael Martl發布了一本開源的在線教材,供人們學習使用Ruby on Rails。 ProPublica提供的“購物清單”囊括了若干實用工具和培訓,指導人們使用Ruby在網頁上的抓取數據。 Online Journalism網站發布了一篇關於如何在數據科學維基百科獲取數據的入門指南。
數據分析
Investigative Reporters and Editors提供一個簡單的教程,告訴你如何將PDF文件轉換成普通文本格式文件。 加拿大麥吉爾大學的電子數據資源服務提供了一個關於如何將PDF文件中的電子表格導出為Excel表格的教程。 School of Data提供了從如何找到合適的數據庫,到基礎的Excel使用技巧,再到如何利用挖掘到的數據完成新聞報道的一整套解決方案。 Dan Nguyen整合了使用Google Refine清洗結構化數據的方法,以及一些視頻教學鏈接。 Github提供了“SQL入門介紹”。
數據可視化
美國統計學家Edward Tufte在可視化信息測繪方面有一些著述和課程,這些著述和課程均已成為行業標準。 美國統計學家邱南森創立了Flowing Data網站,他同時也是《鮮活的數據:數據可視化指南》和《 數據之美:一本書學會可視化設計》這兩本書的作者。 Visualisationofdata.com 網站提供了信息圖製作指南,以及其他相關信息。 Esri為ArcGIS愛好者準備了一套關於如何使用ArcGIS進行信息測繪的免費課程。 Gustavo Faleiros創建了JEO. JEO是一個WordPress主題模板,供新聞機構、博客博主和非政府組織在電子地圖上發布帶有地圖定位信息的新聞報道。 Peter Aldhous 整合了一套入門教程,是關於如何使用Excel的免費社交網絡插件NodeXL的。 數據可視化目錄是“幫你找到合適的數據可視化方案”的一個持續進行中的項目。
(譯:Benjamin Zhou)