編者註:工欲善其事,必先利其器。數據在當下的新聞報道中佔據越來越重要的地位,數據挖掘、處理與可視化呈現等也逐漸成為記者技能庫的標配。深度網經授權轉載騰訊全媒派(quanmeipai)最新的數據報道工具整理,以饗希望精進數據技能的記者。
數據處理及可視化呈現已越來越成為新聞人必備的一門手藝。全球知名諮詢公司麥肯錫甚至說:“數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對於海量數據的挖掘和運用,預示着新一波生產率增長和消費者盈餘浪潮的到來。”
本期全媒派(quanmeipai)整合4家權威可信的數據網站,推薦2種專業數據分析工具、7款各有所長的數據可視化工具,為你在數據大潮中揚帆導航。
調查奠基石
最有價值的數據收集網站
正如“術業有專攻”,現如今的數據網站也有各自專註鑽研的領域。從宏觀數據、微觀數據到數據分析、輿情監控,有着多種形式數據服務需求的我們,在浩如煙海的數據網站中,究竟該去敲響哪一家的門?
地球上最權威的宏觀數據:世界銀行
世界銀行是國際復興開發銀行(IBRD)及國際開發協會(IDA)兩者的聯合代稱,是非盈利國際組織世界銀行集團(WBG)旗下的組織,隸屬聯合國。
為了給自身的融資決策提供依據,也為廣大發展中國家提供借鑒,世行提供公開數據及數據分析的服務。WBG擁有189個成員國,其數據來源於各成員國的官方數據庫。
世行旗下的公開數據網站提供世界範圍內的宏觀數據。所有數據可以按照國家或者種類的分類依據進行查看,共有超過兩百個國家、地區及經濟體,20個大類的數據。值得一提的是,網頁可選擇中文模式,瀏覽沒有障礙。

世行的20種數據分類
除了宏觀數據查詢的功能,世行公開數據網還有9個數據小工具,包括提供微觀數據的“微數據”、創建個人數據報告的“Data Bank”等。可謂功能齊全,且都是免費服務。
6.72億人口的“數據化”:IPUMS
Integrated Public Use Microdata Series (IPUMS)是世界上最大的基於個體的人口數據庫。如果說世行提供的主要是官方的宏觀數據,IPUMS提供的就是專業的微觀數據。
IPUMS的數據由美國的微觀數據樣本及國際普查數據組成,其國際板塊的數據來源自多個國家的統計局,共涉及到6.72億人的普查記錄。
在網頁中,用戶可以變量+樣本的形式進行數據搜尋,支持多個變量和多個樣本的結合。雖然IPUMS提供免費的數據服務,但是要生成報告必須成為網站的註冊用戶。
在註冊過程中需要提供準確的個人信息,並用75詞全英文闡述自己的數據搜查原因和使用方式,交由網站審核。審核通過後,用戶可以獲得報告,但往後每一年都要再進行資格審查。
以挖掘數據價值為己任:Quandl
在大量數據網站井噴的年代,Quandl不僅提供數據,更在乎對數據的解讀。“Our mission is to extract value from the world’s data.”是該網站對自己的定位。
Quandl擁有一支多學科背景的團隊,成員的專業領域包括但不限於金融、技術、天體物理學,致力於挖掘難以找到的數據和數據背後蘊含的信息。
在繁多的數據類別中,Quandl尤其側重提供金融和經濟數據。付費數據來自專業的數據供應商,免費數據則來源於各大交易所、中央銀行、政府機構和私人公司。
“爆款文”數據庫:NewsWhip
NewsWhip是世界上最大的內容分析數據庫,BBC、《赫芬頓郵報》及《赫斯特雜誌》等著名媒體都是它的客戶。
技術後台以每兩分鐘一次的速度掃描全球主要傳媒平台的文章,包括Facebook, Twitter, Instagram, LinkedIn和Pinterest,再將掃描信息與2014年以來的上百萬篇文章進行對比,分析出傳播速度最快的文章有哪些特性,為媒體人創造更具用戶參與度和傳播效率的文章提供參考。
數據“精加工”
專業數據分析工具
SAS
滿足多層次數據整理需求
SAS為任何有需要的人提供數據整理的幫助,用戶可以自己整合數據、發掘數據價值。創建和共享充滿活力的交互式報告。
除了基礎的數據處理,IDC研究顯示,SAS在高級分析領域佔有33%的主導型市場份額。其高級分析軟件基於最為尖端和創新的算法,可以協助解決較大的難題,挖掘可能被忽略的內在信息。
SPSS
學術級別的數據研究工具
SPSS隸屬於IBM,致力於提供高效、易用的統計分析軟件,解決數據分析問題,從而使數據分析廣泛地應用於決策制定中。
該軟件不僅在商業分析領域廣泛運用,也是現今學術領域數據分析的主要選擇。軟件可操作性強,並且提供視頻教學。
數據呈現DIY
可視化工具箱
除了客觀數據的搜集,如何將數據整合成可讀性強的內容,是大數據背景下媒體人的另一項必備技能。
近些年來,可供選用的數據可視化工具越來越多,地圖型、圖表型、文字雲的數據呈現方式都能在網頁上快速生成。許多知名新聞編輯室也與數據可視化商業網站簽訂了合作協議,為自家的數據新聞提供技術保障。
Google Fusion Tables/xDatainsight:
多樣數據呈現的簡易入門
對於數據可視化的入門者來說,Google Fusion Tables是一個不錯的選擇。該網頁應用可以在線製作多種數據圖表,包括折線圖、柱狀圖,餅圖,甚至把數據與地理位置、時間線結合成為數據地圖、時間圖表。
操作簡單、功能多樣,是該軟件最大的優勢。
如果不熟悉英文操作界面,國內的xDatainsight則是可供考慮的選擇。與Google Fusion Tables相似,該網站提供豐富的可視化選擇,伴隨簡易的操作步驟,還有中文頁面可以選擇。
CartoDB:
把數據“放在地上”
如果你需要做一張炫酷的數據地圖,CartoDB就是這方面的佼佼者了。多種多樣的數據地圖不僅在視覺上帶來極大的滿足,受眾還可以手動放大縮小。查看特定區域的數據,與地圖進行互動。
infogr.am:
知名新聞編輯室的秘密武器
除了互動性的數據地圖,infogr.am還提供製作互動性的數據圖表的服務,並且能適應營銷、傳播、教育、彙報等多方面的需求。許多知名的傳媒及商業公司都是它的忠實客戶。
Wordle:
文字的數據可視化
Wordle是一個在線生成詞雲圖的工具網站。用戶只需要輸入文本,它就可以快速地分析其中的詞頻,生成詞雲,並且支持用戶自定義顏色和字體。
網站還為圖片生成鏈接、提供保存下載以及通過社交軟件分享的服務。但是Wordle目前只支持英文和數字文本的分析。
圖悅:
中國好詞雲
想分析中文文本怎麼辦?這款國產的在線詞頻分析工具你就千萬別錯過了。網站操作非常簡單,容易上手,提供標準、微信、地圖等多種模式的詞雲。既可以生成權重圖,也可以生成詞頻圖,一鍵切換,是詞雲製作入門的好選擇。
Tagxedo:
為你畫一幅自畫像
Tagxedo提供多種樣式的詞雲製作。你甚至可以把情書輸入進去,生成一張愛心形狀的詞雲向TA表達心意。
更值得一試的是,用戶可以輸入自己的博客地址或者推特ID,該網站就會對你在社交平台上發布過的內容進行分析,為你的網絡形象創作“速寫”。
這些數據網站及數據工具你用過哪些,體驗如何?除了它們,你還有哪些私藏乾貨?
本文經授權轉載自騰訊全媒派,較原文有刪改。
相關閱讀: