想知道有哪些議員在“吃空餉”?自己寫一個爬蟲吧!

熱愛數據的你,R的功能用過多少?用R編寫網絡爬蟲,你又嘗試過嗎?比利時數據達人Maarten Lambrechts最近就利用R語言的rvest包編寫了一個爬蟲程序,調查分析比利時弗拉芒大區議會議員的議政情況。他是怎麼做的?深度君經授權編譯Lambrechts的文章為你剖析,文末還有代碼分享。

報道亞洲 | 數據新聞乾貨前瞻,看誰是你的菜?

第二屆亞洲深度報道大會是數據新聞速成的好機會,近三分之一的議程有關數據新聞,從入門的挖掘和清理數據、文件整合,到較高級的數據分析、數據庫管理、地圖繪製和可視化製作技術。來自衛報、紐約時報、哥倫比亞大學、IndiaSpend和湯森路透的頂尖數據培訓師將出席工作坊、講座、分享案例,介紹實用的技巧、交流經驗。

數據清洗神器Open Refine簡明入門

數據一多,就有可能出現數據名目不統一、殘缺或者冗餘等情況,且數據量越大錯誤可能越多。如何才能使雜亂無章的數據變得清晰有致?免費開源的數據清洗工具Open Refine就是你的好幫手,不但可以清洗數據、轉換格式,藉助網絡服務和外部數據幫你擴展,而且還能鏈接數據庫。深度君經授權分享數據新聞網編寫的《中國數據新聞工作坊培訓手冊》,為你總結Open Refine的簡明使用方法。

乾貨 | 數據收集和處理工具一覽

進入大數據時代,調查報道愈加成為信息戰。從哪裡收集有效數據?如何抽取、篩選、整合、分類大量瑣碎的信息?如何分享、存儲數據,並實現隨取隨用?深度君整理了一張數據收集和處理工具清單,分為八大類,方便實用,各有所長,供大家選擇。