R語言
想知道有哪些議員在“吃空餉”?自己寫一個爬蟲吧!
|
熱愛數據的你,R的功能用過多少?用R編寫網絡爬蟲,你又嘗試過嗎?比利時數據達人Maarten Lambrechts最近就利用R語言的rvest包編寫了一個爬蟲程序,調查分析比利時弗拉芒大區議會議員的議政情況。他是怎麼做的?深度君經授權編譯Lambrechts的文章為你剖析,文末還有代碼分享。
全球深度報道網 (https://cnarchive.gijn.org/tag/%E7%BD%91%E7%BB%9C%E7%88%AC%E8%99%AB/zh-hant/)
熱愛數據的你,R的功能用過多少?用R編寫網絡爬蟲,你又嘗試過嗎?比利時數據達人Maarten Lambrechts最近就利用R語言的rvest包編寫了一個爬蟲程序,調查分析比利時弗拉芒大區議會議員的議政情況。他是怎麼做的?深度君經授權編譯Lambrechts的文章為你剖析,文末還有代碼分享。
談到數據新聞,總也繞不開技術。記者不懂點行話,還怎麼跟團隊技術小夥伴溝通?在NICAR會議上,數據極客同時也為NBC4調查記者的Tisha 一起和 ProPublica新聞應用開發師Sisi,向大家介紹了一些熟悉又陌生的技術,分享了不少軟件、互聯網平台等。
深度君經授權轉載鏑次元數據傳媒實驗室(ID: dyclub-org)的NICAR分享,看看清單里有哪些術語還不熟悉?文中還附有相應教程,或者參考深度君的分享《獨家 | 全球調查+數據新聞指南超全清單》哦。
上次關於網絡信息採集的文章介紹了“網絡爬蟲”這件利器如何幫助記者從網頁上獲取大量信息。不過在當記者使用網絡爬蟲時,有哪些職業倫理的問題需要注意呢?數據新聞記者繼續與您一同探討。
幾小時內損失80億美元(約合512億人民幣)?社交網絡巨頭Twitter也無法抵禦網絡爬蟲(web scraper)的強大功力。記者怎麼利用網絡爬蟲做調查?如何Get相關技能?有什麼問題需要思考?數據新聞記者為你揭秘。