R语言
想知道有哪些议员在“吃空饷”?自己写一个爬虫吧!
|
热爱数据的你,R的功能用过多少?用R编写网络爬虫,你又尝试过吗?比利时数据达人Maarten Lambrechts最近就利用R语言的rvest包编写了一个爬虫程序,调查分析比利时弗拉芒大区议会议员的议政情况。他是怎么做的?深度君经授权编译Lambrechts的文章为你剖析,文末还有代码分享。
全球深度报道网 (https://cnarchive.gijn.org/tag/%e7%bd%91%e7%bb%9c%e7%88%ac%e8%99%ab/)
热爱数据的你,R的功能用过多少?用R编写网络爬虫,你又尝试过吗?比利时数据达人Maarten Lambrechts最近就利用R语言的rvest包编写了一个爬虫程序,调查分析比利时弗拉芒大区议会议员的议政情况。他是怎么做的?深度君经授权编译Lambrechts的文章为你剖析,文末还有代码分享。
谈到数据新闻,总也绕不开技术。记者不懂点行话,还怎么跟团队技术小伙伴沟通?在NICAR会议上,数据极客同时也为NBC4调查记者的Tisha 一起和 ProPublica新闻应用开发师Sisi,向大家介绍了一些熟悉又陌生的技术,分享了不少软件、互联网平台等。
深度君经授权转载镝次元数据传媒实验室(ID: dyclub-org)的NICAR分享,看看清单里有哪些术语还不熟悉?文中还附有相应教程,或者参考深度君的分享《独家 | 全球调查+数据新闻指南超全清单》哦。
上次关于网络信息采集的文章介绍了“网络爬虫”这件利器如何帮助记者从网页上获取大量信息。不过在当记者使用网络爬虫时,有哪些职业伦理的问题需要注意呢?数据新闻记者继续与您一同探讨。
几小时内损失80亿美元(约合512亿人民币)?社交网络巨头Twitter也无法抵御网络爬虫(web scraper)的强大功力。记者怎么利用网络爬虫做调查?如何Get相关技能?有什么问题需要思考?数据新闻记者为你揭秘。