想知道有哪些议员在“吃空饷”?自己写一个爬虫吧!

热爱数据的你,R的功能用过多少?用R编写网络爬虫,你又尝试过吗?比利时数据达人Maarten Lambrechts最近就利用R语言的rvest包编写了一个爬虫程序,调查分析比利时弗拉芒大区议会议员的议政情况。他是怎么做的?深度君经授权编译Lambrechts的文章为你剖析,文末还有代码分享。

报道亚洲 | 数据新闻干货前瞻,看谁是你的菜?

第二届亚洲深度报道大会是数据新闻速成的好机会,近三分之一的议程有关数据新闻,从入门的挖掘和清理数据、文件整合,到较高级的数据分析、数据库管理、地图绘制和可视化制作技术。来自卫报、纽约时报、哥伦比亚大学、IndiaSpend和汤森路透的顶尖数据培训师将出席工作坊、讲座、分享案例,介绍实用的技巧、交流经验。

数据清洗神器Open Refine简明入门

数据一多,就有可能出现数据名目不统一、残缺或者冗余等情况,且数据量越大错误可能越多。如何才能使杂乱无章的数据变得清晰有致?免费开源的数据清洗工具Open Refine就是你的好帮手,不但可以清洗数据、转换格式,借助网络服务和外部数据帮你扩展,而且还能链接数据库。深度君经授权分享数据新闻网编写的《中国数据新闻工作坊培训手册》,为你总结Open Refine的简明使用方法。

干货 | 数据收集和处理工具一览

进入大数据时代,调查报道愈加成为信息战。从哪里收集有效数据?如何抽取、筛选、整合、分类大量琐碎的信息?如何分享、存储数据,并实现随取随用?深度君整理了一张数据收集和处理工具清单,分为八大类,方便实用,各有所长,供大家选择。

财新经验:做新闻,如何搞定搜索与数据

记者做调查报道时,如何搜索资料,找出人物和公司关系的蛛丝马迹?数据驱动的报道从哪里拿数据?怎么评估数据的质量?财新网数据新闻主编黄晨与你分享财新的实践经验。