尽管开源数据难以获取,数据分类的方式和可用性不尽人意,中国数据新闻还是在过去五年取得稳健增长。自2012年数据新闻走上正轨以来,数据新闻记者和技术帝们尝试和升级了多样化的产品,同时为新闻业和市场提供了新的创意模式。
本周在首尔召开的第三届亚洲深度报道大会上,三位资深中国数据从业者与数百名来自全球各地的调查记者们,分享了各自的经验和技巧。三位主讲嘉宾所服务的平台,恰巧也代表了中国数据新闻的三种运营模式。
澎湃新闻:从传统媒体到数字平台
澎湃新闻的执行编辑吕妍认为,在从传统媒体到数字平台的过渡期中,数据新闻扮演了一个很重要的角色。
澎湃前身是上海报业集团主管的《东方早报》。过去,中国的线上新闻多是如新浪等门户网站,抓取各个新闻机构报道的新闻,再汇集到一个版面。初创伊始,澎湃就想尝试做一些不一样的新闻,希望通过独立采访和原创内容,报道突发新闻,树立自己的品牌。所以《东方早报》整体向互联网平台转型。
吕妍用三个阶段形容澎湃的数字新闻发展过程:制作地图,抓技术,再到用数据讲故事。“我想指出一个有趣的现象,”吕妍说: “在纸媒时代,数字记者、摄影师和图表设计师都被分到视频团队下工作,他们扮演的是旁加支援的角色。但是改版为澎湃之后,数字平台上线之后,他们开始成为内容输出者,变成了创作团队。”
新一线城市研究所 :重新排名中国的城市
第一财经的新一线城市研究所是一个从一开始就专注于数据内容生产的团队。2017年,其发布的新一线城市排名在社交媒体上获得了巨大关注,讨论和争议随之而来。在这份排名中,成都排名仅次于长期位居一线的北上广深,实验室的算法里,成都在很多的排名小项中,都获得了近乎完美的得分。实验室将这个结果提炼出了一个新的概念:新一线。
被问及为什么这个排名能被传播这么广,研究所主编沈从乐说:“可能是因为中国人喜欢排名。但是细究下来,这份排名纳入了足够多的城市,这可以让每个人都感到,这个排名与自己息息相关。”
沈与其团队成功把原来的城市排名专题,发展成一个独立的数据项目。如今,研究所一边用自己收集的城市数据发布排名报告,一边对客户负责,为客户感兴趣的方面进行分析。
数据工场:“3E”策略——Encourage(鼓励),Exchange(交流),Education(教育)
崔筝是数据工场公众号平台“数可视”的主编。数据工场是一家围绕数据新闻生产的数据服务供应商,提供数据挖掘和数据可视化等服务。
崔筝认为,中国现在的移动阅读群体庞大,适用于这个阅读端的数据新闻有广阔的发展空间。但是,数据新闻的技术要求高,培训一个专业的数据新闻人才需要数年时间。为此,数据工场着重在三点进行拓展:鼓励数据新闻、创造交流机会,以及培养数据新闻人才:
- 鼓励:数据工场Dataworks在过去三年都举办了数据新闻竞赛,收集的作品超过300件。崔筝同时指出,许多获奖者已发展成为专业数据记者。
- 交流:举办研讨会,邀请国际各地记者交流观点,建立交流网络。
- 教育:举办了100多场讲座、工作坊和20多场研讨会,上线了一个MOOC课程。
研讨会尾段,三位编辑回答了国际调查记者们最感兴趣的问题:他们是从哪里收集公开数据的?
吕妍:公司年鉴是查找开放数据的好方法。然而,我们的法宝是与专题记者建立合作,例如专门报道医疗的记者,他们知道哪里能够最快地找到最全的医疗数据。另外,我们会收集政府、环境组织提供数据,例如官方报告、最高法院判决书。有的时候,这些专业文件是以特定的方式撰写的,不方便我们直接使用,我们就用Python将我们要的数据抓取出来。
沈从乐:我们的主要数据来源于互联网公司的大数据,比如阿里巴巴或者京东提供的数据,这些数据使团队能够提供一个观察城市的新视角,并且提供更权威的排名和报告。但是我们需要去辨别,公司给出的数据是否真实、全面。
崔筝:我们通常会在网上或小城市图书馆年鉴中找统计数据。我记得在做一个项目时,我们从淘宝网上买了旧文件,从里面把数据扒下来。此外,我们也与科技公司合作。例如,如果我们想要房地产价格数据,可以找一找在线房地产代理商,他们通常都乐意把数据提供给我们。
编辑/Ivan Zhai
相关阅读: