儘管開源數據難以獲取,數據分類的方式和可用性不盡人意,中國數據新聞還是在過去五年取得穩健增長。自2012年數據新聞走上正軌以來,數據新聞記者和技術帝們嘗試和升級了多樣化的產品,同時為新聞業和市場提供了新的創意模式。
本周在首爾召開的第三屆亞洲深度報道大會上,三位資深中國數據從業者與數百名來自全球各地的調查記者們,分享了各自的經驗和技巧。三位主講嘉賓所服務的平台,恰巧也代表了中國數據新聞的三種運營模式。
澎湃新聞:從傳統媒體到數字平台
澎湃新聞的執行編輯呂妍認為,在從傳統媒體到數字平台的過渡期中,數據新聞扮演了一個很重要的角色。
澎湃前身是上海報業集團主管的《東方早報》。過去,中國的線上新聞多是如新浪等門戶網站,抓取各個新聞機構報道的新聞,再彙集到一個版面。初創伊始,澎湃就想嘗試做一些不一樣的新聞,希望通過獨立採訪和原創內容,報道突發新聞,樹立自己的品牌。所以《東方早報》整體向互聯網平台轉型。
呂妍用三個階段形容澎湃的數字新聞發展過程:製作地圖,抓技術,再到用數據講故事。“我想指出一個有趣的現象,”呂妍說: “在紙媒時代,數字記者、攝影師和圖表設計師都被分到視頻團隊下工作,他們扮演的是旁加支援的角色。但是改版為澎湃之後,數字平台上線之後,他們開始成為內容輸出者,變成了創作團隊。”
新一線城市研究所 :重新排名中國的城市
第一財經的新一線城市研究所是一個從一開始就專註於數據內容生產的團隊。2017年,其發布的新一線城市排名在社交媒體上獲得了巨大關注,討論和爭議隨之而來。在這份排名中,成都排名僅次於長期位居一線的北上廣深,實驗室的算法里,成都在很多的排名小項中,都獲得了近乎完美的得分。實驗室將這個結果提煉出了一個新的概念:新一線。
被問及為什麼這個排名能被傳播這麼廣,研究所主編沈從樂說:“可能是因為中國人喜歡排名。但是細究下來,這份排名納入了足夠多的城市,這可以讓每個人都感到,這個排名與自己息息相關。”
沈與其團隊成功把原來的城市排名專題,發展成一個獨立的數據項目。如今,研究所一邊用自己收集的城市數據發布排名報告,一邊對客戶負責,為客戶感興趣的方面進行分析。
數據工場:“3E”策略——Encourage(鼓勵),Exchange(交流),Education(教育)
崔箏是數據工場公眾號平台“數可視”的主編。數據工場是一家圍繞數據新聞生產的數據服務供應商,提供數據挖掘和數據可視化等服務。
崔箏認為,中國現在的移動閱讀群體龐大,適用於這個閱讀端的數據新聞有廣闊的發展空間。但是,數據新聞的技術要求高,培訓一個專業的數據新聞人才需要數年時間。為此,數據工場着重在三點進行拓展:鼓勵數據新聞、創造交流機會,以及培養數據新聞人才:
- 鼓勵:數據工場Dataworks在過去三年都舉辦了數據新聞競賽,收集的作品超過300件。崔箏同時指出,許多獲獎者已發展成為專業數據記者。
- 交流:舉辦研討會,邀請國際各地記者交流觀點,建立交流網絡。
- 教育:舉辦了100多場講座、工作坊和20多場研討會,上線了一個MOOC課程。
研討會尾段,三位編輯回答了國際調查記者們最感興趣的問題:他們是從哪裡收集公開數據的?
呂妍:公司年鑒是查找開放數據的好方法。然而,我們的法寶是與專題記者建立合作,例如專門報道醫療的記者,他們知道哪裡能夠最快地找到最全的醫療數據。另外,我們會收集政府、環境組織提供數據,例如官方報告、最高法院判決書。有的時候,這些專業文件是以特定的方式撰寫的,不方便我們直接使用,我們就用Python將我們要的數據抓取出來。
沈從樂:我們的主要數據來源於互聯網公司的大數據,比如阿里巴巴或者京東提供的數據,這些數據使團隊能夠提供一個觀察城市的新視角,並且提供更權威的排名和報告。但是我們需要去辨別,公司給出的數據是否真實、全面。
崔箏:我們通常會在網上或小城市圖書館年鑒中找統計數據。我記得在做一個項目時,我們從淘寶網上買了舊文件,從裡面把數據扒下來。此外,我們也與科技公司合作。例如,如果我們想要房地產價格數據,可以找一找在線房地產代理商,他們通常都樂意把數據提供給我們。
編輯/Ivan Zhai
相關閱讀: