報道亞洲 | 數據新聞走向何方?“故事為核,跨界合作”

Print More

我們如今生活在一個“大數據時代”,全世界的政府、企業、甚至個人每天都在製造海量數據。“數據新聞”應運而生,越來越多的記者開始投身到這片新聞藍海中,挖掘藏在數據中的“新聞價值”。那麼當下數據新聞的趨勢如何?數據新聞的未來又是什麼樣子呢?

第二屆亞洲深度報道大會上,深度君邀請到了英國《衛報》的數據項目編輯 Helena Bengtsson,伊利諾伊大學奈特企業與調查報道項目教授 Brant Houston,以及前路透社香港分社數據新聞編輯 Irene Liu。三位資深數據記者坐而論道,暢談數據新聞的過去和未來。


數據新聞將去向何方?

irene-by-milan-poudel-336x224

Irene Liu (左),攝:Milan Poudel

Irene Liu:未來,數據新聞會延伸到各個生活的方方面面,我認為這也正是它令人興奮的地方。數據新聞近年來的發展蒸蒸日上,我看到很多新工具不斷湧現。這些工具能令記者們的工作更加便利,幫助他們發掘以前接觸不到的數據資源。不僅如此,當下“數據”的概念也發生了巨大變化。我們曾經認為只有電子錶單上那些數值型信息,才可以被稱為“數據”;但是現在,“數據”可以是網絡上任何非結構化的信息。

但是不論工具如何發展,數據的概念如何變化,我認為數據新聞的核心是不變的——用數據講故事,和對權力問責。只要秉承這個初心,那麼只有天空才是我們的極限了。

Brant Houston:我覺得數據新聞的未來可能會走向更高級的算法領域。諸如聚類(clustering)、主題模型(topic modeling)等高級算法,已經被應用到自然語言處理(NLP)技術中了。面對龐大的文本數據集,這些高級算法可以幫我們發現其中的主題或特徵。

為了從海量數據中發掘出想要的信息,數據記者們也需要藉助一些平台或工具,比如利用網絡社交媒體的信息進行數據新聞報道,這是我們已經在做的事情。今後我們將會面對更多非結構化的數據,數據新聞要做的就是把它們變成結構清晰的內容,發現其中的價值。

Helena Bengtsson:數據新聞如今正在向兩個方向前進。第一個方向是跨領域合作。當我剛開始做數據新聞的時候,所有的工作都由記者一個人來完成;而現在,記者可以和工程師、設計師一起合作完成項目,事半功倍。

從故事的方面來說,我希望數據新聞的第二個方向是,能處理更大、更加非結構化的數據集。 目前我們尚未有能力處理大批量文本內容,但這是我們努力的方向。今年,一份有關國際投資的跨境調查以其涉及數據之龐大震動世界。某種程度上,我希望我們十年後才拿到這樣一份數據,因為到那時,技術的發展應能讓我們做出更多有價值的新聞故事。

 

數據記者面臨最大的挑戰是什麼?

helena-1-336x224

Helena Bengtsson, 攝:Aseem Banstola

Bengtsson:我覺得是不被理解。現在仍然有很多人不清楚我們在做什麼,也不知道我們為什麼要做這些東西。我從1997年開始從事數據新聞,我工作的一部分內容就是向我的同事們普及數據新聞的概念。即使在《衛報》,我也一直在做這件事。向同行啟蒙和普及數據新聞是我的主要工作,我會告訴他們,數據新聞都在做什麼,以及數據新聞的價值和意義。

Liu:我認為可能是對數據的認知。現在有很多人認為,數據是客觀的,而人和機構都是有偏見的。但事實上,數據也是由人和機構創造的。所以我們對待數據要始終保持質疑的精神。與此同時,數據記者也要意識到,自己的假設、先入為主的觀念以及不自知的偏見也會影響他們處理這些數據資源。所以不論我們的對象是誰,個人也好,數據也罷,記者們都要時刻保持警惕,保證故事的可靠性。

Houston:當我剛進入這個領域的時候,數據新聞是很簡單的。你只需要掌握一些數據庫管理軟件,幾個數據清理的工具,再加上一點基本數學知識就可以了。但是現在,這個行業對數據記者的要求提高了。如果想要拿到一些數據,你可能必須要從網頁上進行爬取數據,然後你還需要做數據清理、結構化等工作。

對數據記者來說,另一個重大的挑戰來自政府官員。有時候,政府並不會向記者提供他們需要的數據。數據新聞歸根結底就是信息的爭奪,記者如何與政府官員鬥智斗勇已經是一個老生常談的話題。作為一個記者,比起從前的文件檔案,我更喜歡現在的電子數據。因為電子數據就像水流一樣,很難被完全封閉起來——總會發生“泄漏”。

 

當下的數據新聞中最令人激動的事情是什麼?

Liu:數據新聞的跨地域、跨組織交流合作一定是最令人激動的事情之一,這也是數據新聞之後的發展方向。我們生活在一個全球化的世界,大家在創作數據新聞時遇到的困難,已經超出了媒體和國家的界限。當下,資源越來越緊缺,而我們對新聞價值也有着越來越高的追求。想要生產出具有影響力的數據新聞,唯一的方法就是通力合作。數據記者們必須攜起手來,共同應對挑戰。

Houston:我已經在數據新聞領域工作了整整

brant-by-aseem-banstola-336x224

Brant Houston, 攝;Aseem Banstola

30年了。對我來說,現在看到有這麼多人從事相關工作,有這麼多關於數據新聞的職業培訓,而且數據新聞甚至走進了大學課堂,這本身就是一件很令人激動的事。

數據新聞對我來說,核心永遠是故事。如今的數據記者不僅擅長傳統分析,還懂得使用合適的呈現方式,讓新聞故事更具可讀性。從一開始的不被人理解,到現在湧現出這麼多優秀的數據作品,回首數據新聞的發展歷程,一路走來令人感慨萬千。

Bengtsson:最令我興奮的應該是自然語言處理技術,以及在大規模非結構化文本數據領域的技術進展吧。很多語言學家也加入到了技術的開發工作中,目前已有能處理自然語言的腳本文件,但這仍是起步階段。

機器學習(Machine Learning)是另一個令人興奮的領域。機器學習,簡單來說就是先用少量的文本信息“教”計算機如何處理數據,然後再讓它按照之前學習的模式,批量地處理大規模的文本信息,最終得出一個有效的結果。雖然至今我還沒有發現有哪些新聞作品成功地運用了這項技術,但我相信這是一個很有趣的領域,值得人們繼續關注。

 

你最喜歡的工具是什麼?

Houston:我喜歡數據庫管理軟件,或許是因為我一入門就用那個。

Liu:到目前為止還是Excel。

Bengtsson:我最喜歡的工具還是Excel,它也是我使用最多的工具。

 

 

編譯/程一祥

編輯/Ivan Zhai,梁思然


headshotslgiordano_7905-e1474547218933-140x140

 

Adiel Kaplan是常駐美國西雅圖的自由調查記者,目前為當地Crosscut, Seattle WeeklyInvestigateWest等多家媒體供稿。

 

想知道更多會議乾貨?請關注全球深度報道網(cn.gijn.org),微博@全球深度報道網及其話題#報道亞洲16#、微信“全球深度報道網”(ID:gijn_cn),Twitter @gijnCh帶來的系列分享。我們的最新報道有:

《調查報道,聯結亞洲——第二屆亞洲深度報道大會開幕》

《報道亞洲 | 傳感器與無人機在新聞中的應用》

《報道亞洲 | 視頻新聞,如何用影像驅動調查與還原真相》

《報道亞洲 | 忘掉奧斯卡,聽“聚焦”小組編輯現場講述調查項目管理》

《報道亞洲 | 查IP、找圖片、析商業:BBC專家網絡調查工具秘籍》

《報道亞洲 | 如何科學質疑“健康專家”?前世衛發言人為你分享技巧》

《報道亞洲 | 頂尖調查記者的數據處理與可視化利器推薦》

《報道亞洲 |政府公開數據哪裡找?普利策獎得主“調查寶典”全收錄》

Print Friendly, PDF & Email

發表回復

您的電子郵箱地址不會被公開。 必填項已用 * 標註