在我的數據新聞教學過程中,我經常會介紹幾種常見的數據報道類型。於是我想,我可以拿100篇數據新聞作品來做分析,看看是否能找出每種報道角度的使用頻率。
我發現,數據報道的核心角度實際上可大致分為七個。很多人會在報道中加入其他次要角度(例如,一篇談“變化”的報道可能會接著提到某件事情的規模),但我觀察到的所有數據報道的導言都會聚焦在其中一個角度。
以下我將講解這些最常見的報道角度能如何幫你找出新聞點,以及數據新聞操作中的注意事項。
數據角度之一:規模──這個問題有多大?
從規模切入的報道也許是最常見的數據報道類型了。這些報道會指出一個大問題,或是某個已成為討論熱點的議題規模。
最一般的情況下,這些報道會提供最新公布的數據:可能是最新的失業數據、犯罪數量、空污程度、某些領域的開支、出生、死亡或結婚相關的數字。
例如,在疫情的前幾個月,我們每天都會讀到有關確診數量、死亡人數、篩檢數等的報道。
這類報道的例子包括《研究估計英國護理中心新冠肺炎死亡人數可能達6000人》,但也有像《過度輕判檢討計劃執行不力》這類報道,其導言便是基於對你提出的問題規模的反應。
有時規模會被作為單一事件報道的背景,例如在這篇《無人機導致蓋特威克機場混亂》(有多少未遂事故?),或是某項政策提案,如《政府表示,新手駕駛可能被禁止夜間駕駛》(有多少新手駕駛不滿19歲?)。
從規模切入的報道是比較好寫的類型之一:在許多情況下,記者不需要做什麼計算。

《紐約時報》的這篇文章概述了疫情期間死亡人數的規模。截圖。
甚至,這類報道的主要工作很可能是去確立該規模的背景脈絡──而最糟的是,它變成一篇只有“大數據”的故事(“在某樣東西上花了很多錢”或是“很多人發生了某些事”),但讀者並不清楚這是否真的有新聞價值或其實很正常。
因此,通過使用百分比或比例(例如,“五分之一”),或用比較和類比(用於該計劃的資金相當於500名教師的工資),將規模脈絡化是很重要的。
你也可以帶入“變化”(change)以及/或是“差異”(variation)作為第二個角度:為你描述的規模建構時間脈絡,或者指出這個規模有什麼變化。
例如,在上面這篇《紐約時報》的文章中,新冠病毒爆發的“真實數量”(規模)馬上就藉由圖表而脈絡化,這些圖表顯示了自年初以來全球各國的確診人數變化。
數據角度之二:變與不變——某事在上升、下降或並未發生
從變化切入的報道幾乎和從規模切入的報道一樣常見——而且可能更吸引讀者。
畢竟,變化本身就具有新聞價值,還能提供你標題中所需的動詞(“上升”、“下降”、“增長”)。
一旦你找出數據中的某些變化,你就可能要進一步找出原因:為什麼這些數字會上升或下降?
你也可以在你的報道中加入一個次要的角度,探討這一趨勢的變化——這些數字上升或下降的區域、有哪些極端的狀況。
這可以幫助你將報道導向“為什麼?”,因為受影響最大的地區很可能是那些最了解這個問題、並能對此發表意見的地區。

這篇《貝爾法斯特電報》(Belfast Telegraph)的報道顯示出從“變化”切入的角度的力量。截圖。
當報道數據的變化時,重要的是得注意兩個因素:季節性因素和誤差幅度。
季節性因素通常可預測、不特別,因而沒有新聞價值,例如財政年度或學期結束,新車的發布,或者僅僅是溫度的變化。年度之間的對比(例如,今年8月與去年8月的對比)或針對季節的調整經常被用來防止季節性因素的影響。
同時,誤差範圍則表示真實數字實際所在的區間。因為許多數據集是基於部分樣本,再推估至其他更大的群體,因此誤差範圍(或信賴區間)便被用來指出推估的準確程度。如果觀察到的變化在誤差範圍之內,我們就不能說它有變化。
這類報道的一個變化體是指出某件事並沒有變化。例如,這篇關於公司破產的報道,也在讀者預期之處找尋變化,但最後發現疫情期間其實破產公司的數量並未增加,並針對這個反直覺的發現尋求專家的意見。
數據角度之三:排名和異常值——誰最好,誰最差?誰不尋常?為什麼?
從排名切入的報道都是關於誰或什麼在數據上表現最差或最好,或者某個感興趣的對象(當地警察部隊、學校或團隊,或者某個行業,如果是報道特定行業的媒體)相對於其他同類的比較。
這類型的典型報道可能包括“當地是犯罪最嚴重的地區之一”或“當地學校是全國表現最好的學校之一。”
你也可能會關注“最受影響”的地區,如《伯明翰的哪些地區是英國最受統一福利救濟金影響前十名?》,或者你可能會關注你所在的行業與其他行業相比的情況,如《建築業是英國最危險行業第三名》。

《經濟學人》的這篇文章是一篇關於“排名”的報道,因為它指出了“最憂鬱”的月份。截圖。
但是報道排名的文章也可以關於數據中最佳或最差的時間、地點或類別。
例如,上面這篇《經濟學人》的文章,是關於聽眾聽最多憂鬱歌曲的月份。另一方面,這篇伯明翰的實況報道的標題則這麼下──“在桑德維爾(Sandwell)最常見的犯罪行為——以及你最有可能在哪受害”。
數據角度之四:差異——公共服務的地區性差異、地圖和分布
當我們期望能公平比較,或者當我們試圖找出生活中某部分的對應標的時,從差異切入的報道效果最好。
這個經典的案例使用了一張地圖或熱圖來顯示,一個國家的某些地區比其他地區獲得的東西少,或者對某些東西的需求多。
例如,“郵遞區號彩票”(postcode lottery,在英國意指公共服務的地區性差異。人們能獲得的醫療資源、公共服務等均與其居住地區有關)這一詞彙就反映了,那些本應平均分配的資源實際上卻是一場運氣遊戲。
例如,BBC 數據部門的報道《試管嬰兒:英國健保下的夫婦面臨額度限制》,指出了你在英國的居住地將如何決定你能否接受受孕治療。
從差異切入的報道可能凸顯出不平等——或者,若人們能準確地意識到的話,它還能顯示出它是如何以及在哪裡發生的(特別是在他們的地區)。

BBC 公共數據部門這篇由艾米·斯坦頓(Aimee Stanton)撰寫的報道聚焦於英國各地的電動汽車充電站的數量差異。截圖。
對演算法的究責報道,例如 ProPublica 的《機器的偏見》系列文章,通常都與深入分析某演算法後所呈現的差別待遇及不公平現象有關。可能是人們被判處不同的刑罰、得到不同的保費報價,儘管他們彼此在重要的維度上沒有任何有意義的區別。
這類報道同樣可以用來強調服務需求不足或供應不足的區域。我為 BBC 公共數據部做的一則關於電動汽車充電站的報道,便追蹤了英國有多少基礎設施及其所在位置。這些用數據畫出的圖片為個案的研究和應對提供了基礎。
數據角度之五:探索──工具、互動和藝術
探索類的報道多數是網絡原生的。它的賣點往往以行動呼籲為特徵,常見字眼例如“探索”、“玩”、或“做個測驗”。或它可能會以全面性的分析作為賣點,例如它標示出或是記錄了“曾經發生的每個X”,或者只是簡單地回答“誰/如何/何處”的問題。
讀者經常被邀請去瀏覽解釋性報道中的數據,以產生自己的觀點。這類作品包括 BBC 的《70億人與你:你是第幾號地球人?》、《紐約時報》的《測測你能當個貧窮的美國人嗎?》等測驗,到《洛杉磯時報》的《科比·布萊恩特的每一次投籃,共30,699個》這類互動地圖作品。

這個《紐約時報》的互動網頁成為他們有史以來瀏覽數最高的報道之一。截圖。
這一類別還包括像《華盛頓郵報》破紀錄的《為什麼新冠病毒這類疾病爆發會呈指數級傳播?如何使疫情平緩?》和馬特·科羅斯托夫(Matt Korostoff)的《按規模顯示的財產》這樣的模擬器,以及小遊戲、計算機和聊天機器人等其他形式。
探索類的報道不一定要是互動式的:《衛報》的《誰死於冠狀病毒?國民保健制度信任誰?》只提供廣泛的見解及靜態地圖讓讀者探索,但讀者對頁面沒有控制權;彭博社出品的視覺化敘事作品例如《美國人是如何死的》能讓讀者與圖表有些許互動,但還是強烈地受作者主導。
這類報道也可能非常古怪——甚至是一種藝術形式。例如這篇《甜蜜的愛:熱門婚禮歌曲被重新想像為紙杯蛋糕》,只是將播放列表作為數據,並且將它以特定方式視覺化。
數據角度六:建立與釐清關係──當事物有或沒有關聯時
記者通常試圖檢視數據來找出關聯,但這可能是有問題的:相關當然不等同於因果關係,所以即使兩件事可能同時有上升或下降趨勢,也不意味這兩件事是相關的——正如《衛報》這篇《暴力犯罪的增加是因為削減社區警力嗎?》所探討的。
出於這個原因,你可能會經常看到一則報道釐清兩組數據之間的關係,就像你也會看到某報道試圖證明X導致了Y。
例如,第四台新聞(Channel 4 News)的《事實查核》(FactCheck)欄目通過查看數據來回答“移民是否導致了急診資源危機?”,並發現一個地區的非英國人口數量和其急診服務表現之間沒有關係。
前述所涉及的複雜程度意味着,任何以關聯為角度切入的報道很可能都需要多作解釋──或者至少要做出一定程度的提醒。
例如,《經濟學人》這篇《對房地產的痴迷會如何破壞經濟》花了超過12分鐘來探索這兩個變數之間的關係,而不只是簡單地宣稱房市就是在破壞經濟。
這類報道不一定要着重在形而上的相關性;網絡分析(network analysis)提供了另一種講述故事的方式,這種方式是建立在真實關係的基礎上,如捐款人、董事職位、家庭關係、社交媒體關注或其他互動。
例如,《調查谷歌旋轉門》項目使用數據來揭露這間科技巨頭和政府機構之間的人員流動數量,《西雅圖時報》的《在西雅圖藝術圈,女性掌權》則使用視覺化的網絡圖表描繪當地藝術圈內部的關係(記者通過讓西雅圖在地藝術圈的女性說出影響其職涯的導師、合作者和同事的名字來建立起這張關係圖)。

《西雅圖時報》的這則報道帶你瀏覽當地的人際網絡,但也能讓你自己探索。截圖。
但即使是網絡分析也可能不夠準確:單看兩個人之間的關聯或組織之間的運動很少能證明貪污或是構成可疑決策的原因。
也因此,網絡分析也經常以探索性報道呈現(如《澳大利亞2016年-2017年政治捐款:政黨向誰收了什麼》)、作為解釋性專題的一部分(如《Radiohead 的企業帝國:在樂隊的收入之間》),或是用於找出某個數據發現,然後進一步引導出後續的報道(例如《捐給英國保守黨80萬英鎊的離岸銀行家與該黨高層有家族關係》)。
數據角度之七:問題和解法──爛數據、沒有數據與如何取得數據
最後一類報道可能有點“元”(meta)的意味——它是關於數據本身的報道:缺乏數據、數據有問題,或是數據是否可用——但這並不意味着它不是一個好故事。
對爛數據的報道可以是非常重要的:行使權力、花錢以及過生活,都可能因數據受影響,所以如果數據有缺陷,那麼權力的使用也可能有缺陷。例如,對演算法的究責報道也可能找出支持這些演算法的有缺陷的數據;又例如在《明鏡周刊》(Der Spiegel)的《增加的風險》所報道的,信貸諮詢機構 Schufa “對許多人的了解遠比人們想像的要少,但卻敢於為人們的信用評分。”
在政治上,數據也常常構成成功或失敗的認定基礎,所以如果警察部隊漏報犯罪,遭颶風襲擊的國家所報告的死亡人數不準確,或是將預計測試數量當作已測試量,那麼當權者就有可能讓這些錯誤的說法免於被質疑。

這篇《坦帕灣時報》的報道暴露了官方數據的缺陷。截圖。
報道爛數據的念頭可能來自於這些可疑的說法、來自聽說某人看到了系統漏洞,或純粹只是檢查現有數據中有問題的地方:《衛報》這篇指出流浪者數據“不合目的”的報道,以及 BBC 這篇關注性別薪資數據的文章,都是源於記者發現數據中的危險信號。
它們也可以導引出追蹤報道,從其他消息來源獲得更好的數據,就像我的 BBC 同事丹·溫賴特(Dan Wainwright)在這篇關於流浪者的報道所做的。
另一個與數據問題相關的角度是“沒有數據”:缺乏某個議題的數據通常意味着該問題缺乏政治利益,或者對解決該問題沒有意願。
“沒有數據”的報道通常也指出人們對缺乏信息或透明度的擔憂。
例如,英國醫學期刊(BMJ)的調查《醫學院對種族主義視而不見嗎?》的導言寫:“英國的醫學院對少數民族學生所經歷的種族歧視及騷擾並未做好準備”,而英國調查報道組織(BIJ)一項針對農場排放的調查也將缺乏特定數據列為其主要調查結果之一:“政府只監控最大的集中式家禽和養豬場的氨排放,而完全忽略了最大的污染者——牛肉和酪農場。”
若是曾公布過但後來消失的數據,那麼報道可能會聚焦在撤下資料的這個決定上(《坦帕灣時報》的《佛羅里達醫檢人員正公布新冠肺炎死亡數據,但遭州政府制止》即是一例)。有時它還會成為一篇社論的基礎,例如《芝加哥記者》(The Chicago Reporter)這一篇編輯手記講的便是警方要求停用法律數據的應用程序介面(API)。
偶爾,缺乏數據可能會促使新聞機構、記者或運動人士自行整理數據——這種時候,你便又多了一個取得數據的報道題材。

《華盛頓郵報》的“致命力量”(Fatal Force)項目試圖填補警方槍擊事件相關數據的空白。螢幕截圖。
其中最著名的例子也許是《衛報》的《被統計者》(The Counted)和《華盛頓郵報》的《致命力量》(Fatal Force)──它們都是圍繞着遭執法機關殺害的人展開的;以前我在《給(真正的)無聲者一點發言權:數據新聞和死者》中寫過類似的案例。
其他報道還關注試圖解決數據問題的運動人士,例如 ProPublica 的這篇《沒人能準確追蹤死於疫情的醫護人力,於是她不眠不休地為亡者造冊》,以及這則有關巴西程序員建立新冠肺炎的替代資料庫的報道,是近期的兩個案例。
但取得數據的報道不一定要如此雄心勃勃或具個人色彩。《衛報》數據博客在十年前的許多早期報道,都只是在公布那些他們發現、整理或合併的數據集,並呼籲讀者“下載數據”。
當然,僅僅是下載數據的新鮮感在過去十年中已經消退了,有些記者只是把他們手頭的數據放在 GitHub 上,也沒有專門寫一篇關於它的文章。

許多《衛報》數據博客的報道邀請讀者“下載數據”。截圖。
但是,如果你已經獲得了一些其他地方沒有的有趣數據——例如通過結合多個數據集、使用信息自由法(FOI)獲得資料、或是自己抓取數據——那麼向你的觀眾公開這些數據,來建立關係以及——在最好的情況下——建立社群,就會很有價值。
這裡要記住一點,如果你真的想建立一個社群,單靠數據是無法做到的:與潛在的合作者接觸(例如藉由舉辦黑客松),才更可能將社群建立在你的寶貴基礎上。
補充:藉由數據找新聞,而不是從數據找新聞
弄清楚這七種數據驅動的報道中可能出現的角度後,值得強調的是,還有另一種類型的報道,是前述這些角度可能都沒有涵蓋的:即以數據為手段、將某採訪、事件、文件或關係挖掘或強調出來,使記者能夠找到背後故事的報道。
你可以稱之為單一數據點或大海撈針式的報道。
在之前的一篇博客文章中,我帶讀者探索了其中的一些技巧,從採訪與單一數據相關的個人(例如,在英國宗教信仰最少的城市經營教堂的人),到向負責處理數據的組織要求更新資料。
例如,許多調查報道使用數據新聞的技巧來決定他們採訪及申請數據的方向,或是選擇他們要採訪的地點,因為他們看到的是一個更大的系統性問題。
因此,當面對數據時,儘管這七個角度有助於激發你的想法和報道靈感,但它們不應該成為你選擇角度時的限制:其實,任何報道都可以從數據新聞的技巧中受益。
本文首發於在線新聞博客(Online Journalism Blog)的網站上,全球深度報道網經授權翻譯轉載。
Paul Bradshaw 是伯明翰城市大學數據新聞學和多平台及行動新聞學的碩士,他目前在 BBC數據部擔任數據記者顧問。