“你寫的報道即便是事實也可能仍是錯的。” 在5月歐洲的一場調查記者和數據新聞大會上,美國《紐約時報》數據新聞記者Robert Gebeloff如是說。
大會全稱是“European Investigative Journalism Conference & Dataharvest”。Gebeloff認為,數據和新聞的結合可能會導致一些錯誤的解讀,且難以杜絕。
“每當我做新聞報道時,都希望能獲得關於選題的一切資料。” Gebeloff表示他會從所有可能的渠道搜集數據,再用相關方法驗證,而最後只會發表那些他確認為事實的部分。
不存在“半真實”
時下流行事實核查,美國網站Politifact就發明了一個叫Truth-O-Meter的工具來衡量政治人物講話的真實程度,將結果分別用“真實”、“大部分真實”、“半真實”、“大部分失實”或“失實”(false)來表示。
然而,Gebeloff認為這些標準不適用於數據新聞,“數據新聞不能止步於‘半真實’,只要哪怕一丁點失實都是不可承受之錯。” 他堅持數據新聞必須永遠真實。
用錯誤方式報道正確事實
有時候,即便你文章中寫的統統都是事實,Gebeloff認為也有可能出錯:“你可能算對了數字,卻用錯了地方,或者未能說明其中的不確定性,又或者用錯誤的方式陳述事實。”
他舉了個例子。此前有媒體報道稱,美國前總統小布什任命的移民法官傾向於拒絕批出避難申請。該報道的依據一篇論文中的數字:16名法官中的11人過往拒絕避難申請的比例高於平均水平。Gebeloff認為,儘管相關論文看似正確,但該媒體據其所作出的報道仍舊是錯誤的。
Gebelof解釋說,那11人中有兩人的拒絕率在統計上其實高得並不顯著,因此不能得出結論說兩人高於平均水平。
他進一步解釋道,統計學上,“卡方檢驗”是用來計算差異顯著性的公認方法,主要說明一個群體與另一個群體相比,是否有明顯不同的特徵。該公式主要涉及兩個因素,一個是差異大小(比如前面提及的拒絕率的差別),另一個是樣本大小(比如法官作出決定的次數,次數太少就很難說明問題)。因此,如果我們基於很小的統計樣本來說事,那就會導致事實正確但結論錯誤的情況。
慎用數學
數學是一門精確而又深奧的學科,一般大眾難以明白較高級的數學理論,因此記者在使用時務必謹慎,因為你很難在報道中向讀者解釋清楚。
Gebelof認為記者可以用數學方法來發現新聞線索,但他的經驗是,如果發現相關方法無法用淺顯的語言說明白,就要果斷放棄。
向調查對象求證
Gebeloff和《紐約時報》的同事於2016年12月發表了一組關於紐約州監獄對犯人存在性別歧視問題的調查報道。在運用多種方法對六萬宗監獄紀律處分個案進行統計分析後,他們在報道中寫下了這樣的文字:
“分析發現,在多數監獄,黑人和拉丁裔遭受紀律處分的比例高於白人——某些案例中甚至達到兩倍。他們被關禁閉的次數更多,時間也更長。”

《紐約時報》2016年12月系列報道“Race Behind Bars”。
Gebeloff表示,他們不僅與專家分享統計數據以作進一步求證,同時也與報道的批評對象即監獄方分享。他認為即便遭到反駁,記者也應該在報道發表前確切知道反駁的內容,並且將其一併寫入報道。
核對清單
Gebeloff一再強調,數字本身的準確並不足夠,還要放在正確的語境中用恰當的方法解釋,否則“半真實仍然是失實。”
為此,總結出一個核對清單供記者同行參考。
1.仔細核對數據:
- 注意數據的日期
- 核對寫法和重複之處(duplicate)
- 識別出異常的數值
- 統計上的顯著性本身不是新聞
- 對趨勢的判斷要基於全體數據,而不是隨意挑選出的某一段時間的數據
- 確保數據反映現實
2.每次進行數據處理都要留下記錄,寫明處理的方法和結果,以確保日後可以重複操作。
3.確保你可以向讀者清晰解釋你所使用的數據處理方法。
4.仔細思考你的報道可能遭到哪些反駁,如何避免犯錯,如何自圓其說。
5.把報道的批評對象也納入消息源,在報道發表前找到潛在的反駁內容。
6.把報道中引用的證據逐一列出並編號,記下證據來源以及取得的方式,以備不時之需。
編譯/周穗斌
編輯/梁思然
相關閱讀:
清單 | 貼士、網課與閱讀清單:新聞人提高統計素養的資源匯總(三)
NICAR 分享 | 五條經驗打造數據團隊 小機構也能做出大新聞
本文首刊於作者的個人博客datajournalistiek.nl,深度網經授權轉載。
Winny de Jong是一名數據新聞記者及培訓師,目前為自由撰稿人狀態。她此前在荷蘭雜誌OneWorld擔任數據新聞記者。她也曾在多個機構演講或提供培訓,包括TEDx,歐洲新聞學中心(European Journalism Center)、歐洲調查新聞學的Dataharvest大會,以及多家新聞學院等。