編者註:如今,越來越多的深度報道都涉及對數據的調查、解讀與分析。不熟悉數據或編程的情況下,傳統文字編輯如何能更好地審閱數據報道,發現問題或漏洞,確保報道的數據可靠、信息準確?NICAR2017(計算機輔助報道)大會上,《華爾街日報》和佛羅里達州《棕櫚灘郵報》的兩名調查編輯與同行分享了經驗。
作為編輯,即使不會編程或數據分析,在報道發表或播出前問對問題,也有助於發現漏洞。編輯可以向記者問這樣一些問題:
- 如何確定沒有重複計算字段?(記者應該能夠告訴你,他或她是如何檢查的。)
- 我們擁有的是全體(研究對象)還是僅有一個子集?如果是後者,我們是怎樣選到它的?以及如何確保它可以代表整體?
- 報道中包含一個百分比或總數,不過這個計算樣本包括多少人(或公司,等等)?(如果發現記者只聯繫到了3家公司,66%這個數字也就沒什麼說服力了。)
- 如果所用數據並非直接源自原始出處,你如何保證它們是最新的?我們可以檢查原始來源嗎?(例如,Open Secrets可能會晚於聯邦選舉委員會發布數據。)(譯註:Open Secrets由非營利機構The Center for Responsive Politics發布,提供關於聯邦競選捐獻、遊說數據和分析方面的資源)
- 數據是自行生成的嗎?如果回答為肯定,數據是否受到了嚴格審查?你又是怎麼知道的?
- 報道中提到了與數據相關的人,但是沒有註明他們相應的出生日期或社會保險號碼,你是如何驗證他們的身份的? 採取的是逐一驗證還是抽樣驗證?
對記者而言,讓專家來檢驗他們數據分析的方法論尤其重要,即使是最有經驗的數據記者也會遵從類似慣例。這要比報道在發表或播出之後,讓受眾挑出毛病好一些。
- 你是否會自己輸入數據?如果是,之後誰負責複查?
- 你是否曾與發布該數據的機構溝通?你是否清楚數據的收集方式、周期及目的?
- 你是否會讓業內專家進行數據分析?你又是如何找到這個專家並核實其背景的?該專家此前是否熟悉這些數據?
- 你有沒有問過專家:“我遺漏了什麼?是否有出錯?”
- 你是否向你的調查對象詳細解釋過你的數據分析結果?他們有沒有反駁?如果有,又是如何反駁的?
有時候,報道中的數據並非便捷可得,而是需要記者根據他們的調查、採訪或其他檔案材料來建立自己的數據集。這時,編輯應花足夠的時間,與記者一起商量收集數據的最佳策略,以及討論是否值得投入大量時間去收集。
下面是在收集獨家數據過程中常見的絆腳石:
- 樣本不夠大。(多少城市/大學/學區才算足夠?)
- 數據樣本並非全體,或不足以代表全體。
- 數據所覆蓋的時間周期不夠長,以至於無法通過足夠數據去觀察一段時間內有意義的變化。
- 我們收集的是經篩選過的數據,並且這種篩選會影響到分析結果。
- 數據自動生成,或漏洞百出。
以下是一些可以有效幫助編輯更加熟悉數據的小練習:
- 和記者坐在一起,讓他或她向你展示電子表格上的數據和各項運算。即使不是程序員,你也可能會問出讓自己都感到驚奇的問題。
- 在項目早期階段,就要求記者提交一份關於他們方法論的詳細解釋,並編輯這份報告,提高清晰度和邏輯性,把它當做一份馬上要發表的文章處理。 如果你無法理解其中內容,便說明有關報道並未成熟。
- 向記者詢問數據記錄格式,這樣你就知道她選擇研究哪些領域,以及研究包含了哪些數據。
- 對研究的不便之處以及其中不易解釋的地方不要含糊其辭。 在讀者和批評者提出之前,去用數據指出問題和未了解的事情。
- 千萬,千萬不要踩着截稿日期發布複雜的數據新聞。
編譯/梁晨昱
編輯/Ivan Zhai,梁思然
相關閱讀:
NICAR 分享 | 五條經驗打造數據團隊 小機構也能做出大新聞
NICAR分享 | 從競爭對手到最佳盟友 跨媒體協作所需的六點默契