編者註:看似客觀的數據,實際上可能會受到收集流程中的種種因素影響,而不能夠客觀地反映事實。因此,數據科學家Heather Krause認為,做好數據分析與報道的關鍵在於建立數據檔案,從數據收集的各個環節深入了解數據。在下文中,Krause結合報道實例,解釋了考究數據背景的重要性,以及如何建立一個屬於數據的檔案。
對我而言,參加NICAR(計算機輔助報道)會議最重要的收穫之一,就是認識到數據新聞既複雜又有趣。與會期間,我帶頭做了一個關於梳理數據檔案之重要性的展示。在這篇文章中,我想和諸位分享一下我展示的內容。
許多專家用幾年、甚至幾十年的時間去鑽研如何用數據為讀者講述動人故事。現在有越來越多的人加入這個行列,學習如何運用數據,以及嘗試用數據做報道。當我將學生們領入數據分析和可視化的世界時,經常被問到使用數據最重要的一步是什麼,我的答案始終是:對數據追根溯源,整理數據檔案。
數據入門者常常只看到數據的表面價值,認為他們第一眼從數據中看到的東西即是其中真實且唯一的故事。我想鼓勵大家像對待人物信源那樣對待數據。你們不會在沒有對信源進行背景研究的情況下撰寫故事——那麼對待數據的方式為什麼會不同呢?
了解你的數據
對於將出現在報道中的每一項數據,你都需要建立一個數據檔案,包括數據的背景或者來源。正如在發表任何報道前,你會對有關信源進行背景調查那樣,你得理解你的數據:
- 數據從何而來?
- 數據的收集者為何人?
- 數據的收集流程如何?
- 最重要的是,為什麼要收集這組數據?
這項任務不會像第一眼看上去那麼簡單,但是去了解你的數據可助你發現故事中重要的差距、偏見、錯誤信息,或被忽略的細節。請這樣思考:如果醫生說,你需要在飲食中添加糖的攝入,你也許會認為他的建議是有醫學依據的。而倘若一位焦糖蘋果銷售員這樣和你說,你大概就不會這麼想了。同理,數據不僅僅是你面前的數字,而首先是關於那些數字來龍去脈的故事。
實例研究:對女性所受暴力的統計數字
不久之前,我們的團隊忙於一份關於女性所受暴力的數據報道。我們花了點功夫尋找數據來源。在確定聯合國是一個很好的着手點後,我們下載了聯合國有關侵害婦女暴力行為和親密伴侶暴力的數據,並對此展開分析。
在檢查女性一生中所遭受親密伴侶暴力數據的變量後,我們設計了幾個簡易的圖表來了解各國的趨勢:
一些國家的趨勢令人意外,婦女遭受暴力比率上顯示出不同尋常的變化。我們想知道發生了什麼。
快速瀏覽數據後,按邏輯我們採取的第一步就是為每一項數據建立檔案。我們需要知道手上信息的背景,以便更好地了解我們所看到的趨勢。
數據從哪兒來?
在這個案例中,我們從數據中注意到的第一件事是信息源自哪裡。有些數據反映了所有婦女,有些數據只反映了一定年齡段的婦女,有些只包括處於具體婚姻狀況的婦女。所有數據都集中在同一個變量中,使用相同的名稱,相同的標籤,且均沒有提示數據源的差異。
誰收集了這些數據?
接下來,我們研究了這些數據的收集者。通過調查聯合國文件,我們發現參與該變量數據收集的人員和機構相當之廣。
如何,以及為何收集這些數據?
上述數據的採集方,有的是為了國家統計用途而收集數據;有的是為個案的呼籲;還有的則是測試新的方法。所有的數據,儘管通過不同的方法和因不同緣由收集而成,卻最終呈現在同一張表格上,使用相同的變量名稱和標籤。如果我們沒有花時間做這樣一個數據檔案來了解這些數據,那我們永遠都不會意識到這些數據點的差異。
在完成了數據檔案後,我們立即發現,數據所呈現的一些明顯的趨勢,如看上去像是暴力率的顯著變化,實際上是數據收集上的變化。
通過使用數據檔案,我們發現近年來盧旺達的數據收集相當一致。一旦確定了數據預測的趨勢真實反映現實狀況,我們就可以繼續調查對婦女暴力侵犯率飆升背後的原因。
有趣的是,在上述年份,盧旺達議會中女性佔大多數,並通過了該國首個防暴力侵害女性法。這又意味着什麼呢?
是否是政府改革的強烈反作用,驅使暴力行為的增加?
又或者是因為女性有了法律保障後,越來越多的暴力事件被新聞報道揭露?
這就說明,即使有了一個完善的數據檔案,在解析數據上你仍需小心謹慎。
數據並不總是客觀的
最近,我和數據可視化資深專家Alberto Cairo合作,免費講授了一個在線數據新聞課程,參與過的用戶或許記得我們解釋建立數據檔案的片段。
記住,通過花時間梳理數據檔案,你可以對信源的準確性和可靠度有足夠的信心。想知道為數據檔案的捷徑?那就下載我們的免費模版吧。
編譯/梁晨昱
編輯/Ivan Zhai,梁思然
相關閱讀:
每周數據新聞精選 | 數據新手“八步走” 快速入門就靠這些資源
每周數據新聞精選 | 用數據的方式打開世界
本文原刊於Datassist網站,深度網經授權轉載。
Heather Krause是Datasssit的創始人,該網站專門為全球記者、非營利組織及政策制定者等提供數據諮詢、數據報道專業知識與工具等方面的服務。