編者註:本文根據5月19日亞洲美國記者協會(Asian American Journalists Association)年度大會工作坊“Very Basic Statistics for Journalists”整理而成。工作坊分享者為香港大學傳媒及研究中心助理教授鍛治本正人(Masato Kajimoto),以及講師Anne Kruger。發表前已經原作者授權。
現代新聞報道總少不了各種數據,比如民意測驗、統計調查,以及大家耳熟能詳的GDP等經濟指標,各種百分比和變化幅度等更是反覆出現。然而,數字引用或表述不當輕則引起誤會,重則成為“謠言”,但這很可能只是因為有的記者對統計數字缺乏認識,並非有意為之。
需要提高統計素養不只是記者,其實讀者也需要提高警惕。有哪些常見問題需要我們注意?新聞寫作訓練如何可以避免犯錯?如何正確閱讀統計數據?讓我們先在具體情景中,了解幾個經常被忽略的統計學概念。
情景一:民意調查
在過去半年的各國大選報道中,我們時常會聽到說今天某個總統候選人的支持率上升了,明天某個黨派在民意測驗中落後了,諸如此類。當我們讀到這些新聞時,千萬要小心!因為記者往往忽略了一些統計學中的概念和要求,而正確掌握這些概念對於解讀統計數據十分必要。
誤差範圍
一個常見的被忽略概念是“誤差範圍”。
我們知道,民意調查都是抽樣進行的。以有約七百萬人口的香港為例,專業的民調機構一般會選擇大約一千人進行訪問,然後以此推算出全體香港市民對某件事情的態度。而這種以一千被訪問對象推算七百萬人“民意”的過程就會產生誤差。誤差是完全不可避免的,頂多只能盡量縮小,除非對七百萬人中的每一個進行人口普查式的訪問。

香港大學民意研究計劃一般會抽取一千人作為反映七百萬香港人口的樣本。
因此,專業調查機構在發布數據時均會公布其“誤差範圍”,但大眾媒體通常有意無意地忽略這個誤差,也許是擔心過多數字會把讀者給繞暈了。可是問題就隨之而來。
比如,某調查機構發布的數據顯示,某位政治人物在民調中支持率從上月的55%變成本月的50%,那麼媒體是否就可以興沖沖地大書特書某人支持度下跌了呢?
且慢。調查機構還說了,該民調的誤差範圍是七個百分點。也就是說,該名人士上月在公眾中的支持率從48%到62%均有可能,而本月則是為43%到57%之間的任意一個數值。二者之間其實有大範圍重疊。所以,支持率究竟是升了還是跌了其實說不好。

專業調查機構在發布民意調查結果時都會公布誤差範圍。
那麼有人也許會問,我們是否可以說該名人士在被訪問的大約一千人中的支持率下跌了呢?很遺憾,這也是不行的。每次調查訪問的一千人並不是同一批人,而是每次單獨隨機抽樣後得到的樣本。
簡而言之,對於誤差範圍大於變化率的民意調查,記者不能得出任何大而化之的結論,只可客觀公布調查結果中的數字,其中包括誤差範圍,並說明在誤差範圍內兩次調查之間並無顯著變化。
這也就部分解釋了為什麼在一些國家的大選報道中,原本支持率輕微“領先”的候選人最終還是會落選,因為統計學規則告訴我們,在誤差範圍內,“領先”的“事實”很有可能並不存在。當然,也有可能是“落後”方的支持者看見民調結果後更踴躍地出來投票所致,這就不在本文探討之列了。
抽樣方式
“抽樣方式”是另一個經常被大眾媒體忽略的概念,最集中體現的就是網絡民意調查。
傳統的專業調查機構一般都會按照一定比例在不同人群中抽取調查對象,以盡量貼近真實的人口分布。比如,一般電話調查員都會詢問性別、年齡,以確保被訪問群體是男女各半,年齡分布也要大致符合人口普查數據。一些特定的調查還會詢問職業、居住地等信息。

關注美國大選的人對蓋洛普機構不會陌生,其公布候選人民調會提供在各州抽樣的數量和佔比。
而多數面向大眾的網上民意調查則不會事先篩選訪問對象,因而任何人都能參與投票的網絡調查除了吸引眼球外幾乎不能說明任何問題。如果有媒體還鄭重其事地進行報道,一個明智讀者的最佳處理方式是:忽略這條新聞。
下一期我們將會介紹在健康科學報道中的常見統計數據解讀誤區。
編輯/Ivan Zhai,梁思然
相關閱讀: