編輯按:1995年,當《計算機輔助報道》第一版問世的時候,數據新聞還處於剛起步的階段。不過越來越多的新聞人發現,在搜集、分析材料以及呈現故事的過程中,計算機可以扮演重要的角色。本書作者Brant Houston就是其中一位先鋒。20世紀80年代和90年代初期,他在美國報社從事利用數據進行報道的項目。1994年,Houston 加入調查記者與編輯協會(Investigative Reporters and Editors,IRE),負責國家計算機輔助新聞報道協會(the National Institute of Computer-Assisted Reporting, NICAR)的工作。他擴展了協會的規模,使之從一開始僅有的幾個數據培訓班發展為每年五十個工作坊。計算機輔助新聞報道(CAR)由此先是在美國掀起熱潮,隨後在其它國家也開始大受歡迎。譬如,前不久今年3月舉辦的NICAR年會就聚焦數據新聞,吸引了近1000名參會者。(點這裡查看相關的幻燈片、鏈接和教程。)
Houston喜歡把調查報道稱為“新聞的研發部門”,而媒體目前對數據新聞的廣泛接受,無疑證實了他的觀點。過去二十多年裡,《計算機輔助新聞報道》一書培育了成千上萬名記者,開啟了數據驅動新聞(data-driven journalism,DDJ)的全新時代。在新近修訂的第四版中,Houston擴充了早前版本的內容,全球深度報道網很榮幸地在此可以重新發布該書的序言,讓我們以新視角去了解如何在調查報道中使用計算機工具。
真正的革命發生在計算機輔助報道領域。從龐大的分析項目到新聞採集的細枝末節都在經歷變革。新工具新技術使記者能趕在截稿前挖出關鍵的信息,迅速增加故事深度,並補充背景。
——“如今人人都是電腦迷”,Joel Simon和Carol Napolitano,《哥倫比亞新聞評論》(1999)
計算機輔助報道為記者提供了從數據中挖掘真相的機會,由計算機做出的比較分析常常能使人發現問題間的相關性。記者學習計算機輔助報道的收穫在於,他們可以為讀者提供知識和洞見,從而使其避免被武斷意見所干擾,以及對名人判斷的執迷。計算機輔助報道不僅能讓小型新聞機構向周邊的讀者和觀眾發聲,而且還可助其探究那些足以影響全球社會的大問題。
——“計算機輔助報道的益處”,Jason Method, 《尼曼報告》(2008)
上面這兩句話,第一句雖然寫於20世紀末,但在我們進入21世紀後依舊適用;第二句比第一句晚出現約十年,它說明計算機輔助報道在建立可信度和體現新聞全球化方面,都起到了重要的作用。不過僅就“數據”而言,無論在一般基礎層面還是更高的層面,新聞業的革命仍在繼續。
過去十年里,具備分析功能的軟件越來越簡單易用;在網上,有大量方便下載的數據;而通過硬盤、閃存和“雲端”,存儲空間也已變得極其巨大。短短几年時間,電腦、平板和手機的運算能力都得到大幅提高。用數據可視化來協助理解和分析,已經成為對未來新聞人的要求。此外,新一代程序員已加入新聞業,他們與傳統新聞人一道,力圖解決抓取、清理和組織網絡數據時出現的問題,創造出吸引眼球的形式,向大眾分享成果,並鼓勵公眾參與數據分析。
不過與此同時,很多基本情況並沒有改變:數據庫仍是人工創建,難免有人為的疏漏和錯誤,必須加以記錄和訂正。另外,每個數據庫的時效性也都不長,一旦人們獲取並使用了數據,它就過時了。
另外需要指出的是,單獨一個數據庫成不了故事。數據庫就像一塊遍布信息的田地,需要認真、深度地耕耘和謹慎地處理,新聞人還需要通過觀察和採訪來比較及擴充數據。

由EU Transparency建立的Farmsubsidy.org是記者和活動家們發起的一項運動,它的數據包括歐盟成員國提供的農業補助詳情。
與以往相比,使用數據庫前判斷其準確性變得更為重要;而同樣重要的是,分析數據時一定要小心謹慎,因為一個小錯誤就可能導致錯得離譜的結論。事實證明,即使把數據傳上了網,公眾或志願者也並不會因此就能合理分析。現在,我們更需要踏實肯乾的記者而不是能說會道的遊說家,需要他們在充分研究並理解信息和數據後加以詮釋,並能用數據講述引人入勝的故事。不過,儘管技術已經得到發展,人們也能獲取海量數據,一些新聞從業人員所常遇到的工作場景並沒有改變。
本書為讀者所展現的,就是一些用於上述“不變場景”的技術,我們稱之為“計算機輔助報道”,簡稱為“CAR”(“機輔報道”),它們是日常報道的一部分。新聞人將CAR和其它技術應用於自己每天的工作、專題報道以及那些可以獲得普利策獎的大項目。
新聞人在鍵盤前敲故事或瀏覽網頁並不是計算機輔助報道。真正的機輔報道指的是,為了給日常新聞提供更全面背景和增加深度而下載數據、分析數據,這就是在技術的協助下,以更開闊的視野、更深入的理解來報道複雜的故事。很明顯,一個搜集了15萬份法庭記錄並獲得了相關知識模式的記者在進行報道時,會比每周只看幾個案件資料的記者更勝一籌。
計算機輔助報道並非是要替代已有的新聞操作方式,它其實已融入其中。機輔報道要求記者擔當更多責任並更具警覺性,我們在基礎新聞課上學到的經典標準——“核實、核實、再核實”——變得更為重要,“適度質疑”、採訪多個信源、交叉引用等理念,也都比以往更值得重視。
三十年前,計算機輔助報道領域的先驅之一Elliot Jaspin曾警告說:“計算機沒法把爛記者變成好記者。它所做的,是讓好記者更上一層樓。”很多一線記者在過去20年里接受培訓,能熟練運用基本的計算機輔助報道技巧。他們戰勝了對計算機和數學的恐懼,正將這些技巧運用於日常報道,從而使報道更嚴謹、更縝密。
通過分析數據庫而進行新聞報道的倡導者Philip Meyer曾說過:“機輔報道抬高了培養記者的成本。”不過互聯網和社交媒體的迅速擴張,成本低廉、使用便捷的計算機和軟件的升級換代,以及編輯部對數據的價值和相關分析技術的越來越重視,都對機輔報道技術的廣泛應用和不斷進步起到了推動作用。
計算機輔助報道已不再是主流新聞的補充,而是新聞人在21世紀生存下去的基本能力。這些機輔報道工具無法代替優秀記者的想象力、他們進行深度訪談的能力和以及發展信源的天賦。不過,一旦新聞人懂得如何在日常工作和長期項目中使用電腦,他們就能更快速地搜集和分析信息,也能更深入地創作和發布故事。通過運用這些工具,記者在採訪前的準備工作就會做得更充分,報道會也更具有權威性。他們還可能會受到啟發,從數據中發現從未想到過的故事。
掌握了這些技能,新聞人就能取得政客、官員和商人所擁有的那些信息優勢——後者享有這些優勢僅僅是因為他們無論在資金還是知識上,都比新聞人更早掌握利用數據庫和數字化信息的技巧。政府官員和職員們已經習慣把信息輸進電腦,並對其進行檢索和分析;在商業領域,無論是什麼規模的公司,使用電子表格和數據庫軟件早已是再常規不過的事情;甚至連遊說團體也懂得利用數據資料來推動自己的議程。
如果對數據分析的優勢和劣勢缺乏基本了解,新聞人就很難理解和報道當下的世界,他們希望從事有意義的的公共服務式新聞業或扮演必要的監督角色也會難上加難。
多年以來,新聞人就像動物園裡的動物,等着“管理員”喂信息,那些“管理員”們則樂於看到記者呆在與技術隔絕的籠子里。不過好記者總想看到原始信息,因為每當他人對信息進行選擇或分類時,就有機會編造事實或添加偏見,旁人對此難以辨識,計算機輔助報道則可以避免這類情況的發生。
由於現在官方文件和商業記錄大多以電子格式存儲,很多新聞人和新聞專業的學生都已意識到計算機輔助報道的基本工具是獲取信息的最佳方式,於是開始學習如何使用這些工具。儘管存在安全方面的顧慮,但政府和國際網站上仍公布有大量數據庫,因此,記者如果不具備處理電子數據的能力,就無法獲得最好的、原始的信息。舊時代的記者總是都無法及時獲得這些信息,而更糟糕的是,他們會被競爭對手毫無顧忌地超越。
掌握計算機輔助報道知識還會給新聞人或新聞專業的學生帶來求職優勢。在很多新聞機構的招聘中,申請者如果具備這些技巧(當然不只是會上網瀏覽信息),他們的簡歷就會脫穎而出。
雖然機器輔助報道很重要,但新聞人不一定要成為程序員或者會寫代碼(儘管這也會有所幫助)。如果新聞人懂得使用電子表格或是數據庫管理工具,他們已能自由搜索並核查信息,然後再考慮這些數據與相關採訪及現場觀察之間的關係。如此一來,他們就可以去除信息中那些令人混淆的部分,更接近真相。記者不一定是統計學家,但是好記者通常熟知統計學基本知識,知道數據可以被輕易操縱或偽造。同樣,如果記者知道數據是如何受到操縱的,他們就可以更好地判斷官員是否在混淆事實,政府是否有誤用數據庫。
記者還發現,如果他們讓一個只會處理數據的人分析數據,就可能忽略數據的微妙之處和隱藏的錯誤。數據程序員並不一定會像記者那樣思考,對記者來說很重要的東西,對程序員可能是微不足道的。讓數據程序員包辦所有事情,就像另外找個人讀書給你聽一樣,意義不大。
嚴謹求證的記者也不希望陷入核實證據的死循環:索要固定數字格式的文件、研究文件、發現更多問題、然後索要另一個文件……與其花那麼多時間來來回回,為什麼不通過自己的電腦找到數據,並進行快速、多角度的分析呢?
最重要的是,計算機輔助報道是公共服務式新聞和每日報道的核心。無論是報道教育、商業、政府還是、環境等話題,都是如此。
本文節選自由Brant Houston撰寫、剛剛發行的《計算機輔助報道:實踐指南》第四版,經出版商Routledge授權重印。
Brant Houston(@branthouston)是美國伊利諾伊大學厄巴納﹣香檳(University of Illinois at Urbana-Champaign)奈特講席教授,負責調查報道和企業報道(http://media.illinois.edu/knight/index)。該項目由奈特基金會(John S. & James L. Knight)設立。同時,他也是全球深度報道網的董事會主席,負責社區新聞項目CU-CitizenAccess.org。1997年至2007年,他曾任調查記者與編輯協會的執行總監。他還是《計算機輔助報道》一書的作者。