數媒時代,善於處理數據、呈現故事,是報道擲地有聲的關鍵。普利策獎新晉得主、ProPublica記者T. Christian Miller在美國調查記者與編輯協會(IRE)2016年度會議上分享了調查數字化的實用步驟和工具,解剖普利策獲獎調查的關鍵。你還可參考《藉助公開資源,全球記者開發了哪些調查好工具?【內附工具精選】》。
第一步:數字化處理材料
數字化,數字化,數字化——重要的事情說三遍。身處數字化時代,我盡量把每份資料——筆記、照片、音頻、視頻、文件作數字化整理。強推以下整理工具:
Document Cloud是一款可供用戶上傳的PDF文件、作光學字符識別(Optical Character Recognition,簡稱OCR)的工具。它掃描文本資料,提取文字信息,供用戶檢索。Document Cloud還支持用戶在文章上標重點和做注釋。另外,它還支持時間軸製作和實體識別搜索。目前Document Cloud僅對美國調查記者與編輯協會(IRE)成員開放。
其他OCR工具—OCR技術還能把紙質文件轉成適合電腦檢索的PDF。它分析文件時,是用自存的字體數據庫對照文本、注意特有字形。遇到難辨字眼,某些OCR軟件還用拼寫檢查工具“猜出”。雖然準確率難達100%,但可以幫你減輕工作量。用不了Document Cloud也不用着急,還有大把的免費OCR軟件供選擇。可參照:《五款最優光學識別免費軟件,實現圖轉文》(英文字符)和《知乎問答: OCR 中文識別用哪種軟件識別率比較高?》(中文字符)。
深度君補充:如果想抽取數據,且PDF文本並非掃描生成,Tabula, CometDocs (收費) 和ABBYY FineReader (收費)可以幫你忙。其中Tabula可與瀏覽器配合使用,可兼容 Windows, Mac 和Linux系統。用法為:上傳PDF文件到Tabula,選中想抽取的表格信息。數據即可輸出至CSV等表格數據程序,就是這麼簡單。
音視頻轉錄工具:許多轉錄工具提供優質視頻、音頻的語音轉文字服務,不少工具每分鐘僅收一美元,成本很低且質量不錯。如果想在網上發布重要的採訪視頻,不妨找轉錄服務,稍貴的可一天內即可完成轉錄,花費約每分鐘三美元。英文轉錄軟件,rev.com, Transcription Associates, Transcribe和TranscribeMe都做得不錯,中文轉錄軟件可參閱:《採訪錄音難搞定?工具測評幫你忙》。溫馨提示:確保重要引述不出錯,一定要重看或重聽材料。
Excel和谷歌表格——幾乎所有材料我都用Excel和谷歌表格來處理,Excel可以創建和整理不同體量的信息。例如,我寫過一篇民用工程承包商在伊拉克受傷的故事,案例眾多,一下子記不全,我用Excel整理了重點關注的30多個案例,逐個添加案例數據。
思路整理工具—如果你做的調查耗時很長,可考慮使用如印象筆記和微軟筆記等兼容Office系統的文件整理軟件。這兩款軟件的特別之處在於,用戶可粘貼網頁、跟蹤信源信息和整理數據。
第二步:為故事添加數據
數據能為不少故事增色添彩,使故事更貼合背景、更具辨識度。數說故事也變得越來越簡便了。
報道中,複雜的數據分析不是必須。它可以很簡單,比如報道謀殺案時對比今年和去年的案件數;它也可以很複雜,比如對上市公司期權回溯作多元回歸分析。簡單也好,複雜也罷,重點是數據無處不在,因此不要逃避數據,而要善用它們。
做個小練習吧。翻開任一報紙,看開頭幾篇報道,思考: 它們還隱含了哪些背景條件呢?
除了用數據,如何找數據也是一個問題,不妨先從權威機構和政府部門開始查找。如果關注國際數據,可參考:《24萬數據集整合,211種文件轉換:社會發展類公開數據清單》,也可查詢Geohive整合的“亞歐非美政府官方數據大集合”。國內數據,可登入全球深度報道網,點擊“資源庫”——“深度報道公開數據庫+檢索連接”,查閱調查相關議題。
第三步:按時間順序敘事
無論調查報道以何種形式建構 ,其篇幅是長或短,敘事採用陳述型或主題型,情節發展是由角色或話題推動,總歸要按時間順序敘事。
我坐下寫作時,第一件事就是列出時間軸。有個誇張的例子:有次我寫了一篇關於哥倫比亞北部聖多明戈(Santo Domingo)村的爆炸案的故事,做了足足11頁的時間軸,它們對觀察事件發展大有幫助。
時間軸的三個好處:
• 幫你看到易被忽略的事件關係。
• 幫你快速查閱事件。
• 供你在時間軸添加信源信息,幫助記憶信息來源。
我喜歡用表格製作時間軸,你也可以用Word來做,只要每段開頭使用“年-月-日”(YYYY-MM-DD)這種日期格式,Word就能據日期分段。你可以在文檔底部輸入信息作分段,確保時間軸按時間順序排列即可。
以我愚見,現有的時間軸工具還滿足不了新聞業需求。目前的工具更重產出而非數據收集,類似的有網頁版工具Tiki Toki和Dipity,還有北卡羅萊納大學Knight Lab的timelinejs和我們ProPublica的TimelineSetter。但是對這些工具我多少還是有點不滿意。表格和word文檔倒是挺好用。
第四步:用人物講故事
現在該開始寫報道了。要把故事寫活,就必須要寫個有料的人物。
記筆記或跟他人談話時,我習慣在精彩的引述旁標上星號。重看筆記時,你可直接找星號,單獨整合成“語錄”,瀏覽一遍,找出最好的十到二十條。這樣做的原因有二:
1. 能幫助你建立報道結構。你可藉此構思引題、開頭引述和過渡段落等。
2. 能保證留下最佳內容。所謂“取其精華,去其糟粕”,仔細瀏覽所有信息,找到簡短有力、一針見血的部分。
選取報道人物是另一關鍵,並不是每次都能找到合適人選。如果報道的時間跨度大、包含角色多,最佳處理方式可以是以時間為主線、按事件發展的順序敘述。有時,一個故事可能沒有一個合適的人物——千萬別把角色硬塞進故事裡,這樣會破壞人物形象。
相反,如果有人妙語連珠,其經歷讓人震撼慨嘆,能充分體現報道主旨,寫TA你就能遊刃有餘,記得把TA的故事用到極致。
第五步:把故事講清楚
這是最難的一部分:如何講故事。
但其實通過上述一至三步,你應該或多或少對調查報道敘事有點感覺了。
我最喜歡的報道結構是時間線敘事。這種結構幫助讀者理解發生了什麼,事件之間如何聯繫,讓文章變得易讀。但如果說按時間敘事是敘事的唯一方法,肯定會招致非議。
一般來說,我會在開頭概括故事及主要觀點——找到一個易寫、易吸引人的場景,在文末呼應,或是寫簡單的硬新聞導語。接下來寫主題段落,提及關鍵發現、有關方面的反應。至此大概有10至15段,看到這裡的讀者能判斷是否繼續閱讀。寫完開頭,故事就能按照時間順序自然敘述了。
我的次選是按主題敘述。換言之,就是故事分成能解釋問題的幾大塊——我把這種辦法稱為“大雜燴”。用這種敘事結構時,我在每個主題里也都按時間敘事。
以上是我創作報道的過程,可以分為好幾步,但大多會同時進行。一開始,我就思考如何用人物敘事、以何種結構敘事。同時,我也尋找合適的數據,將材料數字化處理。這些步驟無需固定,但可反覆操作。每當發現新數據、新人物,或者處理數據時找到了新趨勢,我都會重走步驟,作出修改。
調查與寫作的過程也許漫長而艱辛,但歸根到底,讀者想看的都是扣人心弦、敘事清晰、真實可信的報道。因為發稿時間易變,資源縮減,員工流失,作品不會一直保持高水準,但我們仍可嘗試。如果方法對路,效果一定出彩。
T. Christian Miller是美國非盈利獨立網絡媒體ProPublica的高級記者。 他曾在《洛杉磯時報》任職11年,報道過2000美國總統選舉,並任分社社長3年,負責中、南美洲地區10個國家的報道。出版著作Blood Money: Wasted Billions, Lost Lives, and Corporate Greed in Iraq . 他曾獲得廣播報道的George Polk獎,創傷報道的達特災難與創傷報道卓越獎,調查報道方面的Selden Ring獎以及美國調查記者與編輯協會獎(Investigative Reporters and Editors)等。
編譯/梁思然
編輯/周煒樂,王一葦