想在新聞報道中使用 AI?這份百年報紙的做法或許能給你點啟發

Print More

English

Solar Farm in Cauchari, Jujuy Province

位於阿根廷胡胡伊省考查里的一個太陽能農場。圖片來源:屏幕截圖(La Nación)

編者按:本文原刊於路透新聞研究所,全球深度報道網獲授權翻譯轉載。

路透研究所對全球數百名重要媒體人進行調查和訪問,於不久前發布了《2022年媒體趨勢和預測報告》。報告顯示,越來越多媒體都對在新聞中運用人工智能技術(下簡稱 AI 技術)展現出興趣。如果你也在思考如何利用 AI 技術進行信息搜集、新聞報道以及更好地實現商業目的,那麼阿根廷的《國家報》( La Nación)也許會給你不少啟發。這份擁有150年歷史的老牌報紙不僅擁有自己的 AI 實驗室,還利用這項技術製作了涵蓋多個主題的新聞報道。

《國家報》對 AI 技術的運用是始於對阿根廷私有可再生能源的調查。2016年,當時的總統毛里西奧·馬克里(Mauricio Macri)啟動了一項計劃,鼓勵私有和跨國資本進入本國的清潔能源市場。而《國家報》的新媒體記者弗洛倫西亞·柯埃略(Florencia Coelho)因獲得約翰·奈特獎新聞獎學金(John S. Knight Journalism Fellowship)前往斯坦福大學研修期間,了解到“描繪美國每一塊太陽電池板”項目。受此啟發,她向編輯室提出了類似的選題,以繪製這個項目啟動四年後的進展。

《國家報》的數據小組與西班牙納瓦拉大學的訪問學者馬提亞斯·菲力珮(Mathias Felipe)一起展開合作。整個項目主要採用了機器學習和計算機視覺( computer vision)技術,還獲得一個專門從事地理空間分析和人工智能的第三方實驗室的技術支持。機器學習主要用來識別阿根廷的太陽能農場的形狀,而計算機視覺則對所獲得的視覺資料進行分析和理解。整個項目共使用了10999張圖片來訓練算法,處理了700萬張圖片,分析了278.04萬平方公里(107.4萬平方英里)的土地。最終結果顯示,阿根廷政府的這項政策並沒有奏效。

A screenshot of a map of the project.
《國家報》對阿根廷政府建設太陽能農場的承諾進行了調查。屏幕截圖

這個項目充滿了重重挑戰。獲取衛星圖像的花費不菲,而太陽能農場和一般的農場在衛星圖上看起來也差不多,這就需要更精準的圖像識別系統。在項目開始的2019年,阿根廷國內還沒有足夠的太陽能農場圖像來訓練人工智能,所以團隊不得不借用智利的圖像資料。柯埃略表示:“這使得我們無法繪製阿根廷的每一塊太陽能電池板,因為這需要非常高清的圖像,所以我們把範圍收窄到太陽能農場。機器學習主要依賴的是形狀,這是更容易識別的模式。”

要報道最終的調查結果,《國家報》還需要更多的硬件支持和擁有相關技能的新聞人員,但當時的新聞團隊還並沒有足夠的能力。柯埃略說:“因為沒有足夠的設備以及計算機能力,我們選擇與其他團隊合作。數據共享帶來了不錯的結果。”

分析熱門歌曲:陷阱音樂

在太陽能電板上的初次嘗試,《國家報》不僅嘗到合作的好處,還認識到團隊在 AI 技術方面的不足也許會影響報道能力。比如說如果無法測試一個模型的準確度,新聞團隊就有可能提不出抓住事件關鍵的重要角度。於是,編輯部着手組建了一個人工智能新聞室,由記者、數據分析師和開發者等7名工作人員組成。這7名成員都不是全職在這個人工智能新聞室工作,他們需要在平時兼顧其他選題。

實驗室的第一個項目是對在阿根廷大受歡迎的陷阱音樂(Trap Music)進行歌詞分析,共耗時7個月。主要負責人是加布里埃拉·布爾特( Gabriela Bouret )和黛爾菲娜·阿倫比烈(Delfina Arambillet),柯埃略並沒有參加。團隊使用機器學習和自然語言處理對 Spotify 和 Genius 網站上共692首歌曲進行了歌詞分析,以了解這種音樂的主題、趨勢和意涵。AI 技術必須處理一些語言問題,包括分析這種歌曲中獨有的詞彙。最後,讀者能通過一個互動報道,了解到陷阱音樂中常用的詞彙,哪些音樂家最愛在歌詞中提及自己,以及種種有關該類音樂重要特點的分析。

A GIF showing the trap project.
顯示《國家報》分析陷阱音樂歌詞項目的 GIF。

科埃略認為,團隊從這個項目中學到的許多東西不僅可以應用於其它類型的音樂,甚至是不同類型的文本。數據分析師加布里埃拉·布爾特表示:“今天我們探索的是陷阱音樂,但明天我們可以用來研究政治話語或者更多不同的主題。”

編輯部採用新的技術、工作流程和選題,也在影響整個團隊的報道風格。布爾特說:“《國家報》是一份非常傳統的報紙,早已形成一套自己做新聞的辦法。而陷阱音樂是很多年輕人感興趣的話題,這不是《國家報》慣常會關注的題目。正因為如此,我們得以打破傳統,給讀者耳目一新的感覺。”

《國家報》的探索也顯示,AI 技術主要是依據英語或者發達國家的材料受訓。布爾特說:“我們接觸到的幾乎每個(自然語言處理)模型都是為英語準備的。在研究陷阱音樂時,我們很難找到相應的圖書館資源和程序來幫助我們處理西班牙語的問題。”

分析大選新聞

2021年,AI 技術在阿根廷國會選舉中再度發揮作用。《國家報》利用計算機視覺技術來監測投票站發回的電報中的錯誤

這次,《國家報》與另一家第三方公司合作,通過開發和訓練算法,來識別選票中的不一致之處。選票記錄的細節包括每個政黨贏得的票數、現場選舉監督員的數量等,然後再通過志願者對不太準確或者上傳格式不當的選票記錄進行人工核實,以加強算法的準確性。《國家報》同時藉助了自己的 VozData 平台。這個平台鼓勵讀者透過信息公開倡議及大學資源合作進行數據調查。結果表明,95%的選票內容填寫正確,但有5%缺少相關信息。

這次的合作使得編輯室更加了解AI技術在不同情境下的作用。科埃略希望這個模型可以用來監測未來的選舉,並鼓勵選舉官員正確填寫選票信息。她表示:“讓政府知道人們在使用人工智能來監測公開文件的準確性是件好事。”

為 AI 技術挪出時間

報道中運用 AI 技術需要花費不少時間,編輯部遇到的最大挑戰之一是判斷自己是否有足夠的時間去支持項目的完成。《國家報》沒有要求實驗室一年要完成多少個新聞項目,這取決於具體的報道內容以及團隊成員有多少時間花在這件事上。

布爾特說:“這些項目可能需要五到七個月。這麼長的時間對很多媒體人來說是很難理解,因為他們總是很忙。所以必須要有耐心。我們每周都會安排一次專門的時間給 AI 項目,不然你永遠找不到時間給它了。”

科埃略補充說:“深度報道的記者可以花一年時間來調查腐敗或某個選題。所以我們把自己看成利用技術的深度報道記者。目前我們還在探索和學習的階段。一旦有了足夠的積累,相信我們的速度會變快。”

科埃略認為,和第三方人工智能專家、大學院系以及專家的合作,都有利於提升編輯部的研究進度,也會降低使用新技術的成本。這也能為學院或者學術研究提供案例。而創業公司可也可能會開發或者調試自己的人工智能模型,以便更好地推動在新聞業使用 AI 技術。

《國家報》還吸納了一些第三方資金以支持編輯部的 AI 實驗。他們申請了谷歌的一項新聞基金,資助下一個 AI 項目。這個項目從密碼強度檢查器獲得靈感,能自動檢測報道,鼓勵記者在行文中使用更多體現多樣性和包容性的措辭。

AI 視野中的性別和商業議題

在一連串的 AI 實踐中,《國家報》意識到內部合作不僅能促進編輯部內部更加支持使用AI技術,也能激發出更多可能性。目前,人工智能新聞實驗室正在開發西班牙語版本的“性別差異追蹤器”。這個工具最初是為了揭示加拿大線上新聞中在引用信息來源時的男女比例差異。科埃略和她的同事黛爾菲娜通過倫敦政治經濟學院組織的“JournalismAI Collab”項目開始研究這個工具,並將其引入《國家報》的編輯室中,以更好地了解新聞中的性別偏見,比如媒體是否會傾向某些話題選擇特定性別的受訪者。這個工具也有利於媒體的運營團隊評估一篇報道的影響力是否會受到性別或者主題的影響。

除此之外,《國家報》還參與了一個人工智能開源項目,目的是通過識別人臉性別,來分析新聞機構使用的男性和女性圖像的比例。這個項目最初是用亞洲面孔進行算法訓練,《國家報》提供了大約50張阿根廷人和拉美人的肖像照片,提高了算法在膚色和種族檢測方面的多樣性,使得不同文化背景下的媒體能夠有效地利用這項技術。

在《國家報》的 AI 實驗中,合作成為一個非常重要的詞。目前,他們合作過的對象各種各樣,包括第三方的技術團隊、商業部門、其他媒體以及讀者等等。即使在報紙內部,AI 新聞實驗室也體現着團隊合作作的重要性。科埃略說:“這些技術很難,所以能和別人一起學習探索是非常好的,即使對方是你的競爭對手,我們可以一起學習新技術,一起在比拼誰在報道上做得更好。更何況,我們本來就在與谷歌、Facebook 爭奪讀者的注意力。要花5-10年的時間來學習是不可能的,我們需要加快學習和分享的進程,也要和更多國家合作。我們自己當然需要學習,但這些內容對個體來說,實在是太多了。”


Laura Oliver 是一名英國的自由撰稿人。她曾為《衛報》、BBC、The Week等媒體撰稿。她是倫敦大學城市學院網絡新聞學的客座講師,並擔任多家新聞編輯部的的內容策略顧問。

Print Friendly, PDF & Email

發表回復

您的電子郵箱地址不會被公開。 必填項已用 * 標註