編者註:本文原刊於“德外5號”(公眾號ID:dewaiwuhao),全球深度報道網獲授權轉載
2021年是《衛報》成立的第200周年。從去年4月底開始,《衛報》就推出了200周年慶專題,相繼發布了一系列報道,回顧200年辦報以及走向數字化的心路歷程。
近年來,隨着數字訂閱用戶爭奪的戰況愈演愈烈,《華爾街日報》成立了一系列新部門和新團隊,致力於吸引更廣泛的訂閱群體,並推動機構內部的改革。
在BBC、《衛報》《華爾街日報》《金融時報》和《紐約時報》等海外大型媒體的數字化轉型經驗中,不乏值得國內媒體借鑒和參考的舉措。
BBC:探索新聞AI可視化技術
倫敦政治經濟學院下屬國際新聞智庫 Polis 和谷歌聯合推出的新聞業AI(Journalism AI)項目,不久前舉辦了為期一周的人工智能記者節(Journalism AI Festival)活動。
在該活動上,BBC 新聞實驗室闡述了他們如何利用人工智能技術來更新新聞形式,旨在提升內容的影響力,他們提到了新聞的個性化設置,以及如何使用谷歌的 AI 模型為文章總結要點。
BBC 新聞實驗室介紹了一款適用性較強的工具,簡稱為“圖形故事編輯器” (Graphical Story Editor),它可以幫助記者快速將新聞文本創造為適用於社交媒體的其他新聞形式。
用戶時間和注意力的緊張,意味着少有人願意投入到成篇的文字閱讀中去,因此有必要提供一種多樣的新聞表達方式,如項目符號、要點總結、圖片庫、漫畫、互動語音等。BBC試圖以不同方式向不同受眾傳遞信息,這能夠提升新聞的吸引力,從而觸達更多的受眾。

“圖形故事編輯器”旨在節省記者的時間並為社交媒體創建豐富的可視化新聞(來源:BBC Newslab)
“圖形故事編輯器”內含圖像目錄和一些預製模板,記者可以在其中輸入素材,編輯器會對內容進行重新組合和創造。當然,記者也能夠自行編輯或是創建新的新聞報道。
儘管還只是一個雛形,BBC 正在考慮將其納入到他們的內容管理系統(CMS)之中。該團隊表示:“我們正在探索如何實現該工具與正在開發的內容管理系統的整合,甚至將相關內容發布在新聞客戶端中”。
《衛報》:簡化新聞編輯勘誤流程
《衛報》的內部博客“Inside the Guardian”發布的內容主要關於媒體變化和更新,以及分享媒體內部的故事、總結實戰中的經驗教訓等主題的博客。去年11月,《衛報》的內部博客介紹了一款糾錯工具 Typerighter。當記者表述不當時,此工具將從報紙的風格樣式指南中查找相關內容並予以標記。
在博客中《衛報》是這樣介紹該產品的:“事實證明,它有助於新聞編輯室的工作開展,並激勵我們更加深化對工具的使用。在接下來的數月里,一個由跨組織的記者和開發人員組成的團隊將把我們的整個風格指南嵌入 Typerighter 中。”目前,它已被內置於現有的內部編輯軟件 Composer 中,記者們能從文本編輯軟件中打開它,其工作流程有點類似著名編輯工具 Grammarly 的《衛報》版本。
發布後勘誤的成本往往比發布前要高,而 Typerighter 以後台運作的方式悄然解決了記者和助理編輯的難題,但這並不妨礙新聞產品質量的實現;這也使助理編輯們能夠有更多的時間從事其他方面的工作,比如擬標題、選圖片和編輯導語等等。
《華爾街日報》:優化受眾數字體驗
《華爾街日報》的數字體驗和戰略團隊(DXS)在 Medium 上運營了一個博客(此外,他們還有一個播客)。他們在那裡分享關於產品、設計、技術和受眾策略的想法。
在最近的一篇播客中,他們集中探討了數字訂戶的維持策略。與許多媒體機構一樣,《華爾街日報》用戶數量也實現了激增,接下來他們希望吸引更多新的訂戶和參與度較低的會員更頻繁地訪問網站(他們發現這樣做可以提高用戶保留率)。
首先,每日的電子郵件提供了轉向《華爾街日報》數字版的快捷鏈接。疫情的蔓延減少了單份零售和送報上門的售賣形式,這種數字化的方式更大程度確保了報紙的易得性。
其次還有一些微小的變化,比如桌面主頁上設置的“查看關注列表”(View Watchlist)鏈接使該功能的訪問者增加了90%;導航中新的“播客”鏈接在首月內就增加了16%的播放量;以及將“相關新聞”推廣到谷歌 AMP(移動頁面加速服務)的報道中,有利於吸引更多移動搜索用戶閱讀《華爾街日報》。
另外,在博客中該團隊也介紹了通過引入“收聽本文”(Listen to this article)功能所獲的成功。通過這一按鈕,網站能夠自動生成新聞的音頻版本,它被證明比當下流行的填字遊戲更能培養用戶的使用習慣。
《金融時報》:預測熱門話題
《金融時報》的“產品和技術”博客(The Product & Technology blog ),以發布指南和實驗結果等為特色。它講述了該報如何利用社交媒體上的氣泡故事格式來推動讀者與“我的FT”(My FT)的互動(該功能是《金融時報》的一大特色,它使讀者可以選擇感興趣的話題去訂閱和關注)。《金融時報》的媒體人發現,通過提供一種更動態的、易於導航的、現代的、以主題和圖像為導向的體驗,用戶與 My FT 的互動更加頻繁,對應用程序的訪問頻率也增加了近40%。
了解《金融時報》讀者的喜好對於改善用戶體驗和保持互動性至關重要。他們有準確的指標來明晰日趨重要的領域,這能夠幫助記者專註於感興趣的話題,從而提升其工作質量。熱門話題預測是使用機器學習和時間序列分析構建的數據科學模型。我們通過無監督的機器學習算法來定義文章主題,並使用時間序列分析來標記數據中的異常。

《金融時報》熱點趨勢預測模型的工作頁面(來源:Medium)
簡單來講,熱點趨勢預測模型的運作可總結為五個步驟:
1. 收集新聞要素;
2. 通過無監督的機器學習算法和自然語言處理生成對話題組文章的評價;
3. 將要素收集到兩個數據集中,一個是日期,另一個包含日期和主題兩項;
4. 導出布林線指標(Bollinger Bands,意圖在給定時間序列上提供上線和下線),檢測M形或L形信號(這些形狀是基於指數移動平均和置信區間推導出來的,用於識別異常值),然後標記這些信號;
5. 以文本的形式向利益相關者提供數據,將信號數據寫入Big Query(谷歌推出的開源大數據分析平台)。
預測未來趨勢並提前定製內容以滿足讀者和訂閱者的需求是一項強大的功能,當前的模型是預測熱門話題的第一步,其添加擴展的範圍很大,將來該報可能會推導出一個更複雜的模型,收集更多歷史數據以更加精準地預測未來趨勢。
《紐約時報》:探索文本深度分析輔助用戶偏好學習
最近,《紐約時報》團隊(NYT Open)深入探討了“如何向讀者提供下一步閱讀”。文中提到,通過作者和編輯使用的關鍵字和標籤分配推薦的文章存在諸多問題,比如讀者興趣可能與文章標籤存在偏差,即標籤表示文字主題,而興趣通常表示基於上下文對該主題的細微解釋。
由此該博客提出,應當構建一種更有效的、為文章分配興趣標籤的機器學習模型,通過編程讀取文章文本來自動檢測文章是否符合受眾的興趣。這種方法被稱為“多標籤分類”,也就是說每篇文章會被分類為零個或多個標籤(或興趣組)。

由於查詢不完善,此數據集中的某些標籤不準確(來源:NYT Open)
當我們更深入地查看一些不準確的標籤時,我們通常可以理解為什麼模型會分配該類標籤,但是也意識到實際的糾錯過程需要人類的判斷。只有具備豐富的歷史、社會知識以及識別上下文的能力,才能憑藉直覺劃分興趣類別。
所以即使我們的模型在許多方面都優於現有的基於查詢的系統,但在沒有人工監督的情況下,讓它全盤管理是不負責任的。讀者的信任舉重若輕,與許多其他基於AI的決策系統一樣,該算法也不應在沒有人工監督的情況下做出任何決定。
結語
上文的幾例新聞創新實驗主要從新聞報道形式變革、內容編審流程、受眾體驗、技術應用等角度展開,逐步實現了生產效率的提升和媒體效益的增長。但如何真正破局而立,以及探討出更完備的創新機制,仍有待觀察。