编者注:本文原刊于“德外5号”(公众号ID:dewaiwuhao),全球深度报道网获授权转载
2021年是《卫报》成立的第200周年。从去年4月底开始,《卫报》就推出了200周年庆专题,相继发布了一系列报道,回顾200年办报以及走向数字化的心路历程。
近年来,随着数字订阅用户争夺的战况愈演愈烈,《华尔街日报》成立了一系列新部门和新团队,致力于吸引更广泛的订阅群体,并推动机构内部的改革。
在BBC、《卫报》《华尔街日报》《金融时报》和《纽约时报》等海外大型媒体的数字化转型经验中,不乏值得国内媒体借鉴和参考的举措。
BBC:探索新闻AI可视化技术
伦敦政治经济学院下属国际新闻智库 Polis 和谷歌联合推出的新闻业AI(Journalism AI)项目,不久前举办了为期一周的人工智能记者节(Journalism AI Festival)活动。
在该活动上,BBC 新闻实验室阐述了他们如何利用人工智能技术来更新新闻形式,旨在提升内容的影响力,他们提到了新闻的个性化设置,以及如何使用谷歌的 AI 模型为文章总结要点。
BBC 新闻实验室介绍了一款适用性较强的工具,简称为“图形故事编辑器” (Graphical Story Editor),它可以帮助记者快速将新闻文本创造为适用于社交媒体的其他新闻形式。
用户时间和注意力的紧张,意味着少有人愿意投入到成篇的文字阅读中去,因此有必要提供一种多样的新闻表达方式,如项目符号、要点总结、图片库、漫画、互动语音等。BBC试图以不同方式向不同受众传递信息,这能够提升新闻的吸引力,从而触达更多的受众。
“图形故事编辑器”内含图像目录和一些预制模板,记者可以在其中输入素材,编辑器会对内容进行重新组合和创造。当然,记者也能够自行编辑或是创建新的新闻报道。
尽管还只是一个雏形,BBC 正在考虑将其纳入到他们的内容管理系统(CMS)之中。该团队表示:“我们正在探索如何实现该工具与正在开发的内容管理系统的整合,甚至将相关内容发布在新闻客户端中”。
《卫报》:简化新闻编辑勘误流程
《卫报》的内部博客“Inside the Guardian”发布的内容主要关于媒体变化和更新,以及分享媒体内部的故事、总结实战中的经验教训等主题的博客。去年11月,《卫报》的内部博客介绍了一款纠错工具 Typerighter。当记者表述不当时,此工具将从报纸的风格样式指南中查找相关内容并予以标记。
在博客中《卫报》是这样介绍该产品的:“事实证明,它有助于新闻编辑室的工作开展,并激励我们更加深化对工具的使用。在接下来的数月里,一个由跨组织的记者和开发人员组成的团队将把我们的整个风格指南嵌入 Typerighter 中。”目前,它已被内置于现有的内部编辑软件 Composer 中,记者们能从文本编辑软件中打开它,其工作流程有点类似著名编辑工具 Grammarly 的《卫报》版本。
发布后勘误的成本往往比发布前要高,而 Typerighter 以后台运作的方式悄然解决了记者和助理编辑的难题,但这并不妨碍新闻产品质量的实现;这也使助理编辑们能够有更多的时间从事其他方面的工作,比如拟标题、选图片和编辑导语等等。
《华尔街日报》:优化受众数字体验
《华尔街日报》的数字体验和战略团队(DXS)在 Medium 上运营了一个博客(此外,他们还有一个播客)。他们在那里分享关于产品、设计、技术和受众策略的想法。
在最近的一篇播客中,他们集中探讨了数字订户的维持策略。与许多媒体机构一样,《华尔街日报》用户数量也实现了激增,接下来他们希望吸引更多新的订户和参与度较低的会员更频繁地访问网站(他们发现这样做可以提高用户保留率)。
首先,每日的电子邮件提供了转向《华尔街日报》数字版的快捷链接。疫情的蔓延减少了单份零售和送报上门的售卖形式,这种数字化的方式更大程度确保了报纸的易得性。
其次还有一些微小的变化,比如桌面主页上设置的“查看关注列表”(View Watchlist)链接使该功能的访问者增加了90%;导航中新的“播客”链接在首月内就增加了16%的播放量;以及将“相关新闻”推广到谷歌 AMP(移动页面加速服务)的报道中,有利于吸引更多移动搜索用户阅读《华尔街日报》。
另外,在博客中该团队也介绍了通过引入“收听本文”(Listen to this article)功能所获的成功。通过这一按钮,网站能够自动生成新闻的音频版本,它被证明比当下流行的填字游戏更能培养用户的使用习惯。
《金融时报》:预测热门话题
《金融时报》的“产品和技术”博客(The Product & Technology blog ),以发布指南和实验结果等为特色。它讲述了该报如何利用社交媒体上的气泡故事格式来推动读者与“我的FT”(My FT)的互动(该功能是《金融时报》的一大特色,它使读者可以选择感兴趣的话题去订阅和关注)。《金融时报》的媒体人发现,通过提供一种更动态的、易于导航的、现代的、以主题和图像为导向的体验,用户与 My FT 的互动更加频繁,对应用程序的访问频率也增加了近40%。
了解《金融时报》读者的喜好对于改善用户体验和保持互动性至关重要。他们有准确的指标来明晰日趋重要的领域,这能够帮助记者专注于感兴趣的话题,从而提升其工作质量。热门话题预测是使用机器学习和时间序列分析构建的数据科学模型。我们通过无监督的机器学习算法来定义文章主题,并使用时间序列分析来标记数据中的异常。
简单来讲,热点趋势预测模型的运作可总结为五个步骤:
1. 收集新闻要素;
2. 通过无监督的机器学习算法和自然语言处理生成对话题组文章的评价;
3. 将要素收集到两个数据集中,一个是日期,另一个包含日期和主题两项;
4. 导出布林线指标(Bollinger Bands,意图在给定时间序列上提供上线和下线),检测M形或L形信号(这些形状是基于指数移动平均和置信区间推导出来的,用于识别异常值),然后标记这些信号;
5. 以文本的形式向利益相关者提供数据,将信号数据写入Big Query(谷歌推出的开源大数据分析平台)。
预测未来趋势并提前定制内容以满足读者和订阅者的需求是一项强大的功能,当前的模型是预测热门话题的第一步,其添加扩展的范围很大,将来该报可能会推导出一个更复杂的模型,收集更多历史数据以更加精准地预测未来趋势。
《纽约时报》:探索文本深度分析辅助用户偏好学习
最近,《纽约时报》团队(NYT Open)深入探讨了“如何向读者提供下一步阅读”。文中提到,通过作者和编辑使用的关键字和标签分配推荐的文章存在诸多问题,比如读者兴趣可能与文章标签存在偏差,即标签表示文字主题,而兴趣通常表示基于上下文对该主题的细微解释。
由此该博客提出,应当构建一种更有效的、为文章分配兴趣标签的机器学习模型,通过编程读取文章文本来自动检测文章是否符合受众的兴趣。这种方法被称为“多标签分类”,也就是说每篇文章会被分类为零个或多个标签(或兴趣组)。
当我们更深入地查看一些不准确的标签时,我们通常可以理解为什么模型会分配该类标签,但是也意识到实际的纠错过程需要人类的判断。只有具备丰富的历史、社会知识以及识别上下文的能力,才能凭借直觉划分兴趣类别。
所以即使我们的模型在许多方面都优于现有的基于查询的系统,但在没有人工监督的情况下,让它全盘管理是不负责任的。读者的信任举重若轻,与许多其他基于AI的决策系统一样,该算法也不应在没有人工监督的情况下做出任何决定。
结语
上文的几例新闻创新实验主要从新闻报道形式变革、内容编审流程、受众体验、技术应用等角度展开,逐步实现了生产效率的提升和媒体效益的增长。但如何真正破局而立,以及探讨出更完备的创新机制,仍有待观察。