很多大型新闻机构和媒体,早已把对体育、天气、股市交易变动以及公司业绩的报道任务交给电脑来完成。让人意外的是,电脑的报道能比一些记者做的更为缜密和全面。许多记者的报道通常只有一个信源,与此不同,电脑软件可以输入来自多个源头的数据,从中发现某种趋势和规律,同时,运用自然语言处理技术,输出包含形容词、修辞和比喻等手法的高级句式,解释那些趋势所处的背景。如今,机器甚至能生动形象地描绘一场紧张的足球比赛中的观众情绪。
这些技术发展,正是令众多新闻从业者害怕自己会被人工智能(AI)取代的原因。然而,与其惊惧变化,不如拥抱这项技术。通过帮助记者更好地报道我们如今所处的,愈发复杂、愈来愈全球化和信息过剩的世界,AI其实有可能拯救新闻行业。
智能机器可以为记者的报道、创意以及吸引受众的能力提供加持。有了可预测的数据模型,以及被程序所赋予了不断“学习”上述模型中的变化的能力,算法便可以帮助记者以过去无法想象的速度管理、分类和生产内容。比如,算法能够系统化数据来寻找调查性故事中的缺失链条;它能识别趋势,在数百万数据点中发现可能成为一篇精彩独家的开始的异常值。举个例子,现在,一家媒体机构可以持续为所有公共采购数据输入一个算法,这个算法能够交叉验证采购方是否与供应商地址相同。当这样一个系统逐步被完善,记者便可以从中知道哪里发生贪污。
人工智能不仅能分析大量数据来协助及时的调查,还能够找出公众报料中的信源,核验报料信息,判断其可信度。根据美国哥伦比亚大学Tow数字研究中心2017年的一份报告,美国多家媒体机构在那时已开始使用AI进行事实核查。例如路透社的产品News Tracer,就用于追踪社交媒体上的突发新闻,核验推文的真实性。巴西的Serenata de Amor,由一群科技爱好者和记者组成团队,利用一个名为Rosie的机器人来追踪巴西国会议员的每一笔报销款项,并对可疑的开销提出有理据的质疑。
对记者来说,算法的用处还有很多:粗剪视频、识别声音模型、在人群中进行人脸识别、与读者交谈和回应咨询等。而要做到以上这些事情,难点在于,首先要由有想法的人类记者不断向数据发问。记者和编辑都需要快速学习,了解这些系统是如何操作的,他们可以如何使用算法来提高新闻报道的质量。
世界上大多数记者都没有机会接触程序员和数据科学家团队,让后者帮忙设计和构建他们的项目。协作是唯一的办法。小型新闻机构和自由职业者可以通过与软件开发人员合作来弥补资源的不足,从而帮助建立更加永久的协作。记者也可以由此了解更多可用的开源搜索和分析工具。
记者和技术人员之间的沟通不是一蹴而就的,而是需要双方不断学习和一些反复试验。随着技术不断发展,记者现在的“工具包”正在不断扩充,以便更好地向权力问责。随着这种倾听受众和确认受众需求的能力越来越强,记者如果不去尝试相关技术,那将是一种巨大的浪费。
伦理问题
《卫报》编辑Paul Chadwick曾撰文讨论新闻报道和人工智能之间的关系,提议报纸增加一条新的道德准则。“会‘思考’的软件越来越有用,但它并不一定以道德的方式收集或处理信息。”他在文中提醒道,“当使用人工智能来为你的报道加持的时候,要考虑技术是否有违新闻准则。”
记者必须认识到算法可能“撒谎”或产生误导。它们是由具有偏见的人类编程而得的,其中的逻辑模式可能导致错误的结论。这意味着记者还是需要用传统的验证技术来检查结果:交叉检查来源,比较不同文件,对机器的发现保持怀疑。
在这个机器智能新时代,透明度是新闻业的另一个必要条件。“人工智能进入新闻编辑室的最大绊脚石是透明度。透明度是一种基本的新闻价值,通常与人工智能‘水火不容’,因为人工智能通常是一种幕后的工作。”《哥伦比亚新闻评论》(Columbia Journalism Review)的数字编辑Nausicaa Renner说。
如果媒体想要保持公信力,它应该让其受众知道它正在收集哪些个人数据。尽管人工智能技术可以让他们精确地迎合观众的品味,编辑们也应该努力告知用户他们不想知道的事情。维护公众利益仍然是媒体的职责,也是其生存的关键。
同理,调查记者也应尽力解释他们如何使用算法来发现故事的规律或处理证据。只有这样,他们才能将自己与那些为了商业或政治目的而秘密收集数据的操纵者和煽动者区分开来。此外,一个健康的新闻业应该继续关注那些没有人系统地收集过信息或建立数据集的棘手议题,帮助沉默者发声。
最后,虽然人工智能确实能够以前所未有的方式造福新闻业,但这也为记者学习和问责带来了新的挑战。若无新闻报道,所有这些技术都不会使社会的信息变得更为通达。若无道德规范,智能技术或将预示着新闻业的消亡。若无明确的目的、透明的流程和公共利益的指引,新闻业将失去人们的信任,无论你用多少华丽的图表、机器人和噱头来包装你的报道。
人工智能应用案例
自动生成新闻(Automated journalism):从数据中生成故事。最初这种形式被用于报道体育和财经新闻。它可以让记者从一些常规报道中解放出来,提高效率和降低成本。 美联社使用Wordsmith软件将财务数据转化为故事。《华盛顿邮报》使用内部开发的技术Heliograf报道体育赛事和竞选活动。
管理工作流程:利用标签和链接追踪突发新闻、汇总和整理新闻;或用AI审核评论,以及自动转录语音。《纽约时报》用Alphabet旗下公司Jigsaw开发的Perspective API工具,来处理读者的评论。路透社的“Connect平台”实时显示所有路透社发表的内容,包括档案文件,以及来自其世界各地媒体合作伙伴的内容。
跟踪社交媒体上的新闻:AI还被用于分析实时和历史数据,识别“大V”并与受众互动。美联社使用Newswhip监控社交媒体趋势并提高受众参与度。
与受众互动:美国商业网络媒体Quartz开发了一个聊天机器人应用程序,用户可以向机器人程序发送信息,询问有关新闻事件、人物或地点等问题,程序会回复其认为与用户相关的内容。《卫报》在其脸书即时通讯应用Facebook Messenger上设置了机器人。BBC使用机器人来报道欧盟公投。 AfriBOT项目是欧洲新闻中心和The Source(纳米比亚和津巴布韦)的“创新非洲”奖项获得者之一。该项目也在开发一个开源新闻机器人,以“帮助非洲新闻机构生产个性化新闻,并通过通讯平台更有效地与受众互动”。
自动事实核查:AI还可以让记者快速核查公开声明或主张,阿根廷事实核查媒体Chequeado的机器人Chequeabot是一例。英国“Full Fact UK”及其合作伙伴正在开发一个自动事实核查引擎,这一工具“能发现已被核查过的主张,并使用自然语言处理和结构化数据自动检测和检查新的声明”。美国杜克记者实验室开发了工具ClaimBuster,为媒体提供具有政治意义的声明,并于2017年成立了专门推动自动事实核查项目发展的中心。英国的Factmata也正在开发一种自动化的事实核查工具。通过此链接了解更多相关案例。
分析大型数据库:AI能够处理数据并找出数据中的规律、变化或任何异常情况。路透社的Lynx Insight会浏览大量数据,并为记者提供分析结果和背景信息。 OCCRP(有组织犯罪与贪腐报道计划)的“犯罪模式识别”计划使用的技术可以分析大型文档数据库,从中找出与腐败相关的罪案以及相关各方之间的联系。
图像识别:这是一种能够识别图像中物体、地点、人脸甚至情感的技术。《纽约时报》使用亚马逊的Rekognition API来识别照片中的国会议员。任何用户都可以免费试用谷歌的Vision API图像识别技术。
视频制作:这种技术可以根据新闻文章自动创建脚本,并利用视频片段制作简短粗略的叙事性视频短片。 USA Today、Bloomberg和NBC都使用一款名为Wibbitz的软件。斯坦福大学的研究人员也在开发一种自动视频编辑工具。
编译/Vickie Liang
相关阅读:
本文首发于“独立新闻项目”,深度网获授权转载。
María Teresa Ronderos现专注于转型中国家媒体研究,曾就职于哥伦比亚一流杂志Semana。