明天,2016年美国总统大选终于要尘埃落定,决出最终赢家。 两名候选人自竞选开始便广受争议,到选举后期,电邮门、猥亵女性门、ISIS幕后黑手门等各种丑闻的曝出,一次次引发美国全民的激烈辩论。大选落幕在即,深度君为你筛选这期间国外各大媒体的数据新闻,看媒体如何创新地报道纷纷扰扰的美国大选。
1.民意调查与结果预测
著名民调网站FiveThirtyEight从今年6月起持续统计民调,预测各州的选举人票将落入谁手,根据民调选情即时更新。(深度君写完这篇文章之后发现,希拉里的胜算几率较开始动笔时已上升了5%!)
FiveThirtyEight采用了三种预测模型:第一种为“民调预测”(Polls-only forecast),即只看民调数据预测大选结果;第二种可称为“综合预测”(Polls-plus forecast),即不仅看民调,还结合经济数据、往届选举各州的摇摆及投票情况等综合分析来预测最后结果;最后一种是“今日预测”(Now-cast),即假设若选举在当天结束,谁会获胜。
读者可点击查看任何一种模型下各州选举人票与民众投票归属,从6月至11月期间民调变化,以及在各州两位候选人的胜算几率。
538张选举人票是决胜负的关键,为了更直观地呈现各州选举人票与其归属情况,FiveThirtyEight设计了一张“蜂窝状”美国地图,图中组成各州的六边形数量即为该州的选举人票数,深红和深蓝分别代表特朗普和希拉里稳拿的州,颜色越浅则代表候选人在该州越得加劲儿地拉票,否则“一票不得,满盘皆输”。(编者注,美国总统大选的选举人票制度采取“胜者独得”的原则,即若候选人在某一州获得多数普选票,则该州选举人票全部给予该候选人。)
如果“蜂窝图”还不能让你清楚看出谁的胜算较大,那以下这个类似拔河拉锯的票数“路径图”或许会让你一目了然——路径跨过了中间虚线的就是得到过半(270票)选举人票的赢家。
除了各州民调,FiveThirtyEight还通过不同渠道收集了1088个全国民调的数据。全国民调又反映了怎样的选情?民调究竟靠不靠谱?见证奇迹的时刻就要到来。
《华盛顿邮报》:看人群——心仪候选人丑闻层出不穷怎么看?该选谁的还是选谁
同样看民调,《华盛顿邮报》从数据中细分出了登记选民/潜在选民(Registered/Likely)、性别、党派、意识形态、种族、年龄、受教育程度,以及作为白人的受教育程度这八个群体,将各群体从6月至10月对两位候选人的支持程度可视化呈现。图上每一点代表其对应群体倾向某一候选人的百分比。例如,当我们选择“种族”这个分类,就能很清晰地看到,在黑人选民方面,希拉里几乎一直是以80%的支持率差距“藐视”特朗普。而在获得白人选民支持的方面,特朗普始终以微弱优势领先希拉里(9到18个百分点)。
位于综合图中间的曲线代表对两人意见摇摆不定的群体。尽管摇摆,但变动的幅度都不算太大——最突出的是年龄65岁以上人群,几乎每两个月就“倒戈”一次,但最多也不超过19个百分点。对于其他群体而言,则是一开始认定了哪个候选人,就会支持到底。
上述《华盛顿邮报》的可视化图表中其实还有个有趣的规律:从9月到10月中旬,多个群体的曲线都以不同程度拐向了希拉里的方向,这表明人们对特朗普的支持率有所下降。原因?自然是特朗普被曝出在2005年某电视节目录制前发表了一通猥亵女性的言论。包含露骨言论的视频一出门,不要说对特朗普歧视女性这点一直心存不满的普通群众,连一向胳膊肘不往外拐的共和党党内大佬们都坐不住了。在视频发布不到24小时内,不少大佬纷纷发表公开声明,严厉谴责特朗普的行为并立马与其划清界限,宣布自己“粉转黑”或“路转黑”。更有甚者,直接喊特朗普下台。
《经济学人》的信息图便记录了这一视频丑闻后,特朗普面对的“众叛亲离”局面。左边一栏展示的是各共和党议员发表声明时距离视频发布的时间,右边栏则清晰反映了众人立场的改变。
《纽约时报》的大选可视化,最突出的特点是把多家媒体与民调机构的大选预测放在同一张表中对比分析。时报所选取的机构,不仅有像FiveThirtyEight那样依靠数据模型做预测的,还有以实地报道和专家意见为预测依据的Cook Political Report,甚至还包括统计博彩市场信息的PredictWise,可谓面面俱到。时报所做的,是每天收集这些机构的数据,再采用统一的评级标准转换数据,并进行全国与所有州的州内对比。
另一亮点,是一个希拉里与特朗普的“胜利之路”结构图。这宛如枝蔓丛生的结构图看起来复杂,但原理非常简单,用一句话概括就是:若A则B,否则C。结构图左边列出的是摇摆州,这些州的选择往往能一票定胜负,从图中可见佛罗里达州和宾夕法尼亚州极为关键。这个图就从假设谁能赢得佛罗里达州开始,接着一步步推理每一个摇摆州的胜负情况会导致的结果,以此展示两人将如何获得最终胜利。到目前为止,时报的分析显示,希拉里比特朗普多出了300多条路径入主白宫 。
2.媒体表现
众人皆知,特朗普是个狂热的社交媒体爱好者,在推特上总是语出惊人。但很快有人发现,特朗普从安卓手机和iPhone端发的推文风格不一:安卓发出的推文多数语气暴躁,言辞激烈,而iPhone推文更有礼节,语气更加节制。于是便怀疑安卓和iPhone推特账号分别为特朗普本人和其竞选团队所用。针对这个假设,美国最大在线程序员社区Stack Overflow的数据专家David Robinson开始动手挖掘特朗普的推特数据,采用的工具是神通广大的R语言。
Robinson先比较了安卓和iPhone端的发推时间,推文中是否喜欢用引号“手动转发”他人发的内容,推文是否配图或附带链接这三个方面的情况——从各个对比图看,两者的差别不只一点点。
最后,重头戏在于对两种推文的文本情感分析。David统计词频,分析用语,表示安卓推文的用词普遍更加消极——难过、恐惧、愤怒、反感是其中反映出最多的几种情绪,恰与特朗普一直以来给人的印象相符。反观iPhone推文呈现出的规律,尽管语气用词颇有特朗普的风格,但在数据的“显微镜”下,差异一目了然。完整R代码和详尽的分析都在这里。
3.数据驱动调查
在一片民调统计、结果预测的可视化汪洋大海中,Bailiwick走出了不寻常路——实际上,Bailiwick是一款调查工具,由纽约大学学者Meredith Broussard带领团队设计而成。它通过可视化今年美国各地角逐政府公职候选人的竞选资金数据,帮助记者快速高效地从中找“猫腻”、挖故事。Bailiwick从联邦选举委员(Federal Election Commission)网站和Opensecret.org上抓取候选人开支数据,再根据美国政治研究中心(Center for Responsive Politics)的分类方法,按资金来源分成竞选委员会、直接支持者、间接支持者和反对派团体四大类。
目前,该网站涵盖4000多名联邦候选人及17000多个政治委员会(Political Action Committee,美国政治组织,功能是筹集与分配竞选经费给角逐供职的候选人)的竞选资金数据。
追踪调查某一候选人,只要通过选择关注该候选人,连接你的Slack账号,然后在Bailiwick网站设置更新提醒,每次该候选人接收新的一笔捐款或竞选资金有任何变动,网站机器人就会直接把更新信息发到你的Slack上。
最后,推荐美国信息图设计师在线社区Visualoop的“50个2016美国大选交互可视化”清单,从互动图表到新闻游戏,让我们配合选举开票的紧张时刻,欣赏一下美国同行各种脑洞大开的数据新闻与可视化作品。
编辑/Ivan Zhai