明天,2016年美國總統大選終於要塵埃落定,決出最終贏家。 兩名候選人自競選開始便廣受爭議,到選舉後期,電郵門、猥褻女性門、ISIS幕後黑手門等各種醜聞的曝出,一次次引發美國全民的激烈辯論。大選落幕在即,深度君為你篩選這期間國外各大媒體的數據新聞,看媒體如何創新地報道紛紛擾擾的美國大選。
1.民意調查與結果預測
著名民調網站FiveThirtyEight從今年6月起持續統計民調,預測各州的選舉人票將落入誰手,根據民調選情即時更新。(深度君寫完這篇文章之後發現,希拉里的勝算幾率較開始動筆時已上升了5%!)
FiveThirtyEight採用了三種預測模型:第一種為“民調預測”(Polls-only forecast),即只看民調數據預測大選結果;第二種可稱為“綜合預測”(Polls-plus forecast),即不僅看民調,還結合經濟數據、往屆選舉各州的搖擺及投票情況等綜合分析來預測最後結果;最後一種是“今日預測”(Now-cast),即假設若選舉在當天結束,誰會獲勝。

“綜合預測”模型
讀者可點擊查看任何一種模型下各州選舉人票與民眾投票歸屬,從6月至11月期間民調變化,以及在各州兩位候選人的勝算幾率。
538張選舉人票是決勝負的關鍵,為了更直觀地呈現各州選舉人票與其歸屬情況,FiveThirtyEight設計了一張“蜂窩狀”美國地圖,圖中組成各州的六邊形數量即為該州的選舉人票數,深紅和深藍分別代表特朗普和希拉里穩拿的州,顏色越淺則代表候選人在該州越得加勁兒地拉票,否則“一票不得,滿盤皆輸”。(編者注,美國總統大選的選舉人票制度採取“勝者獨得”的原則,即若候選人在某一州獲得多數普選票,則該州選舉人票全部給予該候選人。)
如果“蜂窩圖”還不能讓你清楚看出誰的勝算較大,那以下這個類似拔河拉鋸的票數“路徑圖”或許會讓你一目了然——路徑跨過了中間虛線的就是得到過半(270票)選舉人票的贏家。
除了各州民調,FiveThirtyEight還通過不同渠道收集了1088個全國民調的數據。全國民調又反映了怎樣的選情?民調究竟靠不靠譜?見證奇蹟的時刻就要到來。
《華盛頓郵報》:看人群——心儀候選人醜聞層出不窮怎麼看?該選誰的還是選誰
同樣看民調,《華盛頓郵報》從數據中細分出了登記選民/潛在選民(Registered/Likely)、性別、黨派、意識形態、種族、年齡、受教育程度,以及作為白人的受教育程度這八個群體,將各群體從6月至10月對兩位候選人的支持程度可視化呈現。圖上每一點代表其對應群體傾向某一候選人的百分比。例如,當我們選擇“種族”這個分類,就能很清晰地看到,在黑人選民方面,希拉里幾乎一直是以80%的支持率差距“藐視”特朗普。而在獲得白人選民支持的方面,特朗普始終以微弱優勢領先希拉里(9到18個百分點)。
位於綜合圖中間的曲線代表對兩人意見搖擺不定的群體。儘管搖擺,但變動的幅度都不算太大——最突出的是年齡65歲以上人群,幾乎每兩個月就“倒戈”一次,但最多也不超過19個百分點。對於其他群體而言,則是一開始認定了哪個候選人,就會支持到底。
上述《華盛頓郵報》的可視化圖表中其實還有個有趣的規律:從9月到10月中旬,多個群體的曲線都以不同程度拐向了希拉里的方向,這表明人們對特朗普的支持率有所下降。原因?自然是特朗普被曝出在2005年某電視節目錄製前發表了一通猥褻女性的言論。包含露骨言論的視頻一出門,不要說對特朗普歧視女性這點一直心存不滿的普通群眾,連一向胳膊肘不往外拐的共和黨黨內大佬們都坐不住了。在視頻發布不到24小時內,不少大佬紛紛發表公開聲明,嚴厲譴責特朗普的行為並立馬與其劃清界限,宣布自己“粉轉黑”或“路轉黑”。更有甚者,直接喊特朗普下台。
《經濟學人》的信息圖便記錄了這一視頻醜聞後,特朗普面對的“眾叛親離”局面。左邊一欄展示的是各共和黨議員發表聲明時距離視頻發布的時間,右邊欄則清晰反映了眾人立場的改變。
《紐約時報》的大選可視化,最突出的特點是把多家媒體與民調機構的大選預測放在同一張表中對比分析。時報所選取的機構,不僅有像FiveThirtyEight那樣依靠數據模型做預測的,還有以實地報道和專家意見為預測依據的Cook Political Report,甚至還包括統計博彩市場信息的PredictWise,可謂面面俱到。時報所做的,是每天收集這些機構的數據,再採用統一的評級標準轉換數據,並進行全國與所有州的州內對比。
另一亮點,是一個希拉里與特朗普的“勝利之路”結構圖。這宛如枝蔓叢生的結構圖看起來複雜,但原理非常簡單,用一句話概括就是:若A則B,否則C。結構圖左邊列出的是搖擺州,這些州的選擇往往能一票定勝負,從圖中可見佛羅里達州和賓夕法尼亞州極為關鍵。這個圖就從假設誰能贏得佛羅里達州開始,接着一步步推理每一個搖擺州的勝負情況會導致的結果,以此展示兩人將如何獲得最終勝利。到目前為止,時報的分析顯示,希拉里比特朗普多出了300多條路徑入主白宮 。
2.媒體表現
眾人皆知,特朗普是個狂熱的社交媒體愛好者,在推特上總是語出驚人。但很快有人發現,特朗普從安卓手機和iPhone端發的推文風格不一:安卓發出的推文多數語氣暴躁,言辭激烈,而iPhone推文更有禮節,語氣更加節制。於是便懷疑安卓和iPhone推特賬號分別為特朗普本人和其競選團隊所用。針對這個假設,美國最大在線程序員社區Stack Overflow的數據專家David Robinson開始動手挖掘特朗普的推特數據,採用的工具是神通廣大的R語言。
Robinson先比較了安卓和iPhone端的發推時間,推文中是否喜歡用引號“手動轉發”他人發的內容,推文是否配圖或附帶鏈接這三個方面的情況——從各個對比圖看,兩者的差別不只一點點。
最後,重頭戲在於對兩種推文的文本情感分析。David統計詞頻,分析用語,表示安卓推文的用詞普遍更加消極——難過、恐懼、憤怒、反感是其中反映出最多的幾種情緒,恰與特朗普一直以來給人的印象相符。反觀iPhone推文呈現出的規律,儘管語氣用詞頗有特朗普的風格,但在數據的“顯微鏡”下,差異一目了然。完整R代碼和詳盡的分析都在這裡。
3.數據驅動調查
在一片民調統計、結果預測的可視化汪洋大海中,Bailiwick走出了不尋常路——實際上,Bailiwick是一款調查工具,由紐約大學學者Meredith Broussard帶領團隊設計而成。它通過可視化今年美國各地角逐政府公職候選人的競選資金數據,幫助記者快速高效地從中找“貓膩”、挖故事。Bailiwick從聯邦選舉委員(Federal Election Commission)網站和Opensecret.org上抓取候選人開支數據,再根據美國政治研究中心(Center for Responsive Politics)的分類方法,按資金來源分成競選委員會、直接支持者、間接支持者和反對派團體四大類。
目前,該網站涵蓋4000多名聯邦候選人及17000多個政治委員會(Political Action Committee,美國政治組織,功能是籌集與分配競選經費給角逐供職的候選人)的競選資金數據。
追蹤調查某一候選人,只要通過選擇關注該候選人,連接你的Slack賬號,然後在Bailiwick網站設置更新提醒,每次該候選人接收新的一筆捐款或競選資金有任何變動,網站機器人就會直接把更新信息發到你的Slack上。
最後,推薦美國信息圖設計師在線社區Visualoop的“50個2016美國大選交互可視化”清單,從互動圖表到新聞遊戲,讓我們配合選舉開票的緊張時刻,欣賞一下美國同行各種腦洞大開的數據新聞與可視化作品。
編輯/Ivan Zhai