數據測算知多少?美國大選和累犯預測、難民調查算法一覽

Print More

無論是打車計價、節慶秒殺,還是大選預測、犯罪防控,算法都無處不在。算法是如何揭示問題本源的?它們精確的秘訣是什麼?它們會有怎樣的潛在問題?我們精選了全球深度報道網每周數據精選(Top ddj)中三個工具及報道涉及的算法,為你揭曉答案。

1. 誰將贏得2016美國大選?PollyVote穩定預測有妙招

2016年美國大選誰會勝出?是主張“建牆防墨西哥人偷渡”、堅決反對醫保法案的紐約地產大亨川普?還是強調移民改革、捍衛醫保法案前國務卿希拉里?是共和黨候選人還是民主黨候選人的選情更勝一籌?想求靠譜預測,不妨試試PollyVote

1

眾所周知,預測的計算一般是基於民意調查或預測市場、專家判斷等,由政治學者和預測專家於2004年開發的專業工具PollyVote.com則是綜合考察民意調查、預測,預估結果更穩定、出錯更少。其結果主要用於學術研究,沒有商業利益干擾。所有人都可使用API獲取每小時更新的數據(2016大選和往屆大選的數據),任意分享、嵌入網站。此外,該項目還供用戶免費瀏覽圖表、自動生成解釋文本,便於讀者理解數據。看下圖的自動文本,簡潔易懂,深感自動生成新聞的前途無量啊…

2

進入網站,可看到兩黨支持率變化的曲線圖(目前民主黨以52%領先於共和黨的48%),兩黨數據相對而列,便於看出差距和趨勢,可只查看最近30天的數據對比。

3

PollyVote在地圖上標註出了兩黨在各州的選情:以紅藍分別代表共和黨和民主黨,深淺表示支持程度,可以看出支持民主黨的選民大多分布於西海岸和東北部地區,而共和黨的選民則聚居於中南部。

4

該工具對以往三屆美國大選的預測誤差率均小於1%,表現不俗。要想持續關注預測結果,可以訂閱匯總自動解釋文本的新聞簡報。

5

表現如此穩健的預測工具用了什麼神奇的算法呢?答案是:綜合預測方法所得結果。計算分為兩步,一是求出同種成分分析法計算結果的平均值,二是求出不同成分分析法計算結果的平均值。其道理是均衡每種分析方法的影響,比較不同方法求得的預測結果。這一點不難理解:例如,現在僅有一種預測市場能預測全國支持率,卻有多個計量經濟的模型作了預測。如果我們僅計算它們的平均值、記入預測結果,就會多算了模型而少算了預測市場的影響,準確度就大打折扣。

點擊此處即可查看PollyVote的預測。

2. 罪犯預測軟件內含種族歧視?ProPublica揭開算法真面目

在美國,越來越多的法官和其他司法官員用算法預測罪犯成為累犯的可能性。COMPAS是美國最受青睞的算法工具之一,在庭審和判決前的使用率與日俱增。它到底靠不靠譜呢?ProPublica的分析發現,在其預測結果中,黑人罪犯被視為累犯的幾率更高。

他們是如何得出該結論的呢? ProPublica的團隊申請公開記錄,從州長辦公室獲得了佛羅里達州布勞沃德縣2013、2014年18610名被告罪犯在COMPAS上測得的分數,為每名罪犯建立了犯罪記錄表。為了查驗分數,他們將這兩年間COMPAS計算的累犯率(包含累犯率和嚴重累犯率)和實際作案率比較,排除了姓名、出生日期不符的情況。

6

黑人罪犯和白人罪犯預測的累犯率對比

結果發現,COMPAS的準確率達61%,但“嚴重累犯率”準確率僅為20%,且黑人罪犯的“嚴重累犯率”是白人罪犯的兩倍。即使控制過往犯罪、未來累犯率、年齡、性別指標的影響,黑人累犯率比白人仍高出77%。

由此,他們做出了報道“機器背後的歧視”(Machine Bias),通過誤判的罪犯案例透視算法為何產生歧視效應。

點擊查看完整的數據分析報道原文

3. 難民緣何頻遭暴力?《時代周報》解剖官方弊病

不少人認為難民潮會帶來混亂,但忽略了難民遭受的暴力事件猛增、司法部門懲辦不力的事實。德國《時代周報》的記者從阿馬迪烏·安東尼奧基金會、德國聯邦刑事警察局、德國聯邦政府等權威機構獲取數據,分析了747起構成犯罪的難民居所襲擊事件,意在檢視難民營所遭暴力的全貌。他們由一系列問題指引,細化特點、追蹤原因:暴力事件的類型有何不同?襲擊是否造成傷亡?案件是否指認了犯罪嫌疑人?他們是否受到起訴?定罪情況如何?

研究表明,2015年1月至11月間,德國共發生了222起難民營襲擊案件,多達169起案件仍未確認罪犯,已確認的案件僅有41起。但起訴的僅8起,定罪的僅4起,佔全部案件的5%,其他案件中的罪犯均逍遙法外。

7

在所有案件中,縱火案發生率高、破壞力強。2015年1月至11月間,縱火案數量猛增——從1月至6月的5起以下,增至8、9月的16起,甚至在10月躥升至20起。近半數縱火案針對的是有人居住的房屋,無人居住的房屋遭遇縱火案的次數也驟增。

8

縱火案類型不同,得到解決的程度也不同。多達76%的縱火襲擊案未得到解決,而這一比例在預謀縱火案和加重縱火案中則分別降為64.3%和47.5%。在萊比錫、漢諾威等城市所在的薩克森自由州,同期就發生了64起縱火案,平均每10萬居民就遭遇1.58起縱火案。

9

為何這些案件的處理如此不力?記者發現,部分原因在於案件本身偵破大,多數案件發生在夜間,肇事者逃離迅速,常用燃燒瓶、拋射彈等遠距離投射。而且,這些難民營遠離市區,目擊證人少。如果被襲房屋無人居住,鮮有人問責,調查也就懸而未決了。

更關鍵的原因是,德國很多地區缺乏警力和犯罪專家。特別是在東德地區,近來警察的數量持續下降,同時暴力事件發生率也日漸上升。下圖顯示的是,德國各州受聯邦預算支持的警察機構中全職警察的比例,巴伐利亞州、北萊茵-威斯特法倫州和巴登-符騰堡州等德國南部、西部地區的警力充足,而在薩克森-安哈爾特州、梅克倫堡-前波美拉尼亞州和勃蘭登堡州等德國東北部地區則情況堪憂。

10如果想詳查每個案件的情況,查看他們的可視化地圖便知,按照犯罪類型、調查現狀查看,或者點擊“播放”按鈕自動查閱案件。

11

點擊查看報道數據詳情。

Print Friendly, PDF & Email

發表回復

您的電子郵箱地址不會被公開。 必填項已用 * 標註