實用貼|數據圖析二胎:案例工具推薦

Print More

自從十八屆五中全會公報允許普遍二孩政策以來,各界輿論紛紛,而計劃生育和二胎政策的影響分別是什麼?放眼世界,中國的生育率水平幾何?深度君精選全球生育率及其影響的數據圖和可視化案例,推薦可視化簡易做法、工具、代碼,看看介紹動手學起來吧。


1. 普利策中心:全球生育地圖

放眼世界,中國生育率水平幾何?普利策危機報道中心Pulitzer Center on Crisis Reporting)採用聯合國、世界銀行和權威期刊PLOS Medicine的數據繪製了一張全球各國生育數據可視化圖表,告訴你答案。

全球生育率圖-普利策

普利策中心:全球生育率地圖

普利策-圖2

普利策中心:全球不育率地圖

調查發現,全球總體的生育率在穩步下降,但是撒哈拉沙漠以南的非洲卻居高不下。在該地區人口最多的國家尼日利亞,平均每位婦女在一生中生育六個孩子。他們也整合了不孕不育的數據,發現全球一百多萬異性戀夫婦會不育。不育的男女雙方都有可能遭受遺傳病、傳染和非傳染疾病的侵襲,而且服用某些治療藥物還會增加患病風險。中美洲地區甚至出現了“不育帶”,性傳播疾病和不安全流產導致的傳染等問題頻出。

作品以地圖形式呈現數據。鼠標移到哪個國家,就會顯示該國的總體生育率、原發不孕和繼發不孕的比率,以及避孕工具使用的比例、每千名兒童的死亡率和人均GDP數據,可以一窺當地生活水平、避孕情況和生育率之間的關係。作品根據生育率或不育率的高低來標註國家地區的顏色深淺:撒哈拉以南的非洲幾國(尼日爾、乍得、尼日利亞、馬里等)以及中東的阿富汗是生育率最高的地區,而位於位於東歐的烏克蘭、白俄羅斯、拉脫維亞,中東的也門和非洲的摩洛哥、喀麥隆和中非共和國則是不育率較高的國家。中國平均每個家庭有1.63個孩子,和經濟水平較高的歐洲各國、以及加拿大、澳大利亞和巴西等地區位於同一水平。原發不孕率低於俄羅斯、美國、加拿大和印度等國,處於世界較低水平。(未獲取繼發不孕率數據)

如果想了解:非洲為何在生育率很高的同時,不孕情況也很普遍?非洲政府、慈善團體和醫療衛生工作者如何幫助夫婦控制生育呢?可以參考PRI(國際公共廣播)的專題報道“家庭的選擇”


2. 《衛報》:計劃生育影響幾何?

計劃生育35年來對中國產生了什麼影響?《衛報》製作了四張圖來看人口增長、工作適齡人口、老齡人口撫養比和性別比例受到的影響。

1) 人口增長放緩
聯合國數據顯示,中國人口增長(粗生育率減粗死亡率)已經從1980年的每千人新增15人降為每千人新增5.5人。衛報-圖1

2) 工作適齡人口縮減
近年來,15到64歲的工作適齡人口持續縮減。根據中國政府的統計,15歲到59歲之間的人口減少尤其明顯。從2013年到2014年,該數字縮水370萬,總數為9.158億,此趨勢預計還會持續。衛報-圖2

3)老齡人口撫養比上升
伴隨着適齡工作人口的縮減和老齡人口的增長,受供養人口的比例不斷下降,老齡人口的撫養比則逐年上升。
衛報-圖3

衛報-圖32

4) 性別比例更為失衡
聯合國的數據表明,目前中國的性別比為106名男性比100名女性,高於世界平均水平,也幾乎高於其他單個國家。衛報-圖4

而新生兒的性別比例更為不平衡:男比女為120比100,已成為世界最高值。根據野村全球經濟的分析:如果該趨勢持續,未來中國1/5的適婚男青年將無法迎娶本國新娘。


3. 《華盛頓郵報》:為何要放開二胎?

中國為啥需要全面放開二胎?《華盛頓郵報》用一張圖形象地解析了原因。根據Max Roser在Our World in Data上的統計,中國總人口從建國後到2010年期間不斷上漲。20世紀50年代,中國的生育率一直走高。在三年自然災害出現短暫下降後,在60年代到70年代每千人的生育率遠超死亡率。

一圖生育率-WP

中國早在60年代初期就提倡晚婚,政府在1971年開始倡導計劃生育,於1982年將計劃生育定為基本國策,此後中國的生育率明顯降低。目前,生育率和死亡率之間的差距縮小,上世紀生育高峰出生的人口逐漸成為老齡人群,而能夠供養他們的年輕工作人口越來越少,可見放開二胎的緊迫性。


4. 美國人口諮詢局:二胎政策之後有啥變化?

對於二胎政策的影響,美國人口諮詢局(Population Reference Bureau)就做了大膽的預測

1) 中國總人口的變化

他們分別繪製出了計劃生育政策繼續實施、2016年女性均生育二胎、2050年女性基本上能生育二胎三種情況下總人口的預計變化趨勢。第一種情況中,中國總人口會在2030年達到14.2億的高峰,隨即下降。第二種情況,人口高峰會延遲五年,大概為14.6億。2050年接近二胎的預期則較為現實,在此情況下,中國2030年會出現14.3億的人口高峰。第三種預期和目前計劃生育政策的預期之間相差2300萬的人口,僅比目前水平高了兩個百分點。

PRI-1

2) 年齡段人口比例

第二張圖展示的是2015年和2050年普遍生育二胎後年齡段人口數的對比。即使新生人口會增長,但是未來35年間,中國人口的年齡結構將發生巨大的變化:65歲及其以上的退休人口將會翻倍,15歲以下的兒童人口則會下降。在2050年,適齡工作人口將少於非適齡工作人口。PRB-2


5. 實用入門:如何製作生育主題的可視化作品?

如何製作一款效果多樣又清晰明了的可視化數據圖呢?德克薩斯基督教大學的助理教授Kyle Walker分享了自己製作歐洲生育率可視化作品的技巧、資源和代碼,步驟清晰且即拿即用:

Walker首先推薦的就是世界銀行的公開數據目錄,為數據新聞人提供海量可讀的數據、圖表和API,可以通過Python,R,Ruby和Stata的數據語言讀取。文章推薦了WDI擴展包——可方便用戶用R語言快速讀取世界銀行數據組,和rCharts擴展包——可用於製作動態十足的D3可視化效果。

他的目標是做成一個以交互式探索不同地區生育率如何以不同方式逐年下降的作品,和學生們討論觀察生育率逐年變化的必要性。一開始,他以R語言和WDI擴展包調用了世界銀行的API,獲取了1960年以來歐洲國家完整的逐年生育率數據。他所使用的代碼如下:

數據圖-代碼一

同時,為了將數據可視化,他選擇了NVD3數據庫——一個D3製圖數據庫,適合R語言用戶用rCharts讀取。以下則是清理數據、同時用rCharts製作交互式圖表的代碼:數據圖-代碼二

生育率圖1

呈現全部國家數據的效果

之後他在控制台鍵入tfrPLot,一張基本的國家生育率圖就顯露眼前:

這張圖大致能體現數據,但是信息雜亂,可讀性不強。此時NVD3和rCharts就成了數據圖可視化的關鍵:你可以點擊圖例圓點來顯示或隱蔽數據線。如果你雙擊國家名稱,圖表將只顯示該國家的數據線。也就是說這張圖就像一個互動式應用一樣,用戶可以隨心所欲地控制它的呈現方式。

點選幾個國家的效果

點選幾個國家的效果

而且,rCharts還能包含好幾種選擇,指定你想呈現的圖表類型。具體做法,請參考:Visualizing fertility trends in Europe,看看作者是怎麼做的吧。

簡而言之,為了製作生育率的圖表,請參考以下步驟:

1.先安裝R語言擴展包: WDI, plyr, and rCharts. CRAN還未包含rCharts,所以你需要從GitHub上下載devtools包來安裝rCharts。你也可以直接輸入命令:devtools::install_github(‘rCharts’, ‘ramnathv’, ref=’dev’).
2.運行以下命令:
source(“https://raw.github.com/walkerke/teaching-with-datavis/master/tfr-in-europe.R”)
3.在R的控制台鍵入tfrPlot製作圖表即可。小提示:在RStudio的閱覽窗口不太容易顯示NVD3的圖表,所以最好另外打開瀏覽器查看。

深度君還推薦一種顯示世界各個國家和地區生育率逐年變化的動態圖,也是參考世界銀行數據製成,圖表和做法詳情請參考:World Bank data visualization: lower fertility, longer lives還可以點擊Google Public Data Explorer獲取數據哦。

生育圖的案例和做法到手了,不妨試試自己上手製作、創新可視化效果吧。

Print Friendly, PDF & Email

發表回復

您的電子郵箱地址不會被公開。 必填項已用 * 標註