註:本文原發自澎湃新聞·湃客頻道,全球深度報道網經湃客唯一官方公眾號“湃客工坊”(ID:thesparker)授權轉載
2020年,一場新冠肺炎的暴發搶過了庚子春節的主調,身處其中,我們親自為這場抗疫寫下註腳。疫情實時地圖、擴散路徑還原、感染人數建模、問卷信息收集……有數編輯部整理了一批優質數據項目,來看數據的100種表達方式,重溫數據創作者們在這次疫情中貢獻的力量。
本文分兩大部分,一是從病例數據、人口流動、知識科普、應對措施、疫情影響五大角度出發的作品彙總,二是觀察了上百個疫情數據作品後我們的一些思考。
有關病例數據的一切
實時地圖
澎湃新聞·美數課:新型冠狀病毒肺炎病例實時更新地圖
丁香園:新冠病毒最新實時疫情地圖
北京大學可視化與可視分析實驗室:疫情晴雨表等系列交互地圖
眼看着疫情從最初的一張靜態長圖到各家媒體標配的動態地圖,並隨疫情發展不斷完善。如丁香園除地圖外,後期還開闢了闢謠與防護、疾病知識、最新信息實時播報欄口,便於讀者一站式查詢,澎湃新聞·美數課則在國內確診數據放緩時及時上線「治癒地圖」,國外疫情加重時,呈現細分的國際疫情數據。地圖成為人們了解疫情動態的第一窗口。
但保證地圖數據真實、準確、及時,並非易事。各家實時地圖也會出現數據不一致的情況,同樣來自官方數據,為何差異巨大?鏑數團隊對此做了分析。鏑數:新冠肺炎病毒肆虐,疫情數據如何辨真偽?
時空追蹤
一個貫穿整個疫情期間的數據操作。從最初幾百例到7萬多例,從國內到國外,從群像到細分的死亡病例、無癥狀感染人群、確診兒童,從輸入性到家庭聚集性病例……觀察每一個或大或小的切口,都讓我們對病毒的了解增加一分。
照路明:新型冠狀病毒肺炎病例群像:何時發病,多大年齡,在哪分布?
上觀數據:新型冠狀病毒肺炎值得注意的細節:我們整理了277個病例和41個死亡案例
澎湃新聞·美數課:763例確診患者的故事,還原新冠病毒向全國擴散的路徑
財新·數字說:新冠逝者:數字後不可遺忘的人
對上述內容分析的詳盡程度,取決於政府信息公開程度。對此,一些機構做了有趣的記錄:
南都大數據研究院:30省份170份疫情通報誰最高冷?這些地方病例越多信息量越粗、新冠肺炎疫情信息公開60天全記錄
後期備受關注的國外疫情:
21數據新聞實驗室:下船!31天3711人感染新冠肺炎542例 一圖復盤“鑽石公主號”非常之旅
上觀數據:確診病例超過2000!為何海外疫情的爆發點是韓國,而不是日本與新加坡
澎湃新聞·美數課:2個月,13753例,新冠肺炎如何蔓延全球?
數據冰山:美國疫情分析:檢測數據背後的政治“學問”
嚴肅的人口學八卦:意大利的病死率為什麼這麼高——來自人口學視角的分析
數字背後,是一個個鮮活的生命。他們的每一次發聲,都值得被記錄。比如,他們曾經在社交媒體上發出的「求助」。RUC新聞坊:1183位求助者的數據畫像:不是弱者,而是你我。
疫情預測
病毒什麼時候爆發,最終會感染多少人,疫情拐點何時來臨,我們什麼時候能摘口罩。一切或好或壞的預測,乃至決策,都建立在病例數據的基礎上。如前DHS生物監管總監接受大數據文摘採訪時所言:疫情中數據的作用無法忽視,但也不能盲信模型。
集智俱樂部:防控力度多大才能遏制疫情發展?網絡動力學推演給你答案
chenqin:2月3日全國確診新型肺炎20438例,死亡425例,目前防治情況如何?
大數據文摘:疫情中數據的作用無法忽視,但也不能盲信模型 | 專訪前DHS生物監管總監
過程中,我們經歷了由於統計口徑更改帶來的數據大幅變化。2月13日,湖北新增14840例新冠肺炎確診病例,隨後,接連兩天下降,2月15日早上,這個數字又降到了2420。DT財經:湖北數據大幅波動意味着什麼?
人口流動數據哪裡找
離開武漢的人去哪了?
23日,武漢宣布封城。26日,武漢市長周先旺表示,「目前有500多萬人離開武漢,還有900萬人留在城裡」。有多少人離開武漢?我在的城市安全嗎?是春節時人們最關心的話題。畢竟,碰上九省通衢的武漢和春節這個特殊節點,沒有誰能置身其外。
來自地理角度的分析:
地球知識局:我們研究了一下如何避開武漢,幾乎不可能
基於百度慧眼的人口遷徙數據分析:
新一線城市研究所:這13天,離開武漢的人都去了哪裡?
DT財經:離開武漢的那500萬人到底去了哪裡?
大連民族大學許小可團隊:學術視角告訴你:500萬武漢人是“逃離”還是“正常離開”
關注武漢之外
人口遷徙導致了病毒向全國擴散的必然性,但當武漢成為全部焦點時,「燈下黑」的問題在前期被忽視了。
社會網絡與數據挖掘:當目光聚焦武漢時,湖北其他城市也在“求助”
數據冰山:東莞商丘周口,戴口罩要加油
上觀數據:為什麼溫州會成為湖北外,新冠肺炎確症病例數最多的城市
國際人口流動
時間來到3月,中國大部分地區新增確診開始收窄,疫情得到控制。此時國外疫情日趨嚴重,外防輸入成為二次防控的重中之重。了解國際間人口流動情況,航班數據是可供參考的指標。
南都大數據研究院:88例境外輸入病例中,來自伊朗、意大利佔比超85%
Alfred數據室:各城市一日內入境究竟有多少人?
復學復工
一延再延的假期過後,生活總要繼續,復學復工迫在眉睫。面對依然嚴峻的疫情,大城市做好應對了嗎?返程復工進度如何?百度慧眼遷徙地圖數據再次派上用場。機場、高鐵站、普鐵站、汽車站等交通樞紐人流量、遷入遷出人口指數、城市內部出行強度是常見的數據指標。
城市數據團:你的城市復工了嗎?
新一線城市研究所:復盤節後返城數據,你的城市屬於“嚴控型”嗎?
嚴肅的人口學八卦:全國返城復工進度如何?
新一線城市研究所:你還在居家辦公嗎?這些城市三成上班族已經回到了公司 | 城市生活復原追蹤
作業幫APP一周下載量突破46萬次,釘釘收穫超82萬條1星差評,喧囂輿情背後,學生、老師、家長們的真實看法是什麼?在線教育果真逆勢翻盤了?
澎湃新聞·美數課:數說|“停課不停學”,目前大規模線上教學反響如何?
財新·數字說:數字說|“停課不停學”帶火各路在線教育 哪些App受關注?
知識科普,最好的時代
傳染病
新冠肺炎和 SARS 到底是什麼關係?哪類口罩防護最有效?相比其它傳染病,新冠肺炎的嚴重性如何?歷史上人類和傳染病經歷了怎樣的糾纏史……突然間,科普遇上了它最好的時代。
回形針PaperClip:關於新冠肺炎的一切
嚴肅的人口學八卦:為什麼新冠肺炎武漢病死率高於全國?
澎湃新聞·美數課:圖釋兩千年傳染病史:若瘟疫無法被根除,該如何與之相處?
搜狐四象工作室《病菌與人類》專題則以圖繪形式做了系列科普,包括免疫系統如何工作、冠狀病毒的分類、傳染病潛伏期等等。
野生動物
如今我們經歷的一切,都要從一隻蝙蝠說起?未來,我們又該如何與野生動物相處。
搜狐四象工作室:753種動物誰最“毒”?附“病毒王”分布圖
山水自然保護中心:野生動物非法貿易為何如此亂象百出?
藥物治療
截至2月7日所有的臨床試驗,已有50項與新冠肺炎有關的臨床試驗已登記在案,其中既有洛匹那韋/利托那韋(克力芝)等西藥,也有雙黃連口服液,還包括太極拳。至於新冠肺炎為何遲遲沒有特效藥,需知新葯研發本就有一套複雜的流程,遑論面對的是新型病毒。
上觀數據:50項與新冠肺炎有關的臨床試驗登記在案,裡邊會有“特效藥”嗎?
DT財經:成功率僅0.02%,新冠治療藥物距離上市還有多遠?
澎湃新聞·美數課:漲知識|新冠疫苗開始臨床試驗,為何我們至少還要等待一年?
疫情當前,如何應對?
關鍵節點
事後回顧關鍵性事件的時間節點,總能發現一些端倪。而與人們情緒密切相關的微博熱搜,也部分見證了疫情發展的高低起伏。
第一財經周刊:特別報道——假如武漢的警鈴有機會被拉響,可以是哪天?
大數據文摘:兩個月熱搜分析:疫情之下,哪些時、地、人、物處在風口浪尖
救助力量
澎湃新聞·美數課:盤點|各地馳援湖北的52支醫療隊被派到了哪些醫院?
DT財經:3萬醫護逆行背後,是誰在前方馳援湖北?
複數實驗室:數讀武漢醫護感染 | 我們該如何更好地保護白衣天使?
畢導:科學家光寫論文不抗疫情?我幫大家解讀一下68篇新冠病毒論文
抗疫現場
澎湃新聞·美數課:如何運作一座容納1461張病床的方艙醫院?
RUC新聞坊:那些被吐槽的國家,為抗疫“默默”做了哪些努力?|視野
疫情之下,什麼改變了?
對普通人
身處暴風眼的湖北人民,封城對他們來說意味着什麼;遠離風暴中心,被困在家的你我如何度過這段特殊時期;生活又發生了哪些突如其來的變化。
回形針PaperClip:為什麼你還買不到口罩
大數據文摘:疫情期間全民上網圖鑑:封城後,武漢內外的人們在線上做什麼?
時代數據:多國限制入境,數十萬中國留學生學途難歸
從沒哪個時刻如當下,接收鋪天蓋地的信息,有真知,就有謠言。
複數實驗室:看了946條闢謠信息,我們提煉出一些信息辨別方法
航旅圈:數據 | 韓國人都飛去哪裡了,韓國飛中國的都是什麼人
Ele實驗室:計算機仿真程序告訴你為什麼現在還沒到出門的時候
對行業/經濟/社會
2003年的非典,給了我們警醒和經驗,但新冠 ≠ 非典,且看時間會將我們帶去哪?
DT財經:各行業扛疫能力大調查
時代數據:資本市場過山車應理性看待
澤平宏觀:疫情對中國經濟的影響分析與政策建議
帝都繪:災禍如何塑造城市?
趨勢觀察
數據,在疫情發展的每一個重要節點都留下了足跡,或答疑解惑,或記錄現場,或探尋真相。觀察了近200個數據作品後,在此將我們的觀察分享給大家。
發揮優勢,人人可以數據創作。我們曾在2019數據創作者大會上指出:數據創作者的身份日趨多元化,記者、設計師、程序員,還有“八卦”的人口學家、有趣的城市規劃師、嚴謹的經濟學家正參與其中……他們做事實核查,關注小眾領域,發揮專業優勢,不斷拓寬着數據新聞的版圖。
在這次疫情中,有民間自然保護機構-山水自然保護中心集結志願者力量,分析野生動物非法貿易亂象,在#韓國人來青島躲避疫情#的消息在網絡上瘋傳時,關注航空領域的航旅圈第一時間以數據呈現事實,從不缺席的程序員Ele實驗室模擬程序告誡大家不要出門,微博用戶@江南劍心2組織網友自發繪製城市內部傳播圖,還有專註人口、城市、輿情、地理等創作者基於自身在專業領域的積累,不約而同展開數據敘事。

圖源:@江南劍心2
數據共享,開源力量在行動。和蔓延的疫情相伴而生的,還有各類開源力量。確診患者相同行程查詢 、新冠肺炎小區查詢等項目被廣泛傳播及使用,「本站數據接口和頁面接受轉發、嵌入、調用、下載」的說明又促進了項目的二次使用。又如澎湃新聞·美數課在疫情期間共享實時地圖數據庫及疫情明細數據,方便各界研究和報道。北京大學的疫情可視化工具也無償開放給社會使用。
數據時代,多一些開源分享,或許就有多一些各學科、領域、人才間的碰撞創新。尤其期待未來看到更多機器學習、圖像識別等計算機技術在新聞領域的使用。
共創時代,數據可以從哪裡來?除了公開的政府數據、開源數據,商業力量也是數據生態中重要的一環。在這次疫情中,百度人口遷徙數據在分析人口流動路徑時起到很大作用。外賣數據、電商銷售量、APP下載數等商業數據,也間接展現了消費者在疫情之下生活狀態的變化。此外,你的每一次在線操作,都在互聯網上留下了足跡,社交媒體的數據當然不能錯過。在這些作品中,我們還發現了不少來自問卷數據的新探索。當面向人群達到一定數量,保證樣本科學的條件下,問卷調研可以彌補當疫情這類突發情況出現時,新數據的缺失。
可視化,為有精度地觀察疫情而設計。在本次疫情傳播中,首次與圖表大家族會面。我們發現,疫情稿件中的可視化涵蓋了95%以上的圖表類型。除了常規條形圖、折線圖、氣泡圖等基本圖形,網絡關係圖、日曆圖、南丁格爾玫瑰圖等小眾圖表也被大眾所熟知。更重要的是,好看之外,可視化高效準確地信息傳達功能得到重視,如向帆融合數字技術與藝術設計,以時間和空間為重點探尋疫情表達方式,還有指數坐標等高階玩法被應用,作者和讀者間出現了更多專業性的討論。
冷冷的數字背後,亦不缺人文關懷。相比文本、影像,數據似乎總給人冷冰冰的感覺,這也賦予了其理性、客觀的特質。但當視角定格在《圖釋兩千年傳染病史:若瘟疫無法被根除,該如何與之相處?》一文時,人類與幾千年的傳染病糾纏史娓娓道來,不由讓人感慨人類的渺小。我們用一片片花瓣表徵一個個逝去的生命,為的是不忘卻這場災難中的每一個普通個體。數據說話,不僅是擺事實、講道理,最終是為了講述一個值得記錄的「故事」。
抗「疫」尚未結束,數據的記錄也在繼續。