作為一種新型報道方式,數據新聞正在越來越多地進入公眾視野。雖然對數據新聞的定義五花八門,但教育界和媒體行業有一個共識,數據新聞至少要有三個要素:新聞、數據、可視化。
首先,數據新聞必須是新聞,具備新聞價值,是新近發生的事實,或者新發現的事實,或重要,或有趣,或解釋現象,或揭露秘密;其次,數據新聞必須有數據支撐,通過分析數據進而發現問題並挖掘出新聞故事;另外,數據新聞通常使用可視化手段,呈現文字難以描述的內容,或者文字描述難以讓讀者更好地理解內容。可視化既可以很簡單,比如在文字中羅列數據,或是做一個簡單的數據圖表,也可以很複雜,比如信息圖、互動頁面、動畫視頻等。
相比於一般新聞報道,數據新聞的選題多了一個要求:必須要有數據。那麼是先有選題還是先有數據?這個問題就像雞和蛋的關係一樣,沒有令人滿意的答案。在選題操作中,既可以是選題先行,再去尋找數據,也可以是先找數據,進而從數據分析中找到新聞,無論哪一種情況,都要運用數據對所發現的問題或現象進行探究或解釋,最後以恰當的方式呈現給讀者。
作者過去兩年從事與數據新聞相關的教學工作,指導學生創作了超過五十篇數據新聞作品,這些作品選題各異,涉及時政、教育、人口、經濟、民生、文化、新聞出版、環保、科技、娛樂、體育等多個領域。這些作品的選題都是如何確定的?尋找選題又有哪些方法呢?
一、關心時事,從新聞中尋找選題
很多數據新聞選題都來自新聞報道。平時閱讀新聞時留意有可能做成數據新聞的選題,並把它記錄一下,積少成多,就會形成一個選題庫。
例如《134億學前教育發展基金,你的家鄉能分到多少?》的選題,就來自2018年11月20日的一條新聞,有媒體援引財政部網站公開信息,財政部將提前下達2019年學前教育發展基金,總計134億元。學前教育發展基金是否每年都有?2019年的預算相較以往是增加了還是減少了?這筆預算的分配有什麼規律?通過初步的信息梳理髮現,與2017和2018年相比,2019年的學前教育發展基金減少了10%。數據分析還發現,學前教育發展基金每個省區直轄市都獲分配,人口多,城市化率低,農村人口數龐大的省區,被分配的發展資金相對多,從一個側面反映中央財政對欠發達地區的支持。

《134億學前教育發展基金,你的家鄉能分到多少?》作品節選
《端上談判桌的為什麼是大豆?不是小麥玉米!》,這篇作品的選題受中美貿易戰相關報道所啟發,中國反制美國貿易戰的“武器”主要是農產品,而農產品中,大豆被經常提及。為什麼是大豆?而不是其他農作物?大豆都有哪些用途?為什麼中國的大豆不能自給自足?除了美國,中國還從哪些國家進口大豆?近年來,進口大豆的數據有什麼變化?對這個選題所涉及的專業領域學生並不熟悉,需要大量閱讀文獻,查找海關進出口數據,世界穀物協會數據,並採訪農科院的技術人員。作品通過多個緯度的數據,解釋為什麼中國要進口大豆;通過梳理中國大豆生產歷史,解釋為什麼中國從大豆出口國變為進口國;作品還發現一個問題,中國十多年前就提出“大豆振興計劃”口號,但大豆非但沒有振興,反而對進口依賴越來越大。
《一年437萬對夫妻離異,有一個原因不容忽視!》這個選題也是來自新聞報道。2018年8月,民政部公布《2017年社會服務發展統計公報》,其中提到2017年中國離婚人數437.4萬對,不少媒體對此做出報道,但都大同小異,通過簡單數據可視化的呈現,告訴讀者離婚率高的事實,但沒有告訴讀者,中國的離婚率在世界所處的位置,是高,是低,還是處於平均水平?這麼多人離婚,背後的原因是什麼?學生們去南京市棲霞區婚姻登記處採訪,發現辦理離婚手續跟“買菜”一樣,手續非常簡單,15分鐘就可以辦完。採訪還發現有人為買房而假離婚。通過查找資料和數據,發現新中國成立以來,中國人離婚從不自由到自由,進步的同時,由於離婚手續過於簡單,也令婚姻變得不那麼神聖。數據分析發現,離婚率與房地產政策變化有關係,房地產限購的年份,離婚率會升高。通過對比國外離婚政策和數據,發現一些國家和地區,離婚手續繁瑣,離婚成本高,而中國的離婚率已經超過某些發達國家和地區。
二、保持好奇心,在熟悉的領域尋找問題
學生身處高校,最熟悉的領域是教育,只要保持好奇心,就會在學習、實習、考研、求職中發現很多值得探究的問題,其中一些問題就可以變成數據新聞的選題。
每年都有很多大學畢業生選擇考研,重點大學的報名人數尤其火爆,為了讓考生清楚知道自己有多大機會能考取理想高校的研究生,我們決定做一個考研選題《新聞傳播考研,哪家學校最難考?》。由於高校數量眾多,院系情況各異,我們將分析範圍縮窄至42所“雙一流”高校。通過查找這些學校新聞傳播研究生(包括全日制學碩、全日制專碩、非全日制專碩)報名人數、錄取人數(包括考試錄取和保研錄取),分析哪些學校研究生招生規模大容易考,哪些學校接受保研比例高難考,哪些學校側重於學術型碩士培養,哪些學校招收的專碩數量最多,從研究生推免率、報錄比、就業率等多個維度進行分析,教會考生如何分析數據,做出有利於自己的選擇。

《新聞傳播考研,哪家學校最難考?》作品節選
社會上不少機構熱衷搞大學排名,這些大學排名是怎麼計算出來的?學生們對此很好奇。在英國 QS 世界大學排名網站上,學生們發現,QS 雖然公布了排名計算公式,但根據其公布的數據和公式,並不能計算出其公布的結果,而且,有些排名沒有統計單項數據,卻得出了綜合排名,根據所獲取到的 QS 網絡調查問捲髮現,所謂高校學術聲譽,就是讓被調查者提供國內外各10所大學名稱而已。於是學生寫了《我們調查了 QS 世界大學排名,發現了三個問題!》,揭開QS大學排名的神秘面紗,告訴人們,所謂的世界大學排名,原來評選過程並不嚴謹。
在高校網站上,可以查到很多公開數據。教育部2014年公布《高等學校信息公開事項清單》,要求高校公開包括基本信息、招生考試信息、財務、資產及收費信息、教學質量信息等十大類信息。學生們對其中的財務信息公開產生的興趣,各個高校信息公開做得怎麼樣?“雙一流”大學的錢都從哪裡來?都花在什麼地方?哪些大學錢多?哪些學校預算做得精準?學生們通過查閱42所大學的預決算報告,完成了《“雙一流”高校財務公開:哪家經費最多?哪家預算最精準?》這一作品。
教育類選題,是學生們做的最多的選題,一是接近性,學生們身處校園,對教育方面存在的問題和現象比較敏感,容易找到選題;二是教育部門和高校,在信息公開方面做得比較好,數據容易獲取。三是採訪對象容易接近,選題容易操作。
三、多看數據新聞案例、舉一反三
多看數據新聞優秀案例,學習別人的方法,舉一反三,對找選題就會有啟發。澎湃湃客平台“有數”欄目,截至2019年8月共有91支數據新聞和信息可視化團隊入駐,“有數”每天發表大量作品,多看作品,就會逐漸培養數據新聞的選題策劃能力。除了澎湃“有數”,新華社、新京報、界面、每日經濟、China Daily、網易等媒體,都設有數據新聞欄目,初學者可以先從看作品學起。
網易數讀曾經做過一個分析樓盤名稱的數據新聞《我們分析了54069個樓盤後,發現了中國樓盤取名的套路》,受該作品啟發,學生們從恆大、碧桂園、萬科三大地產商官網上抓取了2000多條樓盤名稱信息,分析發現三大地產商給樓盤取名的套路,比如愛用與大自然相關的詞彙,出現最多的詞語包括“天”“山”“江”“灣”“湖”“海”“花”“洲”“島”等,愛用“府”“城”“都”“公園”“庭”“台”“里”“郡”等詞彙,動物最鐘意“龍”和“鳳”,喜歡皇家氣派,愛用“御”“金”“璽”“龍”等詞,另外還要有珠光寶氣,最喜歡用 “翡翠”。

《我們分析了54069個樓盤後,發現了中國樓盤取名的套路》作品節選
與分析樓盤名稱的方法一樣,我們從百度地圖抓取了南京市的2000多條街道名稱,通過詞頻分析和內容分析,發現南京街道名稱的特點:門特別多,名山大川遍布、有着繽紛的顏色,像是一個動物世界,承載着中國歷史,《南京這座古董鋪子,在2000多條道路里都藏了哪些秘密?》由荔枝新聞首發,作品形式新穎,內容有趣,引發許多互動。
四、從政府信息公開網站中找選題
隨着政府部門和教育部門信息公開工作的推進,政府部門網站和高校網站都有很多公開信息,有的是結構性數據,有的是非結構性數據,如果有一定的新聞敏感性,就可以從這些公開信息中,尋找到有新聞價值的元素,進而形成新聞選題。
江蘇人力資源和社會保障網公布了一份“三支一服”招募計劃名單,有詳細的學生姓名、性別、畢業學校、學歷等信息。很多學生對“三支一服”並不了解。什麼是“三支一服”?每年有多少“三支一服”名額?什麼學生選擇參加“三支一服”?參加“三支一服”有什麼好處?“三支一服”是新一輪“上山下鄉”運動嗎?……帶着這些問題,學生們去尋找答案,除了查找資料和數據,理清大學生村官、西部計劃、“三支一扶”三者之間的關係,還要採訪參加 “三支一服” 的大學生,在冰冷的數據之外,增加有溫度的人物故事,最終形成了《數據告訴你,哪些大學生選擇下基層?》。

《數據告訴你,哪些大學生選擇下基層?》作品節選
南京民政局官網每個月都會公布民政統計月報表,裡邊有很多數據,學生從中發現,南京市每年火化遺體數約5萬具,遺體火化後如何處理?墓地夠用嗎?不夠用怎麼辦?帶着這些問題,學生們開始了解南京的殯葬改革,查找數據,併到公墓去採訪,最後完成了《你聽說過“3D生態雲葬”嗎?》這篇介紹生態葬的作品,用數據普及了生態葬的知識,內容很有趣。
人口題材是數據新聞常見的選題,人口信息可以從政府統計年報中查到。學生們查找了改革開放40年來江蘇省人口的變化,創作了《40年中國人口發生了哪兩個顯著變化,一個江蘇省就能體現》,從數據可以清楚地看出,40年中國人口流動的趨勢,就是從農村到城市,從欠發達地區,向發達地區流動,一個省如此,全國亦如此。學生們也關注了香港的人口變化,通過《8組數據告訴你香港人口老齡化有多嚴重?》,用官方統計數據分析香港人口老齡化的原因,即晚婚、晚育、少子、長壽。
2019年,南京市公安局公布了一份“積分落戶”人員名單,名單上有新落戶的人名、身份證部分字段、落戶區域等。通過數據處理,可以清楚地發現,申請南京“積分落戶”的4000多人中,一半來自本省,一半來自外省,而外省又以鄰近的安徽省為主,居住年限和房產情況是“積分落戶”的最大“敲城磚”。用同樣的方法分析北京、上海、深圳等外來人口較多的城市,情況可能又不一樣。
政府信息公開,是數據新聞的“富礦”,沒事兒去逛逛政府網站,就可能有意外的收穫。
五、從行業報告、企業財報中尋找線索
不少行業協會、調查諮詢機構、中介組織都會定期或不定期發布行業報告,閱讀行業報告和企業年報,可以從中挖掘到數據新聞的選題。
中國演出行業協會每年都會發布《中國演出市場年度報告》,裡邊有很多演出數據,每一組數據,都可以衍生為一個數據新聞選題,對話劇感興趣的同學創作了《話劇:小眾的狂歡,還是大眾的繁榮?》,通過話劇的票房、票價、觀眾、政府補貼、劇團經營等多個數據維度,結合人物採訪,說明話劇“繁榮”背後有多種原因,除了劇團推出優秀劇目,小眾但穩定的話劇觀眾、政府補貼也功不可沒。同樣一份報告,除了可以分析話劇市場,還可以分析音樂劇、農村演出、政府文化補貼等等,做出不同選題的數據新聞。
國家衛計委定期公布《全國口腔流行病學調查》,裡邊涉及大量的牙病調查數據,雖然上次調查已經過去兩年,但結合新的採訪,學生們創作了《我國竟有64%成年人每天刷牙不足兩次》,這個作品在湃客上發表,引發讀者共鳴,取得了不錯的傳播效果。
六、從生活經驗中找選題
用支付寶的人大約都知道「螞蟻森林」(用戶通過步行、地鐵出行、在線繳納水電煤氣費、網上繳交通罰單、網絡挂號、網絡購票等行為,就會減少相應的碳排放量,可以用來在支付寶里養一棵虛擬的樹。這棵樹長大後,公益組織、環保企業等螞蟻生態夥伴們,可以“買走”用戶的“樹”,而在現實某個地域種下一棵實體的樹),它將電子支付與環保理念綁在一起,既營造了良好的企業形象,又滿足了消費者的環保“虛榮心”。螞蟻森林種樹的地方是內蒙古,為什麼要到內蒙古去種樹?一定是那裡的樹少!在一般人的印象里,內蒙除了草原,還有沙漠,是沙塵暴的發源地。但查找資料卻發現,內蒙古的森林面積在全國排第一,內蒙是怎麼做到的?學生們完成的數據新聞《考考你!中國哪個省份森林面積最大?》在湃客號發表後,獲得了意想不到的熱評,被評為澎湃2019年6月數據驅動內容排行榜三等獎。

《考考你!中國哪個省份森林面積最大?》作品節選
用手機的人都知道,手機里安裝的 App 會讀取手機里的數據信息,比如手機型號、位置、聯絡人等等。App 讀取手機數據的情況有多嚴重?會導致哪些後果?如何防止個人信息泄露?學生們在某應用商城裡爬取了數萬個 App 的應用程序安裝包,通過分析這些安裝包中的用戶權限調取文檔,完成了《8.7萬條數據告訴你 安卓 App 裡面到底有多少“坑”》,揭露應用商城監管不力,致使眾多 App 隨意調取用戶隱私數據,留下安全隱患。
近年來,高鐵成為人們出行的常用交通工具。高鐵如此便捷,民航是否大受衝擊?是不是有了高鐵,人們坐飛機少了,民航的業績會大幅下滑?通過查找數據,學生們發現,民航的收入不減反增,民航都採取了哪些手段應對高鐵的衝擊?通過查找數據和採訪民航業內人士,學生們創作了《高鐵搶了民航的生意嗎?》,通過騰訊位置大數據和飛常准等第三方數據,發現高鐵的出行數據以中短程為主,而飛機的出行數據以中遠程為主,在“一帶一路“政策下,民航開闢了更多的國際航線,與高鐵差異化競爭,尋找到新的出路和財路。
日常生活中多觀察,多思考,在司空見慣的現象中尋找問題,用數據來解讀,就有機會發現各種有趣的答案。
七、頭腦風暴聊出來的選題
2018年下半年,我們想做一個年終盤點的數據新聞選題,但一直沒有找不到合適的選題。我在首爾參加全球深度報道網年會時,與每日經濟記者聊天,獲悉2018年內地企業蜂擁到港上市,數量可能是歷年來最多的。為什麼內地企業要赴港上市?為什麼2018年赴港上市“井噴”?赴港上市的都是些什麼企業?來自哪裡?上市後的市值如何?基於這些疑問,我們與《每日經濟新聞》記者合作,完成了《七成赴港上市內地企業都破發了,小米、海底撈們圖個啥?》。
沒有想法的時候,可以與同伴一起頭腦風暴一下,或許可以找到思路。
結語
做數據新聞有時候是選題先行,之後再去找數據,有時候,是先有一個大的方向,在找數據的過程中,逐漸形成選題;還有的時候,是數據先行,從分析數據中確定選題。選題確定之後並非一成不變,有時候在做的過程中,發現事先的想法不可行,或者進展不下去,或者有了新的發現,就會臨時轉換選題的角度。
完成一個數據新聞選題,不亞於做一個行業調查報告,問題意識、採訪溝通能力、數據獲取與分析能力、寫作能力、解釋問題的能力都會得到鍛煉。
白凈,博士,南京大學新聞傳播學院教授,主要研究方向:新聞實務,可視化應用,媒介倫理與法規。