NICAR分享 | 數據新聞術語清單

Print More

談到數據新聞,總也繞不開技術。記者不懂點行話,還怎麼跟團隊技術小夥伴溝通?在NICAR會議上,數據極客同時也為NBC4調查記者的Tisha 一起和 ProPublica新聞應用開發師Sisi,向大家介紹了一些熟悉又陌生的技術,分享了不少軟件、互聯網平台等。

深度君經授權轉載鏑次元數據傳媒實驗室(ID: dyclub-org)的NICAR分享,看看清單里有哪些術語還不熟悉?文中還附有相應教程,或者參考深度君的分享《獨家 | 全球調查+數據新聞指南超全清單》哦。


基本術語

1

CMS
Content management system(內容管理系統),可以通過CMS實現內容管理及發布,CMS通常基於模塊式的開發,每個新聞編輯室都會有內容管理系統,最為典型的CMS就是博客系統”wordpress“。

Modeling
Statistical or mathematical modeling(數據建模),建模通常是由科學家或者研究者完成,能幫助我們理解系統如何運作。

AWS
Amazon web services(亞馬遜網路服務系統),你可以向其付費來運營你的網站。

OpSec
Operational Security(運營安全),作為記者,如何保護自己的新聞源?在斯諾登事件之後,這個問題變得更為重要。

編程相關

編程實際上就是與電腦的溝通對話,以下這些就是我們跟電腦溝通時所用到的語言。

2Ruby和Python
這是兩款常用的編程語言,Ruby和Python在手,天下我有。比如,在做非法槍支買賣的專題時,你可以用Ruby扒取網站上的槍支廣告。

可參考深度君的分享《新聞人網絡數據採集入門》

Node.js
Node.js是可用於服務器端的javascript運行環境,通常適用於高並發的應用場景。

Django, Rails
這兩個叫做“框架結構”,運用Django和Rails構建框架,這樣你就可以在互聯網裡創建出成百上千的網頁了。Rails基於Ruby,Django則基於Python。

API
Application Programming Interface(應用編程接口) ,計算機讀取網頁的“捷徑”。不少公司(比如Twitter)都開放了API,別的程序員就可以運用這些公司的數據來創造一些有趣的項目。

Grunt
一個提供預覽和測試html/css/js的軟件,確保代碼的可以正常運行。(筆者認為這個程序很有利於寫出乾淨有序的代碼,大家不妨一試。)

   網站/服務/產品

3CodePen, JSFiddle
在線編輯html/ css/ js語句和分享的網站。

StackOverflow
你可以在這個網站上提問,尤其是關於編程的問題。

Tabula
從pdf中提取數據的免費軟件。

更多數據處理軟件,可參考深度君的分享《乾貨 | 數據收集和處理工具一覽》

數據類型
電腦儲存數據會有多種格式,以下三種是可以互相轉換的。

CSV
逗號分隔值文件格式,其文件以純文本形式存儲表格數據(數字和文本)。

XML
用這些<tags><that><look><like><this>來分隔數據,是一種用於標記電子文件使其具有結構性的標記語言。

JSON
一種輕量級的數據交換格式,JSON 語法是 JavaScript 對象表示語法的子集。

      地圖繪製

5

ESRI
美國環境系統研究所公司,開發了ArcGIS工具。

可查看深度君的分享:《地圖可視化製作和數據平台精選》

QGIS
開源免費地圖軟件。免費,但是沒有ArcGIS好用。

Tilemill
製作地圖的軟件。

Map box
Tilemill的所屬公司。

Fusion Tables
一項Google服務,你可以上傳數據,並運用Google maps來製作地圖。

CartoDB
一個製作並在線發布地圖的網站。頁面精良,有付費和免費版本。

可參考深度君的分享:《地圖可視化神器CartoDB簡明使用指南》

ShapeFile
運用點、線、多邊形來描述形狀的描述的文件。我們可以運用這些文件來製作地圖或者地圖上的圖形。包含有郡縣的邊緣或者是湖泊的界線。
數據分析
6SQL
結構化查詢語言,用於存取數據以及查詢、更新和管理關係數據庫系統。

MySQL
一個十分熱門的數據庫管理系統。

SQLite
生產嵌入式SQL數據庫的軟件,可以不通過服務器來建立數據庫。

PostgreSQL
更為高階的SQL數據庫管理系統。.

pgAdmin
PostgreSQL的管理界面。

Regular Expressions
正則表達式,通常被用來檢索、替換那些符合某個模式的文本。

OpenRefine
一個免費且強大清理數據的軟件。

可參考深度君的分享:《數據清洗神器Open Refine簡明入門》

Document Cloud
由記者創建的,一個可以上傳、搜索pdf並可以對pdf進行注釋的網站。

Google Analytics
Google創建的網頁流量分析軟件。

統計

7Regression
回歸,統計術語。測試變量間相互依賴的定量關係的一種統計分析方法。

SPSS
付費的統計分析軟件。

R
一年前江湖上還沒有R的傳說,現在人們都在用了。這是一個基於統計計算和繪圖的的編程語言。

R Studio
一款好用的R語言編輯器。

dplyr
最近兩個月剛發布,更快更簡易地操作、探索數據的R語言軟件包。

Sensor Journalism傳感器

Sensor Journalism
專業記者和自媒體運營者通過傳感器收集和利用海量信息與數據來“講故事”的新聞生產模式。

Arduino, Raspberry Pi
兩種類似的硬件,運用其附帶的軟件進行編程,改造成傳感器。

鏑次元數據傳媒實驗室(ID: dyclub-org),以武漢大學為研究基地,對接豐富的數據資源和媒體資源,以產學研結合方式,積极參与和推動數據新聞的人才培養、技術創新、行業生長和理論發展。

原文作者/吳嘉川 劉佳昕
原文翻譯/曾明 趙磊
原文編輯/曾明
原文運營/劉雅露
深度網編輯/周煒樂

Print Friendly, PDF & Email

發表回復

您的電子郵箱地址不會被公開。 必填項已用 * 標註