在網頁404之前,BBC專家告訴你如何保存網上信息

Print More

在信息時代,網頁內容常遭刪改。無論追蹤線索還是查閱資料,保存網上信息已成為必備技能。BBC互聯網研究專家Paul Myers告訴我們網上信息的存儲妙招和好用工具,大家還可參考《郵件+網頁+硬件:新聞記者信息保護技巧分享》《BBC搜索專家:十款強力“人肉”搜索工具》

為何要保存網上信息?

信息修改

網上的內容常會被刪改,說不定馬上404。網站人員一點鼠標就能刪除爭議的內容,社交媒體上的帖子也會被刪和改動。如果沒保存,後面就用不了。對新聞報道來說,說清楚內容在不同時間上的變化也很有幫助。例如,記者可以記錄某人推特賬戶粉絲增加或減少的數量。

1

查閱權限變動

無論是微信、微博還是臉書、推特,帖子都可以編輯分組、設成私密,起初公開發布的照片和文本也可標記成“僅供朋友查看”。趁着帖子還公開,得抓緊保存。

法律原因

如果你要根據某人網上的文章或照片提出指責, 而網上內容又被對方刪除的話,你將失去文本證據。備份可讓你在有需要時發給律師團隊,這樣郵件上會有發郵日期的紀錄。

那麼如何才能保存網上信息呢?以下是專家的建議,從基礎講起:

複製黏貼

這是人人都會的基礎技能。做法:選中文本,按住Control+c(Mac用戶按Command+c),打開一個文檔或相關應用,然後按Control+v (Mac用戶按Command+v)就可黏貼,或選中——右鍵——“另存為”。
常見問題是:複製黏貼下來的文本還是套用原格式。若想調整,專家使用的PureText和其他類似軟件都能幫你搞定。

2

保存網頁圖片

網絡圖片是獨立於其所在網頁的,它們有自己的鏈接和文件名,通常是JPEG, PNG 或GIF三種格式之一。最傻瓜的辦法就是右鍵——“保存圖片”。

小貼士:盡量在電腦上存儲尺寸最大的圖片版本,以便日後可能需要聚焦圖片上的一小部分。

存了圖片,但還想知道是在哪裡拍攝、用什麼參數?Jeffrey’s Exif & Metadata Viewer可以幫我們依據關鍵線索鎖定時間地點。只需黏貼圖片地址或上傳圖片,圖片基本信息(大小、像素等),包括拍攝地點和時間、具體參數(快門、光圈、鏡頭型號等等)都能查出。最神的是,你還能知道Google Map圖像和當時的定位,放大縮小隨你看。同類型的平台還有Gbimg.org,不妨對比一試。這對記者查找線索非常有用。

8.Jeffrey’s-Exif-Metadata-Viewer

截圖

你可以直接將屏幕上可見的內容截圖保存,會用幾個鍵盤鍵即可:在Mac上,按住Command+Control+Shift+3;如果是PC,按住Print Screen(截圖)按鈕(通常標註為“Prt Scr”)。截活動窗口,就同時按下 “Alt Gr”和“Prt Scr”。

現在你計算機剪貼板里已經有了截圖備份,按住Control+v就可以黏貼到郵件、Word文檔或圖片編輯系統里。

用截圖快捷鍵的一大缺點是只能截可見區域,而在有些時候,當要截的區域多於一屏的時候,我們就不得不一邊下拉、一邊截圖,結果是要截好幾幅。這個問題的答案之一是用截圖軟件。

你可以在瀏覽器添加插件,在Chrome網上商店或火狐瀏覽器的插件頁面里都能找到。很多軟件現在都免費了,方便瀏覽器安裝。3
如果你要截多個圖片,不妨試試Techsmith出品的軟件 Snagit,可以截網頁不同區域,還可加註釋,甚至能截視頻。要想演示網站操作、保存流式內容、視頻和動畫,你絕對用得上它。只要選中想錄製的區域,再設定期望的時間長短即可,輕鬆易得。軟件目前只能存mp4格式,存其他格式得用轉格式軟件。

另一個好用工具是Chrome插件Fuskr。安裝,右鍵點擊圖片,可找到圖片鏈接隱藏的眾多類似圖片。Fuskr支持下載,能排除受損照片,以及重新調整圖片大小以適應網頁等功能,非常實用。

6.Fuskr_

截圖的一個缺點是你只能保存數碼圖像,無法點擊鏈接訪問相關網頁,也不能選擇文本或剔除照片。你存的就是看到的圖像。解決辦法之一是保存網頁,把完好無損的網頁碼代和圖像存到硬盤裡。

保存網頁

在大部分瀏覽器里,你可以直接按住Control+s保存網頁,會有選項框彈出讓你設置文件名和保存位置。

你也可以存儲網站基本版本,沒有圖片、僅含部分功能,選擇“網頁,僅HTML”即可。但是大部分人都存成了“網頁,全部”的版本。這一選項會將圖片和一些內嵌技術文件存到一個單獨文件夾,可供日後瀏覽並繼續使用大部分在線功能。

4

雖然這種保存方法也有缺點——沒法存網頁視頻或搜索內容,但就大多數情況來說,這樣保存網站證據也夠用了。

如果你已經存了網頁,記得找到路徑、打開文件看看。如果文件看起來不太對,就要試用另一個瀏覽器存儲。IE瀏覽器通常會把網頁存成.mht格式文件——像Word文檔,但在IE上瀏覽就和網頁一樣。當然,你也可以存成PDF格式。

小貼士:別光存儲你感興趣的網頁,還要把與它有關的鏈接一併存下來。同時考慮一下要不要保存域名註冊信息和關聯的社交媒體頁面。

要存網站的域名信息,首先得查好域名。此前Myers曾推薦過域名搜索工具Domaintools和Whatismyip.com,能馬上檢索目標IP所處的國家、城市、城區、郵政編碼、網絡提供商、時區和經緯度等信息,定位也相當準確。詳情可查看《BBC搜索專家:十款強力“人肉”搜索工具》

除了以上保存網頁方法,專家還推薦好用軟件Black Widow,讓你不懂編程也能抓取信息。該軟件能抓取網站上的信息,下載Youtube視頻、PDF、PHP、CGI和其他格式的文件,在加密保護網頁上也適用。

從移動端設備和app保存信息

5在大部分移動端設備和app上存儲信息都不太容易。iPhone沒法讓你從屏幕截取視頻,Instagram沒法讓你拉大、縮小或保存圖片。

不過,一些app有網頁版,例如,一些第三方的app和網頁可以幫你從Instagram上保存信息;聊天軟件Telegram有網頁版可以截取信息;而對Skype來講,最簡便的方法是在電腦上用屏幕記錄程序。在不同的平台上,app的設計和特點可能大不一樣,所以可以試着換台手機存儲信息。同時,記得社交媒體上有些內容也會涉及版權問題。

附加資源:

1. 5款保存信息的APP推薦

除了上述專家分享,還有一些方便保存網絡信息的app可供大家一試:

1) Spool

6Spool是一家新創業公司的產品,可讓你離線查看存儲文件。目前不但有網頁版、Chrome和火狐瀏覽器的插件版,還有適合iOS和安卓系統的app、方便所有瀏覽器和移動端使用的書籤版。同時,你還能連接Dropbox賬戶,保存網頁和其他格式的文件。

保存頁面後,用戶默認可在聯網狀態下在網頁、app查看所存頁面。如果想用手機離線查看文件,打開Spool app——選擇“設置”(Settings)——檢查“自動下載”(Autodownload),可以設置在連到Wifi或移動網絡時自動下載文件,同步的文件將會自動存在移動端。

2) Pocket

擁有1千萬用戶的免費應用 Pocket也是好選擇,它提供郵件、移動端、網頁存儲,方法很簡單:髮網址到add@getpocket.com。Pocket的功能可用於300多種第三方app(包括推特和聚合新聞應用Flipboard等),無需離開app即可保存內容。你也可以用Chrome、Safari和火狐的Pocket插件,點選瀏覽器書籤,或手動存儲。保存後,就可以離線閱讀啦。

7

3) Instapaper

深度君也強烈推薦Instapaper,它能兼容150款iOS App。

只要複製網頁連接,打開app,就能存儲全文和部分圖片,還能建文件夾區分內容。Instapaper的閱讀體驗也很棒,支持包括簡體中文在內的13種語言文本,可調節字體、背景顏色,還支持搜索、歸檔,分享功能。最妙的是,存儲的文章還能顯示預期閱讀時間。

8

要想了解Instapper更多設計細節?不妨看看他們團隊的博客吧。

4) Readability

類似的還有設計精良的Readability,他們提供Chrome插件和適用於安卓和iOS的app。

用戶需要先在官網註冊,再下載使用。它的功能和Pocket、Instapper類似,可保存其他app的內容,保存網頁,支持離線閱讀。

5) 印象筆記(Evernote)

10

相信大家已經非常熟悉這款應用。現在微信上也有印象筆記公號,保存和分享文章更加方便。最棒的是,你可以用它免費提供的存儲空間和朋友、同事協作編輯、演示筆記。

先在官網註冊賬戶,下載APP。若想離線閱讀,點擊“設置”(Settings)——“離線筆記本”(Offline notebook)——選擇任何需要離線使用的文件夾或文本。

2. 網站404救星:archive.org

要是網站真的404了怎麼辦?你還可以去archive.org碰碰運氣。不過這招只有在你知道網站URL的情況下才管用。問題是網站失蹤了,URL鏈接也就找不着了。這時想找回看似消失的URL,該怎麼辦呢?

11

我們有辦法!假設要找已逝女演員Lana Clarkson的個人主頁。

第一步:找到索引網頁

找一個跟消失網頁相關的消息源。這裡我們就用她的維基百科頁。

第二步:把索引網頁放到“時光機”里去

登陸archive.org,輸入維基百科頁的URL: http://en.wikipedia.org/wiki/Lana_Clarkson

選中最老的版本:2004年3月10日。這個版本顯示的個人主頁地址為:http://www.lanaclarkson.com

第三步:找到原始網頁

再把這個鏈接輸入archive.org,加一個反斜線和一個星號,如下所示:
URL: https://web.archive.org/web/*/http://www.lanaclarkson.com/*

咻,現在所有的鏈接都蹦出來啦。但在這個例子里,你找不到很多她的信息。因為Clarkson在死後才出名。她於2003年2月被著名音樂製作人Phil Spector槍殺。現在方法到手了,快找一些頭疼不已的例子試試吧。

Paul MyersPaul Myers是BBC的互聯網研究專家,同時運營網站“互聯網搜索診所”(The Research Clinic),致力於引導記者們找到最好的網絡搜索平台、應用和其他資源。他在BBC學院(BBC Academy)負責的培訓課程包括網上調查、數據新聞、社交媒體、統計學以及網頁設計。Myers還曾培訓過《衛報》、《每日電訊報》、《泰晤士報》、CNN、世界銀行及聯合國開發計劃署的工作人員。

主文How to Save Online Evidence, Part One&Part Two首發於BBC學院,全球深度報道網經授權編譯轉載。

參考文章:1. 5 Best Read-It-Later Apps, Mashable
2. 5 Ways to Read Your Favorite Website Offline, Hongkiat
3. 《BBC搜索專家:十款強力“人肉”搜索工具》,全球深度報道網
4. 《實用貼:如何用網絡搜索搞定新聞要素?》,全球深度報道網

編譯/周煒樂
編輯/Ivan Zhai

Print Friendly, PDF & Email

發表回復

您的電子郵箱地址不會被公開。 必填項已用 * 標註