编者按:《调查报道信息核实手册》(Verification Handbook for Investigative Reporting)是一本有关网络搜索和调查技巧的新鲜实用指南,指导人们如何利用UGC(user-generated content, 即用户生产的内容)和开源信息进行网络搜索和调查。此手册由总部设于荷兰的GIJN成员“欧洲新闻中心”(European Journalism Centre)出版,共有10章,均可免费下载。以下是获得授权转载并编译的该书第2章,由网络搜索专家Henk van Ess编写。
网络搜索是传统调查记者、新闻教师和学生经常面临的棘手问题,因为网络信息可能不真实,有偏颇、或者不完整,这几个弊端也可能同时出现。
线下也是一样,给我们提供信息的人不可能毫无偏见,政府也做不到毫无隐瞒。无论线上线下,问对问题是关键。那怎么用网络搜索搞定新闻的三大要素(人物、地点和时间(3W))呢?专家告诉你有哪些好工具和巧方法,让你搜索不再愁。
1. TA是谁?(Who?)
试试用谷歌写出一份壳牌公司CEO Ben van Beurden的背景介绍吧:
a.寻找资料和评价
“is”这个简单的词是个神奇的小提示,能“命令”谷歌显示出和人物相关的资料和评价。为了避免结果杂乱,搜索时最好加上公司名称或其他细节,用AROUND指令告诉谷歌:这两个词离得近才行。
AROUND()指令必须大写,以保证搜索词之间的距离不超过两个词。
b.其他人的评价?
这个搜索指令让谷歌 “显示除了壳牌内部文件,还有哪些PDF文件含有壳牌CEO名字?” 所以最后出现的是与搜索对象相关、但不是由他/她公司发布的文件。你能看到反对者、竞争者和异议者对他的评论。如果你觉得还不够,不妨输入以下指令试试:
inurl:pdf “ben van beurden” –site:shell.*
这样你还能找到filetype找不出来的PDF文件。
c.官方数据库
再一步就是搜索全球关于他的官方文件。在网上搜索gov.uk(英国),.gov.au(澳大利亚), .gov.cn (中国), .gov (美国)和世界上其他国家的政府网站。如果你的所在国没有以.gov为结尾的政府网站链接,试试这样的组合:当地词汇+指令site: operator. 例如搜索德国的政府网站可以用:site:bund.de,要是荷兰的就用:site:overheid.nl。
按照此法,我们发现了van Beurden伦敦寓所的建筑许可证,按图索骥,就找到了他的完整住址和其他细节信息。
d.联合国资料
现在试试在联合国相关组织网站里搜索信息。还是以壳牌CEO为例,我们搜索发现,他的名字出现在一份关于“国际化学品管理战略方针”(Strategic Approach to International Chemicals Management)的文件里,由此找到了他的全名,妻子全名和当时的护照号码。神奇吧?
e.寻找名字的不同拼法
按照这个指令,你可以发现使用不同名字拼法的结果。你会搜到含有“壳牌(Shell)”字样的文件,但把称他为“Ben”的排除在外了。如此一来,你会发现他也被称为“Bernardus van Beurden”(你不必在名字里打点[.],因为点在谷歌搜索里是忽略不计的)现在Get到技巧了吗?不如换个名字,重新按照a,b,c,d的顺序试一遍吧。
2.TA在哪儿?(Where?)
a.使用Topsy的图片搜索功能
用www.topsy.com 找出主人公所在的地点,用三项搜索条件锁定结果:分析他过去一段时间内(2)提到的地方(1),查看别人在Twitter上发的图片(3)。如果你想调查一个特定时间段,在时间菜单里选择“特定时段”(Specific Range)就可以了。
b.使用Echosec
你可以在Echosec上免费搜索社交媒体信息。比如搜索壳牌,我输入了总部地址(1),希望能找到近期(2)在那里工作的人所发的状态(3)。
c.使用谷歌图片搜索功能
把你知道的相关信息浓缩成一个精炼的词。在如下例子中,我想搜一位名叫@ MuhajiriShaam的伊斯兰圣战者(1),但并不想查Twitter(3)上名为@MuhajiriShaam01 (2)的账户。我想查看这个人在2014年9月25日到29日之间在Twitter上发的图片(4)。
3.TA在什么时间(做了什么)? (Time?)
a. 搜索日期
多数情况下,你的调查是以发生过的事实为基础。所以要告诉你的搜索引擎搜索过去的信息。
我们来调查一场发生在荷兰Chemie-Pack(一家化学工厂)的火灾,它发生的日期是2011年1月5日。假定你想调查工厂是否储存过危险化学品。登陆images.google.com,输入Chemie-pack(1),搜索2011年1月之前的图片(2)。搜索结果给出了上百张照片,都是几天前来过这家工厂的青年消防队拍的。在一些照片里出现了写着化学品名称的圆筒。我们以此能列出火灾前工厂里储存的化学品清单。
b. 用archive.org寻找旧数据
想必大家也经常碰到网站“404 not found”的囧事,除了掀桌,你还可以去archive.org碰碰运气。不过这招只有在你知道网站URL的情况下才管用。问题是网站失踪了,URL链接也就找不着了。这时想找回看似消失的URL,该怎么办呢?
我们有办法!假设要找已逝女演员Lana Clarkson的个人主页。
第一步:找到索引网页
找一个跟消失网页相关的消息源。这里我们就用她的维基百科页。
第二步:把索引网页放到“时光机”里去
登陆archive.org,输入维基百科页的URL: http://en.wikipedia.org/wiki/Lana_Clarkson
选中最老的版本:2004年3月10日。这个版本显示的个人主页地址为:http://www.lanaclarkson.com
第三步:找到原始网页
再把这个链接输入archive.org,加一个反斜线和一个星号,如下所示:
URL: https://web.archive.org/web/*/http://www.lanaclarkson.com/*
咻,现在所有的链接都蹦出来啦。但在这个例子里,你找不到很多她的信息。因为Clarkson在死后才出名。她于2003年2月被著名音乐制作人Phil Spector枪杀。现在方法到手了,快找一些头疼不已的例子试试吧。
生于荷兰的Henk van Ess是资深客座讲师和培训师,他在欧洲多地开设网络调查工作坊,教授网络调查、社交媒体和多媒体/跨媒体内容。他参与的项目包括“网站信息核实(CSI Internet)”、《数据新闻手册》,以及社交媒体和网络调查专家的经验分享栏目。