互联网时代,懂搜索就掌握了网络调查的核心技术。在第二届亚洲深度报道大会上,BBC互联网研究专家Paul Myers连开两场讲座聊网络调查,深度君将秘籍分成八类整合如下。若想回顾专家以往分享,可查看《BBC搜索专家:十款强力“人肉”搜索工具》和《报道亚洲| BBC专家:网络搜索,大有可为》。
1.检索IP地址:
正如每个人都有自己的电话号码一样,每个网址都有匹配的IP地址。如果你对网上诱人的销售信息心存疑虑,可以找到信息提供者的IP地址,查查这样的好事是真是假。Myers曾经和BBC的同事采用此法揭露了一场骗局:一位声称在伦敦的房屋中介,在网上称以法定价格的一半出租伦敦的一处房产。但核查发现,发布者的IP地址位于尼日利亚,且住在该套房产的一家人刚搬离,压根没发过租赁消息。Myers是如何查到的?
神器之一是网站whatstheip.com。输入你的邮件地址,点击“得到链接”(Get link),把链接发给跟踪对象,确保只有他/她会点击这个链接。点击后,系统会自动发送邮件告知他/她所在的IP地址和地理位置。网站提供的链接一般隐蔽性较高,可大大增加点击几率。若想以IP地址做详查,也可登入若想知道自己电子设备的IP地址和对应的地理位置,登入whereamirightnow.com便可知晓。
如果跟踪对象出了国,该怎么继续跟踪呢?在网站2.调查网页背景:
关注深度君推送的小伙伴,一定对 Myers推荐的一款IP追踪工具不陌生,这就是让虚假销售网站现身的domaintools。例如,我们在Facebook网站上经常能看到特价皮包销售的网站,像下图的Loveukbags.com就标明Michael Kors的皮包4折销售,网站的货币单位和.com的后缀都看起来货真价实,而这么诱人的价格到底是真是假呢?让我们用Domaintools来测一测。
登录Domaintools查询网络Whois信息,能查出众多含有关键字“bags”的购物网站,例如HandbagsSale.com、ShoesBags.com、PursesHandbags.com等等,网站www.loveukbags.com上出现的服务邮箱则挂靠在多达2988个域名上,注册商竟是中国珠海某公司。该公司同时注册了2987个域名,而IP地址则设置在美国亚特兰大以掩人耳目,这足以证明我们要查的是一家虚假购物网站。而从Facebook用户的反馈上也可以看出,这家公司已骗人不少。(Domaintools同时还能查询ip、Whois更换,服务器更换等历史信息,功能强大吧。)
3.监控社交媒体:
Myers推荐了社交媒体监控网站Geofeedia,它堪称此类网站中的一股清流——监控了新浪微博。去年深度君在全球大会的报道中曾做过介绍,我们一起温习一下:
假设记者需要探访某地,寻找联系人,微博的高级搜索定位只能精确到市,且并不直观。而登陆Geofeedia后,出现地图界面:
在右上角的搜索栏(search)中输入地名(中英文皆可,可具体到街道名,也可输入城市名),回车搜索,就能自动跳转到搜索地点。右方的放大缩小工具可用于调整地图比例。
中间的圆圈表示选择地区范围,也可以选用右上角的四边形工具,自定边界。同时在右边可自定想要搜索的社交媒体类型(这里我们选择微博),点击区域中心方块内的放大镜图案,搜索就开始了。这里,我们搜索了北京城区及周边区域,发现了过去一个月左右时间里,在这个区域内发出的12.2万条微博。点击上方标签中的“拼贴(collage)”,可以看到由近及远排列的微博具体内容、发布者以及发布时间。找到你关心的话题,点击发布者名字,就能进入他的微博主页。不需要看具体内容,只想知道整体趋势,可点击标签栏第三位的“分析(Analytics)”,就会出现微博和用户的总数、平均数统计,甚至还有关键词和最常发布的用户排名。美中不足的是关键词没能采用中文分词技术,只能出现中文单字,不具参考价值——建议结合微博官方的微数据使用,效果更佳。若想知道另一检索利器Echosec的用法,请戳《网络搜索专家:有了这些网站,在中国做调查报道会更容易(Geofeedia和Echosec)》。
4.解密图片信息:
除了查看社媒活动,我们也常遇到这样的问题:想查一张照片的拍摄位置和时间,但除了照片本身并无其他线索,该怎么办?其实照片本身内含密码,也就是我们常说的元数据(metadata),通过Jeffrey’s Exif & Metadata Viewer就能读出。将数码相机拍摄的照片上传到http://regex.info/exif.cgi,或输入照片的链接,例如Myers的Twitter头像,就能得知图片基本信息(大小、像素等),包括拍摄时间、位置、具体参数(快门、光圈、镜头型号等等)。下方的谷歌地图还原了拍摄位置,正是BBC旧址的红墙外,稍加拖动还可看到大楼的内饰细节。
调整后可见照片拍摄地BBC大楼外景。
想查同类照片?试试Chrome插件Fuskr。Fuskr在瑞典语中意为“作假”、“作弊”,它查找同类照片的能力的确会产生以假乱真的错觉。安装插件——右键单击图片——点击“Fusk”——选择查找图片的数量,即可查到同类照片,可下载或查看。Myers也透露了谷歌图片的诀窍:检索图片时,尽可能查找尺寸最大的图片,方便查验细节;若想精确检索,点击“搜索工具”(search tools),在时间选项内选择“自定义范围”(custom range),即可锁定某时段内上传的图片,更易找到原版照片。5.查找网页隐藏信息:
一些网站会隐藏内容,或含子域名,查起来不容易。Myers推荐了Pentest tools,顾名思义,就是在线渗透测试工具(Online Penetration Testing Tools)。打开网站,在左侧选择“查找子域名”(find subdomains),输入网站域名,可选择显示IP地址与否,点击“开始”(start),搜索结果稍后便会显示,还可以pdf的格式输出,方便保存。Pentest分为信息收集(Information gathering)、网站应用检测(web application testing)和基础设施检测(infrastructure Testing)三部分。你可查询子域名,或下载关于网站服务器、链接漏洞信息(URL Fuzzer)的pdf报告等,甚至可以找到网站背后的文件目录(directory and files),将网站内容一览无余。
6.锁定电话位置:
存储20亿个电话号码的Truecaller,是全球号码权威搜索库。选择区号、输入号码,网站即可帮你定位地址,显示号码所属公司和号主姓名。若在网站Sync.me输入同样信息,你还能看到号主的社交媒体信息和照片—前提是他/她曾在社交媒体输入该号码。
7.识别邮箱格式:
想直接给某个机构的人发邮件,只知道他/她的姓名,但不知道邮箱地址怎么办?用email-format.com查邮箱格式就好啦。键入机构域名,例如bbc,即可查到BBC工作人员的邮箱格式,套上姓名就可以发邮啦。同理,如果你想验证某人邮箱的真伪,也可输入域名对照查验。
8.收集商业数据:
拥有超过15年历史的EdgarOnline可为用户提供公司数据、公共招股信息、共同基金和其他公开交易的财产信息,但信息皆为付费查看。
有组织犯罪和腐败报道项目(OCCRP)创建的Investigative Dashboard,提供120个管辖区内400多个在线数据库,支持检索个人和商业机构信息。用户选择“访问数据库”(visit databases)时可选择“数据库类型”(database type)、“国家”(country),键入关键词。
若觉得数据不够,为调查者提供商业信息挖掘方案的英国公司Arachnys有你想要的数据目录Arachnys compass,来自215个国家和地区的1363个信源被囊括其中,含公司、法律和新闻信息,支持深层和表面的网络数据搜索。同时,他们还有两大神器Investigator和D3。一个能调查200多个国家公司的金融犯罪记录并评估风险,另一个能在上述国家快速执行尽职调查的流程。详情请戳:别看以上搜索的信息零碎,Myers认为这正是“拼图识别”(Jigsaw Identification)按图索骥的要义:不断添加各部分信息,将其拼接成块,我们就能窥见事物全貌。“记者在做线上调查时,需要像侦探般分析事实,追踪多重线索,找到特殊人物,得知他们的喜好和活动区域。”
编辑/Ivan Zhai
想知道更多会议干货?请关注全球深度报道网(cn.gijn.org),微博@全球深度报道网及其话题#报道亚洲16#、微信“全球深度报道网”(ID:gijn_cn),Twitter @gijnCh带来的系列分享。我们的最新报道有:
《报道亚洲 | 忘掉奥斯卡,听“聚焦”小组编辑现场讲述调查项目管理》