大多数记者都知道,如果将想找的关键词前后加上引号,便可以使用 Google 高阶搜索中的「聚焦」功能,进行更加精确搜索。
但很少有人知道,你可以在 Google 中找到任意两个你怀疑的目标之间的关系——只需使用大写的术语 AROUND,后面添上一个由估计得出的模糊词数,便可扩大结果的呈现范围,避免出现漏网之鱼。
在以「可视化搜索与验证」为主题的 GIJN 网络研讨会上,开源调查专家范埃斯(Henk van Ess)对来自85个国家的487名与会记者分享了这样几则实用的搜索技巧。
范埃斯强调,这一系列变通的研究方法建基于一种全新的搜索思维,其中包括了计算机逻辑、可视化、对已知的东西进行排除以及耐心地试错。
虽然调查记者通常精通于概念思维,但他表示,当试图将一次搜索分解到最基本要素时,「可视化思维」往往能取得更好的效果。
「活用 Google 中内置的一些搜索术语,结合反向图像搜索以及可视化思维,便可引领你的调查前进一小步,进入下一阶段。」范埃斯表示。
范埃斯曾经协助过一系列开源工具的开发,这些工具都旨在增强使用者的这种思维模式。在这些开源工具中,其中一款名为 Who Posted What? 该工具专门针对 Facebook 和 Instagram 等平台的内容进行高级过滤搜索。
除了选对关键词来找到你想要的东西以外,范埃斯表示,可视化思维方法包括「确定你想要的东西」,「排除你已经知道的东西」,并「使用最合理的方法找到你需要的数据」——即这意味着使用图像来搜寻难找的文本。
他的建议包括:
- 尝试找出你确信会出现的字眼,并将其作为关键词进行搜索。通常而言,你是没办法通过直接搜索「采访」这个词来找到关于一场采访的详细信息的(除非采访记者在写稿时在文中特意注明「在一次独家采访中……」)。相反,你需要自己判断会出现在最后稿件中的内容。例如,假如要找到一个名为 Anna Kog 的受访人采访,你可以想像在文中会出现像 「Kog 说」(”Kog says “)和 「我」(”I”)这些字眼。同时记得在搜索栏输入关键词时,也将引号放入到合适的位置。
- 从实例中寻找关键词。例如,在搜索某张特定的地图之前,先停下来思考一下一般地图上通常会用到的常用术语。你会发现 「地图(map)」这个词其实是很少出现的,但「比例尺(scale)」这个词却经常出现——因此,你可以尝试在搜索「比例尺」这个词的同时,再加上其他关键词来进一步缩小范围,帮助寻找你想要的地图。
- 在搜索框中加上你想找的词汇,并「减」去你需要排除的内容。为了对抗铺天盖地的假新闻,记者往往需要找出其源头,即第一个提出那些极具误导性的假消息的人。在网络研讨会上,范埃斯对在场记者发起挑战:除了众所周知的美国学者 Francis Boyle 外,记者能够当场利用网络检索找出另外4位声称新冠病毒是生物武器的科学家的名字吗?大约有一半的与会者在谷歌上进行搜索时,使用的关键词都类似于「声称新冠病毒是生物武器的科学家」,但没有人能够基于这样的搜索词成功找到另外4名科学家。范埃斯解释说,提出这种说法的科学家不太可能在他们的原帖中使用「科学家」或「说法」等字眼。相反,他建议用
Dr. * *
来搜索科学家——其中的星号*为通配符,允许 Google 呈现该位置上为任意名字的结果——并用减号过滤掉那些关于 Francis Boyle 的结果:-boyle
。 - 使用搜索运算符来寻找两者间的联系。「操作符」(Operators)是指某些可以对在线文本搜索进行精确与优化的特殊的字符和指令。记者可以试试使用运算符,大写的
AROUND
,然后在后面添加一个括号,括号中填写你试图联系的两个目标在文本之间的大致字符数。记者可以根据其他语言中的平均句子和标题的长度进行调整,但一定要确保 AROUND 和括号之间不留空格。会上,范埃斯用以下搜索指令找到了另外四位科学家:“Dr. * *” AROUND(7) “coronavirus is a bioweapon” -boyle
「我会要求你们都熟背这些公式吗?不,连我自己都背不下来。」范埃斯说。「唯一的办法就是试一试,如果失败了,就问为什么,然后再试一次——尽量用数学思维来思考。」
- 利用图片找你的目标人物,并了解国外媒体是如何报道他们的。选取你要调查的对象的资料照片,点击 Google 搜索框的相机图标后,上传到 Google Images 中。在 JPEG 图片 旁边的搜索框中用国家标识符代替人名。例如,如果是伊朗,则使用
site:ir
的指令代码。范埃斯表示,你甚至不需要知道如何用外语(例如波斯语)拼写他们的名字,就可以在网络上找到伊朗媒体发布的关于他的文稿。「但你用来进行搜索的照片必须要非常简单——选择此人最常用的资料照片,例如其 Twitter 等社交媒体账号的头像,或是 谷Google 图片搜索出来的第一张照片。」 - 使用 Who Posted What? 工具和日期来寻找 Instagram 图片。对于那些使用传统的反向图像搜索很难找到的图片,可以在 Instagram 中输入一个地名,以此抓取一个地理位置链接,并将其与目标日期一起粘贴到 Who Posted What? 中。你也可以据此确定发布照片的人,再通过 Google 搜索找到他们的 Twitter 账号,然后联系他们,再进一步询问图片的相关情况。
- 当你目前所有已知信息只是一个视频发布的网址,就尝试寻找该网址还在哪出现,并顺此调查下去。如果你只知道一则被疯狂转发的视频被发布在 YouTube 上,试着在 Google 中粘贴链接,并用减号指令将该平台从搜索结果中排除,如:
-site:youtube.com
。你也可以试着用同样的「排除」法来寻找被删除的 Instagram 账号图片:将已被删除的 Instagram 链接粘贴到 Google 中,但要加上指令:-site:Instagram.com
你也许就会发现该链接已经被第三方网站复制并存档了。 - 思考其他可视化线索。商标是可视化思维的一个很好的例子。如果你的调查目标是一家公司,而其官方网站提供的信息很少,但包含了公司的商标,你便可以据此在网上搜索该标志可能出现的其他地方——例如企业网站上常设的客户商标列表,如此一来便可找到与其有业务往来的其他公司。你可以在 Google Images 中使用目标公司的商标进行正常的反向图像搜索,并将该公司的网站过滤在外,方法是在搜索框内使用
-site:
指令,再在后面输入该公司官网网址。 - 当以上这些高级工具都不起作用时,可以尝试单纯的文字搜索。范埃斯会上举了一个例子:当他试图寻找一个疑似恐怖分子在机场拍摄的图像时,无论 TinEye 还是 Yandex 这样强大的反向图像工具都无法找到。但一篇现场的文字报道提到了一条不同寻常的可视化线索——嫌疑人身后有一只黄色的大泰迪熊。于是,他其实只需在谷歌图片中输入「机场黄熊(airport yellow bear)」,就能找到这张图片。范埃斯提醒大家,如果想使用图片主体颜色作为关键词在 Google Image 中进行搜索,只有用英语拼出这些颜色术语时才有效,如“green’’或“blue’’等。
Rowan Philp 是全球深度报道网的记者。他曾是南非《周日时报》的首席记者。作为一名驻外特派员,他报道过全球20多国的新闻、政治、贪腐和冲突事件。