Tony Jarne 花了8个月的时间调查英国的“豁免住房”(exempt accommodation)——这是一种为前囚犯、难民和无家可归者等弱势人群提供的共享住房。在这个过程中,他收集了数百份文件、音频和视频记录。为了管理这一切信息,他选择了 Google 的免费工具Pinpoint。
近年来,豁免住房的使用在英国迅速增加。去年12月底,英国国会成立了一个特别委员会来研究这个问题,特别委员会开放了一个截止日期,任何希望参与的人都可以提交书面证据。
特别委员会收到了来自机构、地方政府和个人提交的超过125份书面证据,有些只有一页纸,而有些则长达25页纸。
除了书面证据外,我还有从土地登记处、公司注册局下载的各种报告、新闻文章、地契和公司账户。所以我需要一个工具来整理所有的文件,它就是 Pinpoint。
A Search Engine for Files
Pinpoint 是 Google 为新闻记者设计的工具,它可以让你快速高效地组织信息,这对我写报道来说非常有用。
它的使用非常简单直观,如果你使用过 Google 的其他产品,那么它的设计非常相似(我经常有一种在使用 Gmail 或 Google Drive 的感觉)。
当你将文档上传到 Pinpoint 项目中时,它会识别出其中的人、组织或地点等实体信息(这个过程被称为实体提取),并提供按频率排名的结果。点击任何组织、地点或人名,就可以看到文档中提到该实体的所有信息。
它甚至可以处理扫描后的PDF文件:使用光学字符识别(OCR)技术,使它们可以进行搜索。
组织文件和数据
为了组织信息,我使用了标签,并为每个文档贴上标签,这让我能够轻松地找到和收集我需要的信息。
Pinpoint 允许你在整个文档库中搜索,或在带有特定标签的文档中搜索。
它还允许你在文本中划线,并创建到文档某个部分的链接,方便你可以直接跳转到相应的位置。
例如,我在调查中创建了一个主文件,里面的内容包括能链接到背景调查中最有趣的部分的链接。这样,收集信息写文章的过程变得更加快捷。
音频和视频也可以被搜索
Pinpoint 还可以帮你转录对话:上传一个视频或音频文件,它会创建一个带有时间戳的对话转录PDF文件。
它并不是最好的转录应用,但如果采访时间很长,它可以帮助你快速浏览不同部分的采访内容,最重要的是,它将这些资料加入到了你可以搜索和链接的信息中。
与 Document Cloud 相比的缺点和优点
Pinpoint 也有其缺点,也许最主要的问题是无法与他人共享文件。
如果你在协作项目中合作或计划将来需要其他人参与,则可能会遇到问题。当我想要分享一些内容时,我使用了另一个由记者创建的类似工具:DocumentCloud(DocumentCloud 有几个付费层次,但也提供一个免费版本,其中包含2GB的免费存储空间。)
DocumentCloud 有类似的实体提取、OCR 和注释功能,尤其擅长将文档嵌入文章中——我上传过文档到 DocumentCloud,以便另其他人可以查看这些文件。
对于经验更丰富的记者,我会推荐使用 DocumentCloud:它提供了很多可能性,并允许你共享信息,虽然它不像 Pinpoint 那样易于使用,但你可以尝试两种工具,选择自己最喜欢的那一个。
Google Pinpoint 还有空间限制。我的项目涉及的文档不超过500 MB,但如果你有几个GB的材料,可能需要创建另一个谷歌账户或购买更多的存储空间。
由于 Pinpoint 是一种将所有内容存储在云端的工具,因此你需要一直保持联网。为了避免这种不便,我在计算机上保留了文档的副本,并使用笔记本记下了最重要的信息。
但是,Pinpoint 是一个对记者来说必不可少的工具。如果你打算进行研究,无论是作为新闻记者还是学者,它都可以以非常直观的方式组织信息,并为你节省大量时间。
本文最初发表在 Online Journalism Blog 上,全球深度报道网获授权翻译转载。
Tony Jarne 是居住在英国伯明翰的自由撰稿人, 他拥有伯明翰城市大学数据新闻专业的硕士学位。