近日,人工智能的影子再次出现在了一个新的赛道。5月6日,15部作品被授予普利策新闻奖,其中两位普利策奖获得者在报道中使用了人工智能工具。调查新闻开始依靠机器学习,标志着新闻业的一个重要里程碑。
据报道,在今年普利策新闻奖45名决赛入围者中,共有5人在研究、报告或起草故事时使用了人工智能工具。虽然在全美各地的新闻编辑室针对生成式人工智能的评价褒贬不一,但从得奖情况来看,这一方式仍有其可取之处。
普利策奖负责人马乔里·米勒 (Marjorie Miller) 在尼曼新闻实验室网站当地时间5月9日刊发的采访中表示,此前并没有注意到任何关于直接使用人工智能的先例,先前的数据显示,获胜者可能使用了低级的机器学习应用程序。但此次是第一次明确提出这个问题。这也促使普利策中心进一步关注调查记者对人工智能的使用情况。
据尼曼新闻实验室网站称,获奖作品之一是来自非营利组织“City Bureau”和“隐形研究所”(Invisible Institute)记者的调查文章《在芝加哥失踪》,他们在调查中使用了机器学习,深入研究了数千份警察不当行为档案。另一个是《纽约时报》的视觉调查部门,利用数据驱动的视觉模型,根据视觉线索识别约907公斤重的炸弹弹坑,揭示了炸弹袭击加沙平民安全区的情况。
其他三名决赛入围者也将人工智能融入到他们的报道中,涵盖飓风伊恩、佛罗里达州退休社区的问题以及美国的枪支暴力等主题。
在采访中,这些普利策奖获得者强调了人工智能在调查性新闻中的积极和建设性作用,同时他们也表示,人工智能并未完全替代人类工作,数据工作必须扎根于“真实的人”。
基于特定社区的数据新闻
《在芝加哥失踪》获得了今年的普利策奖地方报道奖(Pulitzer for Local Reporting),该系列揭露了芝加哥警察局在调查失踪和谋杀黑人妇女方面的系统性失误。“City Bureau”和“隐形研究所”经过多年的调查,利用名为“朱迪”的机器学习工具来分析2011年至2015年警察不当行为记录和档案中的文本,最终得出了重要的发现。
“隐形研究所”数据主任崔娜·雷诺尔德泰勒(Trina Reynolds-Tyler)透露,“分析文本主要是那些含有叙事内容的文件。”
雷诺尔德泰勒早在2021年就开始开发“朱迪”,来自芝加哥社区成员的200名志愿者阅读并手动标记了不当行为档案,创建了“朱迪”的训练数据。
四年后,“朱迪”分析出54项与失踪人员有关的警察不当行为案例。这54个案例成为了《在芝加哥失踪》报道的路线图。它们证实了近年失去亲人家庭的痛苦被忽视。事实证明,这些案例并非孤立,而是芝加哥警察局系统性失败的一部分。
雷诺尔德泰勒认为,选择社区成员作为志愿者非常关键。虽然他们不是人工智能领域的专家,没有使用描述机器学习算法的语言,但他们拥有外包数据标记者无法获得的经验。“数据工作必须扎根于真实的地方和真实的人。”
在谈到调查报道中采用人工智能时雷诺尔德泰勒表示,“我们必须让人们与我们一起走向未来。人工智能可以帮助你看到你需要看到的地方,也可以帮助你寻找答案。”
利用人工智能“大海捞针”
在另一个普利策获奖案例中,《纽约时报》的视觉部门于2023年12月发表了一篇关于加沙冲突的报道。该团队训练了一种工具来识别重达907公斤的炸弹留下的弹坑,这是以色列在加沙造成大规模破坏的主要武器。研究小组利用卫星图像在加沙南部,特别是在被标记为对平民安全的地区发现了数百个弹坑,揭示了以色列军事行动的影响。
在团队中,研究计算报告方法的记者伊尚·贾维利(Ishaan Jhaveri)说:“人工智能工具本质上只是强大的模式识别器。”他解释说,如果需要为一个调查项目梳理大量的材料,可以训练一个人工智能算法来知道你在寻找什么样的模式。
而在调查中,贾维利的团队使用了目标检测算法。他们转向第三方平台Picterra去训练算法,该平台允许他们在卫星图像中手动选择弹坑,慢慢地训练Picterra,使其自动地做同样的工作。
调查组最终发现,截至2023年11月17日,在加沙南部有200多个符合描述的弹坑,对在加沙南部寻求安全的平民构成了“普遍的威胁”。
谈到对人工智能的使用,贾维利说:“我们没有使用人工智能来替换本来可以手动完成的工作。我们之所以使用人工智能,是因为它可以帮助调查记者大海捞针。”