警惕人工智能助力的生物恐怖主义

英国《金融时报》科学评论员 安贾娜•阿胡贾
本文作者是科学评论员

往下看,这里没什么可看的。这似乎是OpenAI上周传出的关于一项实验的信息,该实验测试其先进的人工智能聊天机器人GPT-4是否可以帮助精通科学的个人制造和释放生物武器。

OpenAI宣布,该聊天机器人对个人制造和释放生物武器的能力“最多提供了轻微的提升”,不过它补充说,迫切需要在这个问题上做更多的研究。头条新闻重复了令人欣慰的结论,即大型语言模型不是恐怖分子的“菜谱”。

然而,深入研究一下这项实验,事情看起来并不那么令人放心。在实验设想的过程的几乎每一个阶段,从采购生物制剂到扩大规模和释放它,有了GPT-4加持的实验参与者比仅使用互联网的对手更能接近他们的邪恶目标。

这次实验的主要收获不应该是一种放心感。“Open AI应该对这些结果感到相当担忧,”曾在美国参议院一个委员会就人工智能监管作证的评论员加里•马库斯(Gary Marcus)上周在他广为阅读的时事通讯中写道。

我们也应该担忧。我们需要更好的独立机制来切实评估和遏制这种威胁。正如我们不允许制药公司对药品的安全性做出裁决一样,人工智能风险评估也不能只留给人工智能行业自己。

OpenAI的研究人员要求100名经过筛选的志愿者——50名接受过基本生物学训练的学生,外加50名有湿实验室经验和病毒学等相关学科博士学位的专家——计划一次生物恐怖袭击,比如埃博拉大流行。上述两组50人中各有25人被随机分配使用互联网来研究他们的计划;另外25人可以同时使用互联网和GPT-4。

挑战本身分为五个任务:确定生物制剂并规划策略;获得该生物制剂;复制到足以制造生物武器的程度;配制和稳定生物武器;最后,释放。然后,外部生物安全专家根据参与者计划这些任务的准确性、完整性和创新性等五项指标,给参与者打分(满分为10分)。例如,确定正确的试剂、列出生产过程中正确的步骤、以及找到一种绕过安全防范措施的新方法可以获得高分。

能使用GPT-4的学生和专家都被判定比只能使用互联网的小组更准确。但最致命的组合是科学专业知识加上GPT-4。与只能使用互联网的专家相比,被允许使用不受限制版本的GPT-4、从而得到人工智能助力的专家得分多出0.88分(满分10分)。研究人员将引起担忧的阈值设定为8分(满分10分);一些使用GPT-4的专家成功地达到了这一阈值,特别是在采购、扩大规模、配制和释放方面。

然而,这些发现被认为没有统计显著性,研究人员只是承认,不受限制版本的GPT-4“可能会提高专家获取生物威胁信息的能力”。但即使仅从表面上看,这些对照数据也提供了不同的看法:GPT-4使专家提出可行配方的几率增加了三倍。

实验报告作者也承认研究的其他局限性。虽然实验参与者是单独工作5小时,但恐怖分子可能一起工作几周或几个月。参与者无法使用全部GPT-4高级数据分析工具,研究人员承认,这些工具可以“大幅提高我们模型(策划攻击)的能力”。

OpenAI可以引用兰德公司(Rand Corporation)最近的一项研究来为其模棱两可的信息辩护,兰德公司的研究也发现,截至2023年夏季,与仅使用互联网相比,大型语言模型并没有使生物恐怖袭击计划在统计上更具可行性。

然而,兰德公司的研究人员确实承认,在一个未知的时间尺度上,形势正在发生变化。伦敦国王学院(King’s College London)科学与国际安全研究员菲利帕•伦佐斯(Filippa Lentzos)表示:“我们不应该夸大风险,但我们也不应该将其最小化。”她敦促各国政府和学术界参与评估此类威胁。

人工智能不断让人意外,GPT-4并不是唯一值得关注的模型。流氓国家、患精神病的不合群者和恶意组织将找到漏洞。上述实验只侧重计划,但远程“云实验室”的发展可能会改变有关执行的演算,在这些实验室中,实验可以分派给自动化设施。人工智能设计的毒素是一个额外的风险。

在整件事中,有很多东西值得一看——足以让人们对人工智能助长生物恐怖主义的能力进行多得多的思考。

发表评论

滚动至顶部