警惕人工智能助力的生物恐怖主义

Post Views: 137

英国《金融时报》科学评论员安贾娜•阿胡贾
本文作者是科学评论员

往下看，这里没什么可看的。这似乎是OpenAI上周传出的关于一项实验的信息，该实验测试其先进的人工智能聊天机器人GPT-4是否可以帮助精通科学的个人制造和释放生物武器。

OpenAI宣布，该聊天机器人对个人制造和释放生物武器的能力“最多提供了轻微的提升”，不过它补充说，迫切需要在这个问题上做更多的研究。头条新闻重复了令人欣慰的结论，即大型语言模型不是恐怖分子的“菜谱”。

然而，深入研究一下这项实验，事情看起来并不那么令人放心。在实验设想的过程的几乎每一个阶段，从采购生物制剂到扩大规模和释放它，有了GPT-4加持的实验参与者比仅使用互联网的对手更能接近他们的邪恶目标。

这次实验的主要收获不应该是一种放心感。“Open AI应该对这些结果感到相当担忧，”曾在美国参议院一个委员会就人工智能监管作证的评论员加里•马库斯(Gary Marcus)上周在他广为阅读的时事通讯中写道。

我们也应该担忧。我们需要更好的独立机制来切实评估和遏制这种威胁。正如我们不允许制药公司对药品的安全性做出裁决一样，人工智能风险评估也不能只留给人工智能行业自己。

OpenAI的研究人员要求100名经过筛选的志愿者——50名接受过基本生物学训练的学生，外加50名有湿实验室经验和病毒学等相关学科博士学位的专家——计划一次生物恐怖袭击，比如埃博拉大流行。上述两组50人中各有25人被随机分配使用互联网来研究他们的计划；另外25人可以同时使用互联网和GPT-4。

挑战本身分为五个任务：确定生物制剂并规划策略；获得该生物制剂；复制到足以制造生物武器的程度；配制和稳定生物武器；最后，释放。然后，外部生物安全专家根据参与者计划这些任务的准确性、完整性和创新性等五项指标，给参与者打分（满分为10分）。例如，确定正确的试剂、列出生产过程中正确的步骤、以及找到一种绕过安全防范措施的新方法可以获得高分。

能使用GPT-4的学生和专家都被判定比只能使用互联网的小组更准确。但最致命的组合是科学专业知识加上GPT-4。与只能使用互联网的专家相比，被允许使用不受限制版本的GPT-4、从而得到人工智能助力的专家得分多出0.88分（满分10分）。研究人员将引起担忧的阈值设定为8分（满分10分）；一些使用GPT-4的专家成功地达到了这一阈值，特别是在采购、扩大规模、配制和释放方面。

然而，这些发现被认为没有统计显著性，研究人员只是承认，不受限制版本的GPT-4“可能会提高专家获取生物威胁信息的能力”。但即使仅从表面上看，这些对照数据也提供了不同的看法：GPT-4使专家提出可行配方的几率增加了三倍。

实验报告作者也承认研究的其他局限性。虽然实验参与者是单独工作5小时，但恐怖分子可能一起工作几周或几个月。参与者无法使用全部GPT-4高级数据分析工具，研究人员承认，这些工具可以“大幅提高我们模型（策划攻击）的能力”。

OpenAI可以引用兰德公司(Rand Corporation)最近的一项研究来为其模棱两可的信息辩护，兰德公司的研究也发现，截至2023年夏季，与仅使用互联网相比，大型语言模型并没有使生物恐怖袭击计划在统计上更具可行性。

然而，兰德公司的研究人员确实承认，在一个未知的时间尺度上，形势正在发生变化。伦敦国王学院(King’s College London)科学与国际安全研究员菲利帕•伦佐斯(Filippa Lentzos)表示：“我们不应该夸大风险，但我们也不应该将其最小化。”她敦促各国政府和学术界参与评估此类威胁。

人工智能不断让人意外，GPT-4并不是唯一值得关注的模型。流氓国家、患精神病的不合群者和恶意组织将找到漏洞。上述实验只侧重计划，但远程“云实验室”的发展可能会改变有关执行的演算，在这些实验室中，实验可以分派给自动化设施。人工智能设计的毒素是一个额外的风险。

在整件事中，有很多东西值得一看——足以让人们对人工智能助长生物恐怖主义的能力进行多得多的思考。

相关文章：

发表评论 取消回复

发表评论取消回复