人工智能常常受到批评,因为它会编造看似真实的信息,这被称为幻觉。
这些可信的虚假信息不仅搅乱了聊天机器人的对话,还引发了诉讼和篡改医疗记录。
去年,一款新推出的谷歌聊天机器人的一条明显虚假声明一度使该公司市值估计蒸发了1000亿美元。
然而,在科学领域,创新者发现,AI的幻觉实际上非常有用。
智能机器实际上创造出了许多不真实的场景,帮助科学家追踪癌症、设计药物、发明医疗设备、发现天气现象,甚至赢得诺贝尔奖。
公众认为这一切都是坏事,计算机科学家艾米·麦格文说,但其实它给了科学家新的想法。
它给了他们探索原本可能不会想到的新想法的机会。
科学界给人的印象是冷静而分析的。
但在发现的早期阶段,猜测和大胆的假设却充斥着这个过程。
保罗·费耶拉本德曾用“什么都行”来形容这一自由探索的过程。
现在,AI的幻觉正在重新激发科学的创造性方面。
它们加速了科学家和发明家构想新想法并测试这些想法的过程,使其与现实相符的速度大大加快。
这是一种经过增强的科学方法。
原本需要几年时间完成的研究现在可以在几天、几小时甚至几分钟内完成。
在某些情况下,加速的研究过程帮助科学家开拓新的领域。
“我们正在探索”,麻省理工学院教授詹姆斯·J·柯林斯说,“我们让模型生成全新的分子。
”AI幻觉发生在科学家向生成式计算机模型介绍某一特定主题后,然后让机器重新处理这些信息。
结果可以从微妙且错误的方向到超现实主义不等。
有时它们会带来重大发现。
今年10月,来自华盛顿大学的大卫·贝克因其在蛋白质研究方面的开创性工作获得了诺贝尔化学奖——蛋白质是赋予生命活力的复杂分子。
“诺贝尔委员会赞扬他发现了如何快速构建自然界中不存在的新类型蛋白质”,贝克在接受诺贝尔奖宣布前的采访中提到,“他的成就几乎是不可能的。
”他补充说,“AI想象爆发是实现从头合成蛋白质的关键。
”
他的实验室设计了多少种蛋白质?“一千万种——全部都是全新的”,他回答道,“它们不存在于自然界中。
”尽管AI幻觉在发现方面具有吸引力,但一些科学家认为“幻觉”这个词本身具有误导性。
他们认为生成式AI模型的想象并非虚幻而是有可能实现的想法——就像科学方法早期阶段提出的猜想一样。
“幻觉”这个词被认为不准确,并因此避免使用。
“幻觉”这个词也因其可能让人联想到LSD等致幻药物引发的心理幻觉而受到批评,这使得一些有声望的科学家几十年来都对此避之不及。
另一个缺点是通过AI生成的科学和医学交流可能会像聊天机器人回复一样被虚假信息所混淆。
今年7月,白宫发布了一份关于促进公众对AI研究信任度提升的报告。
报告中唯一提到“幻觉”的地方是关于如何减少它们的方法。
“诺贝尔委员会在其对贝克工作的详细审查中没有提及‘幻觉’一词”。
相反,在新闻稿中仅简单地称赞他的团队一次又一次地创造了富有想象力的蛋白质创造物。
越来越多的部分科学界似乎将“幻觉”视为不可言说的话题。
尽管如此,在采访中专家们表示与聊天机器人及其同类相比,科学研究中的想象有显著优势。
最基本的是这些创造性爆发根植于自然和科学的事实而非人类语言或互联网模糊的信息。
“我们正在教AI物理学”,加州理工学院数学与计算机科学教授阿尼亚·安纳德库马尔说,“对于科学来说,物理基础的事实可以产生高度准确的结果。
”她表示聊天机器人的大型语言模型无法验证其陈述和断言的正确性。
“最终检查”,她说,“来自于科学家将数字幻想与物理现实的具体细节进行比较。
”
安纳德库马尔说:“你需要测试它。
”最近安纳德库马尔及其同事利用AI幻想帮助设计了一种新型导管大大减少了细菌污染——全球每年导致数百万人患上尿路感染的问题。
“团队的人工智能模型想出了数千种导管几何形状,并从中挑选出最有效的那种。
”新导管内部壁面覆盖着锯齿状突起以防止细菌附着并逆流感染患者的膀胱。
“团队正在讨论该设备的商品化问题。
”
回响其他科学家的观点,安纳德库马尔不喜欢“幻觉”这个词,并且她的团队在关于新导管的研究论文中也避免使用这个词。
另一方面,在纽约市纪念斯隆凯特琳癌症中心领导一个实验室的研究员哈里尼·维拉拉阿加万引用了使用AI来锐化模糊医学图像的研究论文中的术语:“人工MRI”。
标题部分读作:“人工MRI”,即磁共振成像。
“德克萨斯大学奥斯汀分校的研究人员也接受了这一术语。
”他们的论文标题为:“从人工中学到的东西”,意为提高机器人导航能力的方法。
“深度思维”的伦敦分部负责人普什米特·科希利也赞扬了“幻觉”,他在两位同事今年与贝克共同获得诺贝尔化学奖后不久就发表了这一观点。
“我们拥有这种令人惊叹的工具可以展示创造力”,科希利在采访中说道,“例如2016年我们的计算机击败了围棋世界冠军的故事就是个例子。
”游戏的关键转折点是第37步棋,在比赛初期就出现了。
“我们认为那是个错误”,他说,“但随着比赛进行人们意识到那是一个天才般的举动。
”因此这些模型能够产生非常新颖深刻的见解。
麦格文说:“我们需要测试它。
”贝克近期获得诺贝尔奖后采用了坦率的方法:“从头设计蛋白质的人工神经网络幻想”。
其中“从头”一词意为“从基础开始”。
这与20世纪80年代初科学家开始调整已知天然蛋白质结构形成了鲜明对比。
2003年贝克和他的同事们实现了更加雄心勃勃的目标:制造出第一个完全从头开始的新蛋白质——他们称之为Top7。
“他们的成就被视为重大进步是因为蛋白质是超级复杂的明星分子”。
专家们将DNA结构比作珍珠串而大型蛋白质结构比作一团毛线球。
“它们结构如此复杂以至于即使详细的图形表示也只是粗略近似。
”
随着人工智能成为一种强大的新技术工具,贝克想知道它是否能加速从头设计过程。
“2021年发表在《自然》杂志上的一篇论文提到了谷歌DeepDream模型——该模型将现有图像转化为迷幻风格的作品”。
当人们看到满月时看到人脸的现象被称为“似曾相识感”,即感知上的错觉将模糊模式转化为有意义的形象的一种感知偏差。
“DeepDream使用的正是这种倾向来创造其超现实主义幻想。
”
贝克计划尝试让人工智能对模棱两可的一组氨基酸序列施加“似曾相识感”的影响——氨基酸是蛋白质的基本构建块。
“他的团队向训练识别真实蛋白质结构特征的模型输入随机氨基酸序列串。
”结果如预期所示——令人惊叹地成功了。
论文称测试运行创建了数千种虚拟蛋白质,并将其比作互联网上生成的人工智能猫图像爆炸式增长的现象:“正如由深度网络幻想生成的人工智能猫图像清晰可辨为猫一样”,论文指出,“同样人工蛋白结构与天然结构相似但并不完全相同”。
随后贝克团队试图将想象中的蛋白质变成现实——类似于将数字猫变为真实的过程:首先团队利用想象中的分子信息作为蓝图生产形成基因组DNA链的信息;然后正如2021年的论文所述,在基因被插入微生物后微生物迅速生产出129种未知于科学界和自然界的新类型蛋白。
此后在2022年初贝克描述了这一时刻作为通过人工智能加速从头设计蛋白的第一项示范性成果;他后续发表于2022年和2023年的论文标题再次使用了“幻觉”一词。
在一次采访中贝克表示其实验室已利用一种名为扩散的方法进一步推进了创造性的想象进程——这是DALL-E、Sora和其他流行视觉生成器的力量所在;他称赞扩散方法比传统方法更能创造出新颖蛋白设计且速度更快成功率更高:“它更快而且成功率更高”。
近年来一些分析师担心科学研究正在衰退;他们指出过去几十年间突破性发现的数量有所下降;支持人工智能的人士则认为其创造力爆发正在挽救这一局面;未来几年将在蛋白催化剂领域迎来波澜壮阔的发展前景:捕获阳光能量、改造旧工厂成为节能装置以及助力创造可持续新世界的浪潮即将到来。
“加速过程一直在发生”,贝克团队成员伊恩·C·海登说,“令人难以置信”。
其他人也同意这一观点:“未来几年将会出现令人惊叹的新事物”,科希利说道;他认为人工智能将揭示生命的最深层秘密并建立强大的新基础用于治愈疾病、改善健康延长寿命;一旦我们真正理解生命的语言他说那将是神奇的一刻。
本文最初出现在《纽约时报》上。