数学中国

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 155|回复: 0

《大西洋月刊》对话数学家陶哲轩:大模型可以完成常规事情,但非常缺乏想象力

[复制链接]
发表于 2024-11-13 13:17 | 显示全部楼层 |阅读模式
《大西洋月刊》对话数学家陶哲轩:大模型可以完成常规事情,但非常缺乏想象力

本文译自《大西洋月刊》 10 月 4 日刊发的对数学家陶哲轩的访谈文章《We're Entering Uncharted Territory for Math》。

作者:Matteo Wong 。

翻译:智能超参数。



陶哲轩(Terence Tao),加州大学洛杉矶分校的数学教授,被誉为现实生活中的“超级智能”。他有时被称为“数学界的莫扎特”,被广泛认为是当今世界上最伟大的在世数学家。他因其在数学上的突破性进展和证明而获得了众多奖项,其中包括数学领域相当于诺贝尔奖的荣誉。目前,人工智能还远远无法达到他的水平。

但科技公司正试图让人工智能达到这一水平。最近备受瞩目的几代人工智能——甚至包括强大的 ChatGPT ——并不是为处理数学推理而设计的。它们主要专注于语言:当你要求此类程序回答一个基本问题时,它并不会理解并执行方程或进行证明,而是基于哪个词更有可能出现在顺序中来给出答案。例如,最初的 ChatGPT 无法进行加法或乘法,但它看过足够多的代数示例,能够解答 x + 2 = 4 的问题:“为了解决方程 x + 2 = 4 ,先从两边减去 2 ……”然而,现在 OpenAI 明确推出了一系列名为“o1”的“推理模型”,宣称这些模型能够“像人一样”解决问题并处理复杂的数学和科学任务。如果这些模型成功,它们可能会为陶哲轩及其同行们的缓慢而孤独的工作带来变革。

在我看到陶哲轩在 X 上发布他对 o1 的印象后——他将其比作“一个平庸但不完全无能”的研究生——我想更深入地了解他对这项技术潜力的看法。在上周的一次 Zoom 通话中,他描述了一种由人工智能推动的“工业规模数学”,这是以前从未可能实现的:在这种未来中,至少在近期,人工智能并不是一种创造性的合作者,而是数学家们提出假设和方法的润滑剂。这种新的数学方式,可能会解锁未知的知识领域,但其核心仍将保持人类主导,并认识到人类和机器有着截然不同的优势,应该被视为互补而非竞争关系。

以下对话经过删减和编辑,以保证篇幅和清晰度。

Matteo Wong :你第一次使用 ChatGPT 是什么体验?

陶哲轩:我在它发布后就开始玩它了。我提出了一些困难的数学问题,它给出的结果相当差。虽然是连贯的英语,提到了正确的词语,但几乎没有什么深度。

对于任何真正高级的问题,早期的 GPT 完全不令人印象深刻。不过,它在一些有趣的事情上表现不错——例如,如果你想用诗歌或儿童故事的形式解释某些数学概念,这些就相当令人印象深刻。

Wong :OpenAI 声称 o1 可以“推理”,但你将其比作“一个平庸但不完全无能”的研究生。

陶哲轩:那个最初的措辞传播很广,但被误解了。我并不是说这个工具在研究生学习的每个方面都相当于一个研究生。我感兴趣的是将这些工具作为研究助理使用。一个研究项目有许多繁琐的步骤:你可能有一个想法,需要展开计算,但你必须手动完成并把所有内容都计算出来。

Wong :所以它是一个平庸或无能的研究助手。

陶哲轩:没错,它在作为那种助手时相当平庸。但我确实设想了一个未来,你可以通过与聊天机器人对话来进行研究。假设你有一个想法,聊天机器人可以跟随你的思路并填写所有细节。

这种情况已经在其他领域发生了。众所周知,人工智能早在几年前就征服了国际象棋,但国际象棋今天仍然蓬勃发展,因为一个相当不错的棋手可以猜测在某些情况下哪些棋步有效,然后他们可以使用国际象棋引擎来查看 20 步之后的情况。我可以想象这种事情最终也会发生在数学领域:你有一个项目,然后问,“如果我尝试这个方法会怎么样?”与其花费数小时真正尝试使其奏效,你可以指导 GPT 为你完成这项工作。

使用 o1 ,你在某种程度上可以做到这一点。我给了它一个我知道如何解决的问题,试图引导模型。首先我给了它一个提示,它忽略了提示,做了另一件事,结果没有成功。当我解释时,它道歉并说,“好的,我会按你的方法做。”然后它相当不错地执行了我的指示,但后来又卡住了,我不得不再次纠正它。模型从未发现最聪明的步骤。它可以完成所有常规的事情,但非常缺乏想象力。

研究生与人工智能之间的一个关键区别在于,研究生会学习。你告诉一个人工智能它的方法不行,它会道歉,可能暂时纠正方向,但有时它会回到之前尝试的方法。而且如果你开始一个新的人工智能对话,你又得从头开始。我对研究生更有耐心,因为我知道,即使一个研究生完全无法解决一个任务,他们也有潜力学习和自我纠正。

Wong :OpenAI 的说法是,o1 能够识别自己的错误,但你认为这与持续学习不同,持续学习才是使错误对人类有用的原因。

陶哲轩:是的,人类能够成长。这些模型是静态的——我对 GPT-4 提供的反馈可能会成为 GPT-5 的训练数据中的 0.00001% ,但这与学生的成长过程完全不同。

人工智能和人类在学习和解决问题的模式上有很大的不同——我认为最好把人工智能看作是完成任务的一种互补方式。对于许多任务来说,让人工智能和人类做不同的事情将是最有前途的。

Wong :你之前也提到,计算机程序可能会改变数学,并使人类更容易相互合作。具体如何呢?生成式人工智能在这方面有什么贡献吗?

陶哲轩:从技术上讲,它们不被归类为人工智能,但“证明助手”是有用的计算机工具,它们可以检查数学论证是否正确。它们使数学中的大规模合作成为可能。这是一个非常新的进展。

数学可能非常脆弱:如果证明中的一个步骤是错误的,整个论证可能会崩溃。如果你进行一个由 100 人参与的合作项目,你把证明分成 100 个部分,每个人贡献一部分。但如果他们彼此没有协调好,这些部分可能无法正确地拼接在一起。因此,在一个单一项目中看到超过五个人的情况非常罕见。

有了证明助手,你不需要信任与你合作的人,因为程序会给你 100% 的保证。这样,然后你就可以进行工厂生产式的、工业规模的数学,这在现在基本不存在。一个人只需专注于证明某类特定的结果,就像现代的供应链一样。

问题是,这些程序非常挑剔。你必须用一种专门的语言写出你的论证——你不能仅仅用英语写。人工智能可能能够在某种程度上将人类语言翻译成这些程序的语言。将一种语言翻译成另一种语言几乎正是大型语言模型的设计目的。理想情况是,你只需与聊天机器人进行对话来解释你的证明,聊天机器人就会在你说话的同时将其转换为证明系统语言。

Wong :所以,聊天机器人不是知识或想法的来源,而是一种接口方式。

陶哲轩:是的,它可以是一种非常有用的“粘合剂”。

Wong :这种方式可能会帮助解决哪些问题?

陶哲轩:经典的数学观念是,你选择一个非常难的问题,然后让一两个人锁在阁楼里,花七年时间不断尝试解决它。你希望用人工智能解决的问题类型恰恰相反。使用人工智能的天真方式是把我们在数学中最困难的问题输入给它。我认为这不会特别成功,现在已经有人在研究这些问题了。

我最感兴趣的数学类型是那些目前还不存在的数学。我几天前启动的一个项目,涉及一种叫做“通用代数”的数学领域,它研究某些数学陈述或方程是否意味着其他陈述为真。过去,人们研究这个领域的方式是选择一两个方程,然后深入研究它们,就像工匠以前一次做一个玩具,然后再做下一个。而现在我们有工厂;我们可以一次生产数千个玩具。在我的项目中,有大约 4000 个方程,任务是找到它们之间的联系。每个方程都相对简单,但有数百万种含义。像是有 10 个光点,10 个方程已经被相对较好地研究过,而剩下的是整个未知领域。

在其他领域,这种转变已经发生了,比如遗传学。过去,如果你想测序一个生物体的基因组,这就是一整个博士论文。现在我们有了这些基因测序机器,所以遗传学家正在对整个种群进行测序。你可以用这种方式进行不同类型的遗传学研究。同样,在数学中,我们可以从传统的狭窄而深入的研究,转向借助大量人工智能辅助、规模广泛但可能较为浅显的研究。这可能是获得数学洞察的一种非常互补的方式。

Wong :这让我想起谷歌 DeepMind 开发的 AlphaFold ,它解决了如何预测蛋白质的三维结构的问题,而这在过去是必须逐个蛋白质进行的长期工作。

陶哲轩:没错,但这并不意味着蛋白质科学已经过时了。你只需要改变你研究的问题。150 年前,数学家主要的用途是解决偏微分方程。现在有很多计算机程序包可以自动处理这个问题。600 年前,数学家们在建立正弦和余弦表,这些表用于导航,但现在计算机可以在几秒钟内生成这些表。

我对重复人类已经擅长的事情并不特别感兴趣,这看起来效率很低。我认为在人类和人工智能的最前沿,我们将始终需要两者的结合。它们各有所长。人工智能非常擅长处理数十亿条数据并得出一个好结果;而人类擅长从 10 个观察中做出真正有启发性的猜测。

记录 AI 技术与商业 智能超参数 2024 年 10 月 06 日 10:39 北京

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|数学中国 ( 京ICP备05040119号 )

GMT+8, 2024-11-25 04:07 , Processed in 0.098633 second(s), 17 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表