AI要担任数学助理多长时间?
时间:2025-06-19 09:12 作者:365bet体育注册

原始标题:AI成为数学家从科学到计算机再到医学再到国家安全需要多长时间?数学是许多主要应用程序的基础,但是在数学领域的发展可能需要数年才能实现。
在一百万岁中,数学使用简单的工具:一张纸和笔。通过逻辑和灵感,他们在符号迷宫中寻求通往现实的道路。
为了打破这种情况,美国于今年4月启动了国防高级研究项目局的“指数数学”计划,旨在为人工智能(AI)开发一个“合着者”系统,该系统可以提高数学研究的效率。
几十年来,数学家使用计算机来帮助计算或验证建议。 AI现在可以登顶,并挑战多年来未解决的问题。但是,可以解决高中和AI问题之间的AI之间仍然存在差距,这可以帮助克服MA这很困难。
仍然无法解决重大问题
大型语言模型(LLM)在数学方面不太好。他们经常有“造成兴趣”,并且可以廉价地相信2+2 = 5。但是,新一代大型理解模型(例如Openai's O3)所显示的发展,即对人类的Claude 4的想法,阐明了数学的启示。
今年,这些模型在美国数学邀请赛上的高中生级别接近。与过去的“持久”输出不同,这些模型开始思考数学逐渐推理的过程。
同时,一些将LLM与某些校园系统结合使用的新型混合动力模型也会产生突破。例如,Google的“深思语思维”字母系统结合了国际象棋AI -Alphazero中的语言模型,该模型已成为第一个在国际数学奥林匹克运动会中获得与银牌相同标记的系统。今年5月,Google的Alphaevolve M奥德尔(Odel)迈出了又一步,发现解决方案比现有的人类解决方案更好地解决了许多长期的数学和计算问题。
美国的“麻省理工学院技术评论”被教导说,即使这些AI成就是杰出的,专家通常认为他们仍然没有能力真正协助科学研究。尽管库姆的问题是困难的,但它们更像是知识游戏,并带有一些“活动”。真正的数学研究更加开放和复杂。当面对“ PS NP”和“ Rymann猜想”等重大问题时,AI仍然不能。
为了更准确地评估AI的功能,Startup Epoch AI去年启动了Fransemath测试,并共同设计了60多个数学的新问题,以防止该模型看到的培训数据。结果,LLM几乎与“提交空白纸”相同。
这些测试表明,即使AI在数学路上采取了措施,但在“合着者” RO面前还有很长的路要走le。
需要克服“推理链的额外长度”
对数学问题的仔细观察表明,MGA在某些方面相似:解决问题需要一系列持续的步骤,关键是要找到这些步骤。
加州理工学院的谢尔盖·古科夫(Sergei Gukov)经常在道路下教导贫困差异。高中数学只能走10到40个步骤,而诸如Riemann的想象力之类的困难问题可能会有多达数百万个步骤。
这种“非常长的道路”很难处理。就像在比赛后找到获胜的工资一样,AI应该找到正确的指数增长道路的正确解决方案。在数学中,这种复杂性比国际象棋游戏更大。
根据物理学组织网络今年2月的一份报告,为了应对这一挑战,Gukov团队开发了一种技术来打包许多步骤“超级步骤”,这相当于佩戴“巨型靴子”以涵盖漫长的旅程。他们设计了A S加强模型负责提出额外步骤的系统,另一个模型负责证明其推理。
这种方法在经典未解决的问题中取得了成功 - 安德鲁斯·柯蒂斯(Andrews Curtis)猜想。尽管尚未证明或撤销该猜测,但与AI相关,科学家已经撤销了40年已广泛提及的“反例”。有时,它被认为是证明投机是错误的基本基础。
牛津大学的数学家马丁·布里森(Martin Brison)表示:“删除错误的道路是科学研究中非常重要的一步。”
相信ITGUKOV的想法是,这种“压缩路径”适用于需要推理链的所有领域。他希望这种方法不仅会将AI推向其自然模式,还可以为数学研究带来新的独特成就。
真正的变化和突破仍然是人类
固定思维定势的发布是克服糟糕的数学probl的关键EMS。数学通常被认为是机械推理,而高级数学类似于实验,充满了反复试验,错误以及突然的解释。
这正是AI工具(例如Alphaevolve)的优势。它继续开发并改善LLM的问题解决代码,评估每个旋转结果与第二个模型结合使用,最后提出了比人更好的溶解。这种方法不仅提供了独立的探索,还可以随时支持人类干预,并提供灵感和指示。
澳大利亚悉尼大学的数学家乔迪·威廉姆森(Jody Williamson)强调,探索性的思想是主要数学。根据英国网站“新科学家”的说法,他与Meta合作开发了AI Patternboost系统,该系统基于数学思想产生类似的概念以帮助启发。 “这就像这里有很多有趣的事物。我不知道发生了什么,但是CA你想出这样的事情吗?”他说。
这种类型的头脑风暴对数学很重要,它是新想法的来源。以二十面体为例 - 古希腊人通过纯粹的推理发现了它,并且它的形状在自然界中并不存在,而是对数学的形成产生了深远的影响。威廉姆森(Williamson)希望AI还将在将来发现类似的“新数学事物”。
但是,AI仍然缺乏真正的创造力。这是让AI赢得国际象棋的东西,这是让它发明游戏的另一件事。诸如Alphaevolve和PatternBoost之类的工具可以用作人类直觉的“侦察”,该工具可以帮助人们发现路径并避免死胡同,但专家普遍认为,真正的变化和崩溃仍然存在于人们之中。
(编辑:Luo Zhizhi,Chen Jian)
遵循官方帐户:人 - 金融融资
分享让许多人看到