用户名:  密码:   
网站首页即时通讯活动公告最新消息科技前沿学人动向两岸三地人在海外历届活动关于我们联系我们申请加入
栏目导航 — 美国华裔教授专家网科技动向科技前沿
关键字  范围   
 
Nature:几何,AI来了
来源:X-MOL资讯 | 作者:甘棠 | 2024/1/25 21:52:36 | 浏览:1039 | 评论:0

几何,数学中研究空间结构及性质的一门学科,各位读者在中学肯定都学过一些,但学的好的有几何?笔者知道不少学霸小伙伴此时会潇洒一笑,心里默念“有我一个”,不过这里说的“学的好”,标准可能要稍微高一点点,不仅仅是会解答或证明高考试卷上的那些普通几何题,而是要挑战“国际数学奥林匹克竞赛(IMO)”这个难度级别的题目。下面是2023年第64界IMO的一道几何题 [1],各位“学的好”的小伙伴可以自行感知一下难度。

Nature:几何,AI来了

2023年第64界IMO的第2题。图片来源:IMO [1]

IMO面向全世界的高中生,但高中时有资格参加这项比赛的,无疑都是各个国家的数学大神。我国每年参加此项赛事的高中生只有6名左右,个个都是精英中的精英。此前颇受社交媒体关注的“韦神”,高一和高二时两次参加IMO都以满分成绩获得金牌,实打实的神级表现。

奥数这么难,当前红得发紫的人工智能(AI)怎么看?老实说,AI还真没什么看法,包括目前牛的不行的以ChatGPT为代表的各种大语言模型。不信的话,各位可以试一试让它们证明几道简单的初中几何题。究其原因,还是目前机器学习方法并不适用于大多数数学领域。以几何定理证明为例,将人类的证明转换为机器可验证的格式成本太高,训练数据非常稀缺,没有大量的训练,也就没有出色的AI。例如,谷歌为研究目的开发了一个名为Minerva的数学聊天机器人,训练数据来自人类撰写的高等数学论文和中小学水平的数学问题解答,尽管一般数学题目Minerva得出的数值解通常是正确的,但它对于解题思路的解释往往错误频出。“如果一个系统是用自然语言训练的,它输出的也是自然语言,这无法使人信服。”谷歌DeepMind的计算机科学家Trieu Trinh评论道。[2]

近日,谷歌DeepMind的计算机科学家Trieu Trinh、Thang Luong等人在Nature 发表论文,报道了一个欧几里得平面几何的AI定理证明器AlphaGeometry,能够以接近IMO金牌得主的平均水平解答IMO水平的几何题目。在一组包含30道IMO难度几何题目的测试中,AlphaGeometry解出了25道题,略低于IMO金牌得主的平均水平,而此前AI的最佳表现也不过是解出了10道题。重要的是,AlphaGeometry给出的证明人类完全能看懂。经人类专家评估,AlphaGeometry成功解出了IMO 2000年和2015年的所有几何题,这些题目在当时人类选手的评价中都是难题。

 Nature:几何,AI来了

2023年第64界IMO的第2题。图片来源:IMO [1]

IMO面向全世界的高中生,但高中时有资格参加这项比赛的,无疑都是各个国家的数学大神。我国每年参加此项赛事的高中生只有6名左右,个个都是精英中的精英。此前颇受社交媒体关注的“韦神”,高一和高二时两次参加IMO都以满分成绩获得金牌,实打实的神级表现。

奥数这么难,当前红得发紫的人工智能(AI)怎么看?老实说,AI还真没什么看法,包括目前牛的不行的以ChatGPT为代表的各种大语言模型。不信的话,各位可以试一试让它们证明几道简单的初中几何题。究其原因,还是目前机器学习方法并不适用于大多数数学领域。以几何定理证明为例,将人类的证明转换为机器可验证的格式成本太高,训练数据非常稀缺,没有大量的训练,也就没有出色的AI。例如,谷歌为研究目的开发了一个名为Minerva的数学聊天机器人,训练数据来自人类撰写的高等数学论文和中小学水平的数学问题解答,尽管一般数学题目Minerva得出的数值解通常是正确的,但它对于解题思路的解释往往错误频出。“如果一个系统是用自然语言训练的,它输出的也是自然语言,这无法使人信服。”谷歌DeepMind的计算机科学家Trieu Trinh评论道。[2]

近日,谷歌DeepMind的计算机科学家Trieu Trinh、Thang Luong等人在Nature 发表论文,报道了一个欧几里得平面几何的AI定理证明器AlphaGeometry,能够以接近IMO金牌得主的平均水平解答IMO水平的几何题目。在一组包含30道IMO难度几何题目的测试中,AlphaGeometry解出了25道题,略低于IMO金牌得主的平均水平,而此前AI的最佳表现也不过是解出了10道题。重要的是,AlphaGeometry给出的证明人类完全能看懂。经人类专家评估,AlphaGeometry成功解出了IMO 2000年和2015年的所有几何题,这些题目在当时人类选手的评价中都是难题。

 Nature:几何,AI来了

AlphaGeometry合成数据生成过程。图片来源:Nature

这些研究者认为,用自动生成的合成数据来训练AlphaGeometry,可以建立一个不依赖于人类数据的系统,如此AlphaGeometry就有希望在未来获得超越人类的能力。此外,使用合成数据来训练AI还有另外一个好处,就是可以消除典型大语言模型用于数学问题时的潜在陷阱——作弊,毕竟大语言模型训练数据量巨大,很难保证这个模型以前没有遇到过用户提交的数学问题。

 Nature:几何,AI来了

所生成的合成数据分析。图片来源:Nature

AlphaGeometry通过一步一步地猜测来解决问题,就像聊天机器人生成文本一样。但这也意味着它的输出是机器可读的,并且易于检查其准确性。对于每个问题,AlphaGeometry都会生成解决方案的多种尝试,然后自动清除错误的内容,最终可靠地生成正确的结果,包括IMO的几何题。这样看来,AlphaGeometry将语言模型统计猜测与符号推理结合在一起,也是其优异表现的基础。具体来说,AlphaGeometry在一组包含30道IMO难度几何题目的测试中解出了25道题,略低于IMO金牌得主平均25.9题的水平,高于IMO银牌的平均22.9道、铜牌的平均19.3道以及所有选手的平均15.2道。相比之下,此前最佳AI的表现只是解出了10道题,明显低于IMO参赛选手的平均水平。

 Nature:几何,AI来了

AlphaGeometry证明几何定理接近IMO金牌得主的平均水平。图片来源:Nature

有意思的是,AlphaGeometry不仅成功解出了IMO 2000年和2015年的所有几何题,还在IMO 2004年第1题中发现了一个可有可无的条件(如下图)。这也就是说,AlphaGeometry发现了一个比原题结论更加广义的定理。

 Nature:几何,AI来了

AlphaGeometry的新发现。图片来源:Nature

当然,目前AlphaGeometry的水平还没有达到人类最高的水平——历年IMO都不乏满分金牌选手。而且,几何只是IMO的一个版块,对于AI来说,解决其他领域的IMO问题(如数论、组合)可能要困难得多。不过,谁又能小瞧AI的进步速度呢,毕竟例子摆在那里:围棋领域里AlphaGo与人类顶尖棋手对弈,从互有胜负到难求一败也就用了一年左右的时间。


相关栏目:『科技前沿
如何让你的kegg注释结果图分门别类 2024-05-10 [58]
苹果深夜扔出M4核弹,iPad Pro碾压所有AI PC!280亿晶体管3nm工艺称霸地表 2024-05-10 [449]
无心插柳:苏联数学家柯尔莫哥洛夫与神经网络的新生 2024-05-10 [54]
刚刚,AlphaFold 3 登上 Nature:所有生命分子的结构和相互作用,都被 AI 预测了 2024-05-09 [97]
史上最强iPad发布,能取代你家电脑吗? 2024-05-08 [132]
机械宇宙是人类最崇高的幻想 2024-05-08 [76]
从量子中窥探宇宙的奥秘 2024-05-08 [67]
地球自转那么快,为什么我们不会被甩出去? 2024-05-08 [62]
OpenAI泄密者,投奔马斯克 2024-05-08 [96]
硬核解决Sora的物理bug!美国四所顶尖高校联合发布:给视频生成器装个物理引擎 2024-05-06 [78]
相关栏目更多文章
最新图文:
:引力波天文台或有助搜寻暗物质粒子 :Sail Through the Mist - SoCal Innovation Forum 2019(10/5) 游天龙:《唐人街》是如何炼成的:UCLA社会学教授周敏的学术之路 :“为什么海外华人那么爱国,但是让他回国却不愿意?...“ :学术出版巨头Elsevier 彻查433名审稿人“强迫引用”黑幕 :中国336个国家重点实验室布局 :中澳政府联合出手打击洗钱和逃税漏税 大量中国居民海外账户遭冻结 :摄影师苏唐诗与寂寞百年的故宫对话6年,3万张照片美伦美奂
更多最新图文
更多《即时通讯》>>
 
打印本文章
 
您的名字:
电子邮件:
留言内容:
注意: 留言内容不要超过4000字,否则会被截断。
未 审 核:  是
  
关于我们联系我们申请加入后台管理设为主页加入收藏
美国华裔教授专家网版权所有,谢绝拷贝。如欲选登或发表,请与美国华裔教授专家网联系。
Copyright © 2024 ScholarsUpdate.com. All Rights Reserved.