银牌组最高分，谷歌 DeepMind 捅破 AI 数学推理上限：6 道国际奥数题解出 4 道

AI新闻2年前 (2024)发布 SUYEONE

10.3K 0 0

IT 之家 7 月 26 日消息，谷歌 De epMind 团队昨日（7 月 25 日）发布博文，表示其研发的 alphaProof 和 AlphaGeometry 2 模型可以解决数学中的高级推理问题，在解答国际数学奥林匹克竞赛难题方面达到银牌标准。

AI 模型简介

DeepMind 团队结合两个 AI 模型，协作解决了今年国际数学奥林匹克（IMO）6 道题目中的 4 道，首次在竞赛中取得与银牌得主同等的成绩。

评分团队

DeepMind 团队两位专家，根据 IMO 的评分规则进行评分，这两位专家分别为：

蒂莫西・高尔斯教授（Prof Sir Timothy Gowers）：著名数学家、IMO 金牌得主和菲尔兹奖得主。
约瑟夫-迈尔斯博士（Dr Joseph Myers）：两届 IMO 金牌得主、IMO 2024 年问题遴选委员会主席

AI 模型推理

AI 会将 IMO 的 6 道题目翻译成为模型可以理解的数学语言。

AlphaProof 通过确定答案并证明其正确性，解决了两个代数问题和一个数论问题，而其中解决的 1 个问题是比赛中最难的，在今年的 IMO 中只有 5 位选手解决了这一问题。

AlphaGeometry 2 证明了几何问题，没有解决 2 个组合问题。

AI 模型结果

按照 IMO 规则，6 道题目每道题可获得 7 分，总分最高为 42 分。

DeepMind 系统最终获得了 28 分，每个问题都得到了满分，相当于银牌组的最高分。

2024 年的金奖门槛从 29 分开始，在正式比赛中，609 名参赛者中有 58 人获得了金奖。

IT 之家附上参考地址

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

Source link

# AI新闻 # a # AI # e # er # 模型 # 规则 # 解决 # 语言 # 谷歌 # 跳转

文章版权归作者所有，未经允许请勿转载。

OPPO Find X7 Ultra 手机推送 14.0.1.640 版本：全新自研 AI 模型注入“超光影引擎”，号称“用极限算法改写物理极限”

SUYEONE

11.5K

Follow Your Pose – 开源的姿态全可控视频生成框架

SUYEONE

10.9K

文石 Note X3 Pro 阅读器获推 3.5.2 系统更新：图标重绘、新增 AI 大模型

SUYEONE

15.5K

布局 AI 等市场，格芯收购泰戈尔科技氮化镓技术和相关团队 – IT之家

SUYEONE

11.4K

微软 Win11 AI Explorer 新光标曝光，满足用户和指定内容交互需求

SUYEONE

11.7K

SK 集团会长崔泰源将人工智能比作“淘金热”：如果 AI 迟迟不赚钱，英伟达的“镐子”也可能卖不出去 – IT之家

SUYEONE

10.3K

暂无评论

暂无评论...

银牌组最高分，谷歌 DeepMind 捅破 AI 数学推理上限：6 道国际奥数题解出 4 道

AI 模型简介

评分团队

AI 模型推理

AI 模型结果

谷歌 Pixel 9 系列手机宣传物料曝光：主打 Gemini AI、12/16GB 内存、7 年安全更新

使用 AI 软件生成未经证实假新闻，一网民被处以行政处罚 - IT之家

相关文章

暂无评论

相关文章