首页

黑冰sM

时间:2025-05-28 17:15:59 作者:清华学霸与AI比做高考压轴题,谁会赢? 浏览量:44150

  作者:陆涵之

  去年,“9.11和9.9谁大?”这一简单的数学题曾难倒了多家大模型。到了今年,大模型的理科能力提升如何?

  今日网易有道发布了一则视频,6位清华姚班学生与AI比赛做高考压轴题。清华姚班为图灵奖得主姚期智院士创办,汇聚了数学、物理、信息学竞赛金牌得主。

  姚班学生和AI竞速的两道题分别为2023年高考数学全国一卷压轴题和2021年高考物理江苏卷压轴题。姚班学生在10分钟内完成了作答,仅有1位同学做错了题目,AI答疑笔则在输入确认后几秒就开始输出步骤,并答对了题目。

  对于AI的回答,一位姚班学生认为AI做题思路与其一致,步骤更加清晰,相较于传统的答案更有利于学生理解解题思路。

  可以对比的是,去年高考结束后,有机构让包括GPT-4o、豆包、文心4.0在内的9家大模型尝试河南的高考卷,并以河南的分数线评判,最终有4家大模型在文科高考中达到河南的一本线,但没有大模型的理科分数达到河南省一本线。

  有道相关负责人对记者表示,今年以来AI进展迅速,尤其是DeepSeek-R1带来了推理模型大爆发,而大模型推理能力和交互能力在教育场景的适配性非常高,能够逐步解决个性化教学和答疑的需求,而且提供的指导和答疑质量越来越高,所以选择与高考顶尖学霸进行同题测试,用一种直接明了的方式向大众展示AI大模型能力的提升。

  在题型选择上,主要基于难度和认知度的考量,上述负责人表示,“因为大家对高考的难度都是有概念的,尤其是这种高难度的理科压轴题,容易引起关注,也能直观展示效果。”

  上述人士透露,前段时间还做了北京最新高考二模(题库数据里没有的新题)的挑战。AI答题后由老师进行批改,分数为697分(总分750分),达到“清北”水平。“毕竟去年AI集体做24年高考题的时候理科几乎全军覆灭。”

  过去一年时间,不少大模型公司将数学能力作为大模型的能力体现。OpenAI在介绍OpenAI o3-mini时表示,OpenAI o3‑mini 的高推理能力在 FrontierMath 上的表现优于其前辈。在 FrontierMath 上,当被要求使用 Python 工具时,具有高推理能力的 o3‑mini 首次尝试即可解决超过 32% 的问题,其中包括超过 28% 的挑战性 (T3) 问题。FrontierMath是由Epoch AI联合60余位全世界的数学家共同推出了全新的数学基准,其原创的数学问题对于专业数学家而言仍需数小时甚至数日解决。不过,OpenAI公布的成绩后续曾遭到质疑。

  此前谷歌宣布推出了基于强化学习的数学推理系统 AlphaProof,以及几何求解系统的改进版 AlphaGeometry 2。谷歌表示这两款系统共同解决了2024年国际数学奥林匹克(IMO) 六道题目中的四道,首次达到了与银牌得主相当的水平。

  今年4月29日,阿里巴巴发布新一代通义千问模型Qwen3。据了解,在奥数水平的AIME25测评中,千问3斩获81.5分,刷新开源纪录。

  艾媒咨询发布的《2024年人工智能+教育行业发展研究报告》指出,2023至2027年在线教育市场的AI贡献率预计从7%提升至16%左右。

展开全文
相关文章
与绿同行 江西绿色交通发展如何驶入“快车道”?

据通报,郑州公安机关工作查明,2024年6月8日,网民王某某、覃某某为博取流量、涨粉获利,事先编造“剧本”,在某网络直播平台组织双方人员互相谩骂,煽动对立情绪,随后王某某、覃某某双方10人在郑州千玺广场附近直播摆拍约架,吸引7.8万人次网上围观,造成恶劣社会影响。目前,王某某、覃某某等10人被郑州公安机关依法采取刑事强制措施。

渝台民俗文化交流热络 在丰都为同胞祈福

“对历史最好的继承,就是创造新的历史;对人类文明最大的礼敬,就是创造人类文明新形态。”习近平总书记在文化传承发展座谈会上发出时代强音。

【新春纪事】“最听劝老板”雷鹏琳复工记 新年计划满足更多网友的愿望

硬地滚球比赛结束,中国香港队以3金2银占据该项目的金牌榜首位。中国队在巴黎实现了硬地滚球残奥会金牌零的突破,并以2枚金牌位居该项目金牌榜次席。

微信赞赏功能升级

美国究竟是如何在拉美“促进民主和人权”的呢?1823年,美国发表“门罗宣言”,声称“美洲是美洲人的美洲”,实际上是把美洲当作美国人独占的“后院”。美国总统西奥多·罗斯福曾公开宣称:“美国为了奉行‘门罗主义’,不得不行使国际警察的权力。”“门罗主义”提出200年来,美国采取各种手段攫取拉美自然资源,破坏拉美国家经济,干涉拉美国家内政,导致拉美国家经济衰退、社会动荡、不平等加剧。哈佛大学的一项研究表明,在1898年至1994年不到100年的时间里,美国政府在拉美地区策划和实施了至少41次政变,相当于每28个月就有一次。直到今天,“门罗主义”遗毒仍在。美国对“不听话”的拉美国家动辄制裁打压,还企图将拉美国家当作阵营对抗的棋子,强迫其选边站队。阿根廷国立拉普拉塔大学教授加布里埃尔·梅里诺指出,拉美和加勒比地区深受美国霸权伤害。

广西工程机械企业布局智能化、电动化出海 海外业务逆势上扬

陈昱廷,现任金鹰中国董事长。她的父亲陈江和是出生于印度尼西亚的华裔,也是最早一批来华投资的海外华商。改革开放至今,陈江和所创立的金鹰集团在华投资总额超900亿元人民币。父女二人分别于2003和2022年获得上海市人民政府授予的“白玉兰荣誉奖”和“白玉兰纪念奖”。陈昱廷说父亲就是自己的榜样,作为海外华商,她始终践行父亲“利民利国才能利业”的经营理念,参与到中国的时代变革之中。(周孙榆 范宇斌)

相关资讯
热门资讯
链接文字