AI 推理能力之争:苹果结论遭专家挑战

2025-06-14 08:09:28

  科技媒体 9to5Mac 昨日发布博文,报道称苹果公司 6 月 6 日发布的 AI 研究论文注:汉诺塔问题是一个经典的递归算法问题:上帝创造了三根柱子,并在第一根柱子上按顺序套有 N 个大小不同的圆盘。

  规定每次只能移动最顶端的一个圆盘,并且保证整个过程中大圆盘不能放在小圆盘之上。欲将所有圆盘从第一根柱子移动到第三根柱子,试给出解决方案。

  Open Philanthropy 的研究员 Alex Lawsen 近日发布反驳Lawsen 提出了三个核心问题,挑战苹果的结论。首先,他指出苹果其次,苹果的 River Crossing测试中包含无解谜题,例如 6 个以上角色搭配无法满足的船只容量限制,最后,为支持观点,Lawsen 重新设计了河内塔测试,要求模型生成递归 Lua 函数来打印解法,而非逐一列出所有步骤。

  结果令人惊讶:Claude、Gemini 和 OpenAI 的 o3 模型均能Lawsen 得出结论:去除人为输出限制后,LRMs 展现出处理高复杂任务的推理能力,至少在算法生成层面是如此。这表明,问题可能不在于模型本身,而在于评估方式。

下一篇:苹果将在上海举办“探索 WWDC25 上公布的重大更新
上一篇:消息称《GTA6》将允许音乐人自主上传作品至游戏
返回顶部小火箭