AI 推理能力之争：苹果结论遭专家挑战

2025-06-14 08:09:28

　　科技媒体 9to5Mac 昨日发布博文，报道称苹果公司 6 月 6 日发布的 AI 研究论文注：汉诺塔问题是一个经典的递归算法问题：上帝创造了三根柱子，并在第一根柱子上按顺序套有 N 个大小不同的圆盘。

　　规定每次只能移动最顶端的一个圆盘，并且保证整个过程中大圆盘不能放在小圆盘之上。欲将所有圆盘从第一根柱子移动到第三根柱子，试给出解决方案。

　　Open Philanthropy 的研究员 Alex Lawsen 近日发布反驳Lawsen 提出了三个核心问题，挑战苹果的结论。首先，他指出苹果其次，苹果的 River Crossing测试中包含无解谜题，例如 6 个以上角色搭配无法满足的船只容量限制，最后，为支持观点，Lawsen 重新设计了河内塔测试，要求模型生成递归 Lua 函数来打印解法，而非逐一列出所有步骤。

　　结果令人惊讶：Claude、Gemini 和 OpenAI 的 o3 模型均能Lawsen 得出结论：去除人为输出限制后，LRMs 展现出处理高复杂任务的推理能力，至少在算法生成层面是如此。这表明，问题可能不在于模型本身，而在于评估方式。