The Illusion of Thinking

The Illusion of Thinking

Published on Jun 19
7分钟
readthepapers
0:00
0:00
<p>该论文<strong>深入探讨了大型推理模型(LRMs)在解决复杂问题时的能力与局限性</strong>。研究人员通过<strong>受控的益智游戏环境</strong>而非传统的数学基准测试,系统地评估了这些模型。他们发现,<strong>LRMs的表现会随着问题复杂度的增加而急剧下降</strong>,并且在达到某个临界点后,模型即使有足够的计算预算,其<strong>推理努力(思考的token数量)反而会减少</strong>。研究还揭示了LRMs在低复杂度任务中不如标准大型语言模型(LLMs)效率高,在中等复杂度任务中表现出优势,但在高复杂度任务中则完全失效,这表明了当前<strong>LRMs在泛化推理能力上的根本性限制</strong>。</p><p>Source: &lt;https://arxiv.org/abs/2506.06941&gt;</p>