E9 和DeepSeek-Prover作者辛华剑聊「形式化数学」:数学的工业化,Agentic AI,Benchmark

E9 和DeepSeek-Prover作者辛华剑聊「形式化数学」:数学的工业化,Agentic AI,Benchmark

Published on Jun 12
1小时40分钟
海外独角兽
0:00
0:00
<p><em>Era of Experience</em> 这篇在 AI 社区讨论度很高的文章中提出:如果想实现 AGI,构建通用 Agent,就必须依靠“经验”,也就是模型和 Agent 在强化学习过程中自主积累的、人类数据集中没有的高质量数据。</p><p>DeepMind 的 AlphaProof 就被认为是这样一个典型案例,它靠 RL 算法自行“做题练习”,最终在数学领域,达到了超越人类的水平。以 AlphaProof 为开端,OpenAI 的 o1、DeepSeek 的 Prover-V2 等模型不断推动数学领域的进展,让数学证明成为了 AI 突破的新高地。</p><p>为什么 AI 研究中要特别关注数学证明能力?一方面数学领域的突破是模型能力提升的直接表现;另一方面,数学和代码类任务一样,不仅有严格的规则和格式,明确的推理路径,还有着对逻辑性、可验证性的高要求,这让数学类任务成为 RL 理想的训练环境。</p><p>这期内容我们请到了 DeepSeek-Prover 系列核心作者辛华剑,邀请华剑来和我们讲解数学和 AGI 之间的关系。华剑本科毕业于中山大学逻辑学,现在是爱丁堡大学人工智能方向的博士生,他目前专注于大模型在数学定理证明中的创新应用。</p><p><em><strong>友情提示:</strong></em><em>这期内容同时涉及 AI 和数学领域的硬核干货,点击查看对谈全文</em><a href="https://mp.weixin.qq.com/s/80fL-mQSyoJiyMuFmynwow"><em>文字内容</em></a></p><p><img src="https://bts-image.xyzcdn.net/aHR0cHM6Ly9zaGl4aWFuZ3RlY2guZmVpc2h1LmNuL3NwYWNlL2FwaS9ib3gvc3RyZWFtL2Rvd25sb2FkL2FzeW5jY29kZS8_Y29kZT1NbVl5TkROa05qRXpaVEUyWVRBd056WXpPREJqTUdVd01tSXlPV1ExTkRCZlozRlNPRE56UzJ4SU1XdDBhazlzYW5aelkwNVRWVXh2VlRoclMyUTVVVmhmVkc5clpXNDZTWGhxV0dKa09WaFViMWd4UkRGNFdsaD...