
文章摘要
陶哲轩最近以视频博主的身份亮相,首次发布的内容便引起了广泛关注。他展示了一个令人惊叹的案例:人类需要写满一页纸的数学证明,借助AI仅用33分钟就完成了。这一过程被称为“盲证”,即无需过多思考,完全依赖AI辅助完成。这一成果迅速引发了热议,许多人认为这具有历史意义。他的YouTube频道在短短一天内订阅数突破900,观看量超过两千,且仍在快速增长。
陶哲轩选择的命题是泛代数中的Magma方程E1689蕴含E2。尽管方程本身复杂,但AI辅助的证明过程却异常高效。他基于Bruno Le Floch的草稿,将其拆分为微小逻辑单元,通过GitHub Copilot生成代码骨架,并使用Lean的canonical策略填补细节,最终在Lean中通过了验证。这一过程不仅大幅缩短了时间,还满足了“人类可读性”的要求。Bruno Le Floch曾认为所有已知的E1689-E2证明都依赖计算机辅助,但后来他使用prover9 ATP给出了一个更具可读性的人类版本。陶哲轩建议,未来可以在论文中明确说明,尽管最初的证明由计算机生成,但研究者们成功将其转化为人类可读的证明。
陶哲轩通过多次尝试得出结论,这种半自动化的方法适用于技术性强、概念性弱的论证,即那些关注细节准确性而非整体概念理解的证明。他认为,AI辅助证明可以将数学家从繁琐事务中解放出来,专注于更高层次的研究。尽管最终结果“并不优雅”,但它展示了AI辅助证明的巨大潜力。值得注意的是,陶哲轩并非一次成功,前两次尝试都因各种问题而失败,但他最终完成了这一里程碑式的证明。
此外,陶哲轩开发的数学证明助手迎来了2.0版本升级。这是一个用Python开发的轻量级工具,旨在简化简短而繁琐的证明任务,特别是为渐近分析提供支持。在大模型的帮助下,他仅用四小时编程便完成了概念验证工具,并在两周内进行了全面改进。该助手目前有两种模式:假设模式和策略模式,后者类似于Lean、Isabelle或Rocq中的策略模式。策略列表包括命题策略、线性算术策略、替代策略和简化策略,支持扩展和自定义。
陶哲轩对该助手表示非常满意,并愿意接受进一步的建议或贡献新功能。他还计划开发用于估算符号函数的函数空间规范的工具,例如创建部署霍尔德不等式和索博列夫嵌入不等式等定理的策略。这一工具展示了AI在数学证明领域的广阔应用前景,为研究者提供了新的可能性。
原文和模型
【原文链接】 阅读原文 [ 1716字 | 7分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★☆