陶哲轩油管首秀：33分钟，AI速证「人类需要写满一页纸」的证明

39 0 0

文章摘要

陶哲轩最近以视频博主的身份亮相，首次发布的内容便引起了广泛关注。他展示了一个令人惊叹的案例：人类需要写满一页纸的数学证明，借助AI仅用33分钟就完成了。这一过程被称为“盲证”，即无需过多思考，完全依赖AI辅助完成。这一成果迅速引发了热议，许多人认为这具有历史意义。他的YouTube频道在短短一天内订阅数突破900，观看量超过两千，且仍在快速增长。

陶哲轩选择的命题是泛代数中的Magma方程E1689蕴含E2。尽管方程本身复杂，但AI辅助的证明过程却异常高效。他基于Bruno Le Floch的草稿，将其拆分为微小逻辑单元，通过GitHub Copilot生成代码骨架，并使用Lean的canonical策略填补细节，最终在Lean中通过了验证。这一过程不仅大幅缩短了时间，还满足了“人类可读性”的要求。Bruno Le Floch曾认为所有已知的E1689-E2证明都依赖计算机辅助，但后来他使用prover9 ATP给出了一个更具可读性的人类版本。陶哲轩建议，未来可以在论文中明确说明，尽管最初的证明由计算机生成，但研究者们成功将其转化为人类可读的证明。

陶哲轩通过多次尝试得出结论，这种半自动化的方法适用于技术性强、概念性弱的论证，即那些关注细节准确性而非整体概念理解的证明。他认为，AI辅助证明可以将数学家从繁琐事务中解放出来，专注于更高层次的研究。尽管最终结果“并不优雅”，但它展示了AI辅助证明的巨大潜力。值得注意的是，陶哲轩并非一次成功，前两次尝试都因各种问题而失败，但他最终完成了这一里程碑式的证明。

此外，陶哲轩开发的数学证明助手迎来了2.0版本升级。这是一个用Python开发的轻量级工具，旨在简化简短而繁琐的证明任务，特别是为渐近分析提供支持。在大模型的帮助下，他仅用四小时编程便完成了概念验证工具，并在两周内进行了全面改进。该助手目前有两种模式：假设模式和策略模式，后者类似于Lean、Isabelle或Rocq中的策略模式。策略列表包括命题策略、线性算术策略、替代策略和简化策略，支持扩展和自定义。

陶哲轩对该助手表示非常满意，并愿意接受进一步的建议或贡献新功能。他还计划开发用于估算符号函数的函数空间规范的工具，例如创建部署霍尔德不等式和索博列夫嵌入不等式等定理的策略。这一工具展示了AI在数学证明领域的广阔应用前景，为研究者提供了新的可能性。