马斯克20万GPU训出史上最聪明AI，Grok 4重返地球之巅！人类博士全线溃败

1,751 0 0

文章摘要

Grok 4的发布标志着xAI在人工智能领域的一次重大突破。这一最新模型在多项基准测试中表现卓越，尤其在HLE（人类最后考试）中展现出博士级别的能力，能够解决涵盖数学、语言学、物理学等学科的复杂问题。其成功归因于海量算力的投入，包括20万块GPU的Colossus超算系统，以及强化学习和推理能力的优化。马斯克预测，Grok最早将在今年年底发明新技术，并在2025年发现新物理学。

模型的训练过程经历了显著的技术迭代。从Grok 2到Grok 4，xAI不仅扩展了预训练规模，还将算力重点转向推理和强化学习。团队通过工具集成进一步提升了性能，例如将企业级模拟工具融入训练框架。Grok 4 Heavy的推出体现了并行智能体协作的潜力，通过多智能体交互解决更高难度的现实问题。演示案例包括黑洞碰撞模拟和MLB夺冠概率预测，显示其对物理规律和商业场景的理解能力。

在应用层面，Grok 4展现出广泛的商业化前景。其Vending-Bench测试显示，模型能自主管理自动售货机运营，实现盈利。马斯克估算，大规模部署后年收入可达47亿美元，足以覆盖GPU算力成本。此外，模型在游戏开发、生物医药等领域的潜力也被重点提及，例如4小时内生成完整射击游戏的能力，预示了AI在内容创作中的颠覆性作用。

语音交互成为另一技术亮点。Grok 4的语音模式延迟降低50%，新增两种音色，并在实时对话测试中优于ChatGPT。多模态能力的短板（如图像处理）仍是改进方向，但第七代模型已在训练中。ARC-AGI测试显示，Grok 4是首个准确率突破10%的模型，在部分子任务中达到66.7%的准确率。

马斯克将当前定义为“智能大爆炸的起点”，强调AI价值观引导的重要性。他提出卡尔达肖夫等级理论，认为文明发展需要依赖AI突破能源利用极限。尽管承认技术风险，但他对AI推动经济发展的潜力持乐观态度。此次发布正值马斯克商业布局受政治环境影响之际，Grok 4的成功或将成为其战略转型的关键支点。