“大模型第一股”打响上市前哨战！智谱GLM-4.7 刷新开源编程SOTA，修复代码、终端操作表现超Claude 4.5

362 0 0

文章摘要

智谱公司发布新一代大模型GLM-4.7，该模型主要提升编程与代理式任务能力，同时在推理等方面有所增强。当前大模型的发展重点已从“会答题”转向“能干活”，评测体系也相应变化，覆盖真实代码修改、终端操作等多场景。GLM-4.7在17项基准测试中与GPT-5等强劲对手竞争，并在AIME 2025和BrowseComp-ZH两项测试中刷新公开SOTA（最高技术水平），正确率分别达到95.7%和66.6%。此外，在SWE-bench-Verified和LiveCodeBench V6中也超过Claude Sonnet 4.5，刷新两项开源SOTA。

GLM-4.7在UI生成质量上实现显著飞跃。例如，在前端开发中，生成HTML网页的效率大幅提升，布局结构更清晰，配色更协调，风格覆盖更广。在交互式页面和3D艺术展示中，动态效果、空间层次和透视关系处理明显优于前代。幻灯片制作方面，16:9适配率从52%提升至91%，页面布局和元素比例更接近成品。海报设计的排版与配色也更具设计感，能够灵活突出主题而非简单罗列。

模型进步的根源在于其重构的推理机制。GLM-4.7采用“交织式思考+保留式思考+轮级思考”组合，提升复杂任务中的稳定性。交织式思考强化每次响应前的内部推理；保留式思考避免长链路任务中的信息丢失；轮级思考则允许按回合控制推理强度，平衡效率与精度。这一机制为代理式编程和长周期任务提供了技术基础。

此次发布正值智谱冲刺“大模型第一股”的关键阶段。公司已于12月19日通过港交所聆讯，估值达243.77亿元。经营数据显示其收入从2022年的0.6亿元增长至2025年上半年的1.9亿元，同比增幅超300%，85%收入来自本地化部署。但亏损同样快速扩张，2025年上半年经调整净亏损达17.52亿元，主要源于研发投入（占70%以上算力支出）。作为成立不到6年的公司，智谱始终聚焦模型能力，目前GLM架构已支持8000万台设备，服务超1.2万家机构客户。