文章摘要
【关 键 词】 大模型、编程能力、开源模型、推理机制、上市冲刺
智谱公司发布新一代大模型GLM-4.7,该模型主要提升编程与代理式任务能力,同时在推理等方面有所增强。当前大模型的发展重点已从“会答题”转向“能干活”,评测体系也相应变化,覆盖真实代码修改、终端操作等多场景。GLM-4.7在17项基准测试中与GPT-5等强劲对手竞争,并在AIME 2025和BrowseComp-ZH两项测试中刷新公开SOTA(最高技术水平),正确率分别达到95.7%和66.6%。此外,在SWE-bench-Verified和LiveCodeBench V6中也超过Claude Sonnet 4.5,刷新两项开源SOTA。
GLM-4.7在UI生成质量上实现显著飞跃。例如,在前端开发中,生成HTML网页的效率大幅提升,布局结构更清晰,配色更协调,风格覆盖更广。在交互式页面和3D艺术展示中,动态效果、空间层次和透视关系处理明显优于前代。幻灯片制作方面,16:9适配率从52%提升至91%,页面布局和元素比例更接近成品。海报设计的排版与配色也更具设计感,能够灵活突出主题而非简单罗列。
模型进步的根源在于其重构的推理机制。GLM-4.7采用“交织式思考+保留式思考+轮级思考”组合,提升复杂任务中的稳定性。交织式思考强化每次响应前的内部推理;保留式思考避免长链路任务中的信息丢失;轮级思考则允许按回合控制推理强度,平衡效率与精度。这一机制为代理式编程和长周期任务提供了技术基础。
此次发布正值智谱冲刺“大模型第一股”的关键阶段。公司已于12月19日通过港交所聆讯,估值达243.77亿元。经营数据显示其收入从2022年的0.6亿元增长至2025年上半年的1.9亿元,同比增幅超300%,85%收入来自本地化部署。但亏损同样快速扩张,2025年上半年经调整净亏损达17.52亿元,主要源于研发投入(占70%以上算力支出)。作为成立不到6年的公司,智谱始终聚焦模型能力,目前GLM架构已支持8000万台设备,服务超1.2万家机构客户。
原文和模型
【原文链接】 阅读原文 [ 1787字 | 8分钟 ]
【原文作者】 AI前线
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★☆☆




