节前重磅:开源旗舰模型新SOTA,智谱GLM-4.6问世

文章摘要
智谱AI正式发布新一代旗舰模型GLM-4.6,该模型在多个技术维度实现显著突破。作为GLM系列的最新版本,GLM-4.6不仅延续了开源策略(采用MIT协议),更在编码能力、上下文长度、推理能力和工具调用等方面全面提升。特别值得注意的是,其上下文窗口从128K扩展至200K,更适合处理复杂的代码与智能体任务。在八大权威基准测试中,GLM-4.6性能超越Claude Sonnet 4/4.5,成为国产模型的性能标杆。
技术性能方面,GLM-4.6展现出多项核心优势。在74个真实编程场景测试中,其表现优于Claude Sonnet 4及其他国产模型,同时token消耗比前代降低30%以上,API价格仅为Claude的1/7。该模型还实现了硬件适配创新,首次在寒武纪芯片上完成FP8+Int4混合量化部署,为国产生态下的大模型本地化运行提供了可行方案。基于vLLM推理框架,该模型也能在摩尔线程新一代GPU上稳定运行。
实测验证显示GLM-4.6具备”零修改”一次性完成复杂编程任务的能力。从融合俄罗斯方块与贪吃蛇的游戏开发,到基于真实天文数据的太阳系3D建模,模型均能在1-2分钟内生成功能完整的代码。在接入Claude Code智能体后,其编程效率进一步提升,能够实现自动化任务调度和持续优化。特别值得注意的是,模型展现出接近人类程序员的”先规划、后执行”工作模式,这在全栈应用开发中表现尤为突出。
除编程能力外,GLM-4.6在内容创作和研究分析方面同样出色。在联网搜索支持下,模型能够快速梳理复杂主题(如OpenAI离职创业者调查),生成兼具叙事性和分析深度的专业报道。多模态功能方面,模型可自动检索素材并生成符合要求的视觉内容,如小红书风格封面图。通过space.z.ai平台,用户可直接部署由模型生成的全功能网页应用。
GLM-4.6的发布标志着国产大模型在技术架构、性能表现和使用成本等方面达到新高度。其突出的综合能力体现在:代码生成质量、需求理解深度、执行效率以及多模态整合等多个维度。作为全球开源AI领域的重要参与者,智谱AI通过GLM-4.6再次提升了行业标准,为专业工作流程提供了更强大的智能化支持工具。
原文和模型
【原文链接】 阅读原文 [ 3328字 | 14分钟 ]
【原文作者】 机器之心
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★