标签:代码能力
杀上闭源前沿,国产最强已经无法满足 GLM-5.2 了
为了验证实际生产力,通过执行包含近两百万token的185篇论文整理与知识图谱网站生成任务进行了深度实测。实测表明,GLM-5.2展现出卓越的长链路任务保持、大规...
马斯克预测GLM明年Q1追平Fable,智谱唐杰:没那么久
全球最大AI开源社区Hugging Face为智谱开源的旗舰模型GLM-5.2提供连续六小时的全球免费算力,这是该社区首次为中国模型提供此类实质性支持。此前埃隆·马斯克...
国产 Coding 争霸赛:MiniMax 爆冷登顶,DeepSeek 性价比称王
近期一项针对五款国产旗舰大模型代码能力的评测显示,大模型的代码能力已从单纯的算法编写,进化为衡量逻辑推理、工具使用及实际工程生产力的基础设施级指标...
Kimi K2.7 Code 开源,代码能力全面提升,token 省30%
月之暗面正式发布Kimi K2.7 Code模型并开源,该模型在降低token消耗的同时全面提升了代码与智能体能力。K2.7 Code通过减少长程任务中的过度思考倾向,使平均t...
实测GLM-5.2,国产Coding模型的又一座新高峰。
近期,美国商务部以国家安全为由,要求Anthropic公司暂停外国公民对Fable 5和Mythos 5模型的访问权限,随后该公司决定将这两款模型对所有用户全面关停。这一...
Opus 4.8:一个不太诚实的模型
Anthropic近期发布了Claude Opus 4.8模型,此次升级被官方定义为温和但确实存在的改进,核心卖点聚焦于提升模型的诚实度与可靠性,同时在编码与智能体能力上...
Opus 4.8 刚发布,Redis 之父质疑跑分:DHH 盛赞的 GPT-5.5,正在动摇编码王座
Anthropic发布了其旗舰模型Opus的最新版本Opus 4.8,此次升级的核心聚焦于开发者工作流的优化,而非单纯的基准测试跑分。新版本引入了动态工作流和更具性价比...
Claude Opus 4.7发布:更强能力,自我纠错,越来越不需要人类干预了
Anthropic 正式发布了 Claude Opus 4.7 版本,标志着大模型在自动化工作流领域取得显著进展。新版模型具备独自执行更长、更复杂任务的能力,人类用户仅需在最...
GPT-5.4深夜发布,最适合OpenClaw的天选模型登场了。
开发OpenClaw工具的团队长期在Agent基座模型选择上陷入困境,原有的Claude Opus 4.6综合能力达标,可满足Agent开发的需求,但API价格高昂,且无法使用订阅额...
智谱也来炸场了。
近期AI领域迎来密集的技术更新,多家公司相继发布新一代大语言模型,展现出行业快速迭代的竞争态势。DeepSeek推出V3.2-Exp版本,通过稀疏注意力机制将推理成...
1
2



