标签:编程能力

杨植麟亲自发布,月之暗面最强模型Kimi K2.5开源

月之暗面发布了迄今为止最强的多模态模型Kimi K2.5,该模型在Kimi K2基础上进行了约15万亿视觉与文本混合数据的持续预训练,具备顶尖的编程与视觉能力,并引...

DeepSeek-V4蓄势待发!梁文锋署名论文或开启第二个DeepSeek时刻

DeepSeek与北京大学联合发布的最新研究论文,展示了下一代模型DeepSeek-V4的架构基础。该模型预计将于2024年2月发布,具备强大的编程能力,可能超越当前市场...

客观聊聊 MiniMax 的新模型

MiniMax M2.1模型在编程能力和UI设计方面展现出显著进步,其技术表现已接近国际前沿水平。该模型针对Rust、Go等后端语言进行了专项优化,提升了高并发场景下...

“大模型第一股”打响上市前哨战!智谱GLM-4.7 刷新开源编程SOTA,修复代码、终端操作表现超Claude 4.5

智谱公司发布新一代大模型GLM-4.7,该模型主要提升编程与代理式任务能力,同时在推理等方面有所增强。当前大模型的发展重点已从“会答题”转向“能干活”,评测体...

GPT5.2发布:屠榜?不,是OpenAI在补课

OpenAI最新发布的GPT-5.2版本标志着人工智能模型在专业工作领域的重大突破。该版本在GDPval基准测试中,70.9%的任务表现达到或超越人类专家水平,较上一代的3...

GPT-5.2来了!首个「专家级」AI复仇成功,牛马打工人终于得救了

OpenAI近日发布了新一代GPT-5.2系列模型,包含Instant、Thinking和Pro三个版本,在多项专业任务中展现出显著优势。该系列模型在通用智能、长文本理解、工具调...

开源大模型SOTA又刷新!中国MiniMax M2全球排名第五,开源榜一

MiniMax作为中国AI独角兽企业,近期发布了专为智能体和代码任务设计的新一代模型M2,在开源领域刷新了多项性能纪录。M2以Claude Sonnet 8%的价格实现了近两倍...

节前重磅:开源旗舰模型新SOTA,智谱GLM-4.6问世

智谱AI正式发布新一代旗舰模型GLM-4.6,该模型在多个技术维度实现显著突破。作为GLM系列的最新版本,GLM-4.6不仅延续了开源策略(采用MIT协议),更在编码能...

DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4

DeepSeek V3.1新版正式上线,带来诸多显著更新与提升。其上下文长度拓展到128k,拥有685B参数,支持从BF16到FP8的多种精度格式。此次更新亮点丰富:编程能力...

GPT-5费尽心机“作弊”,只为超过心魔Claude

GPT5发布后未带来震撼,OpenAI聚焦大模型落地与应用,发布会上强调其编程能力,一众AI IDE工具也迅速接入。然而,有媒体披露OpenAI在编程能力测试中“作弊”,...
1 2 3