标签:训练策略

推理快30%,性能超过千亿参数模型,15B模型Apriel-1.6重新定义端侧推理

ServiceNow人工智能团队最新发布的Apriel-1.6-15b-Thinker模型,以150亿参数的轻量级体量,在多模态推理能力上实现了显著突破。该模型不仅击败了体量大其十倍...

智谱AI、清华开源新视觉大模型:刷新41项纪录,同级别最强

智谱AI与清华大学联合开源最新视觉大模型GLM - 4.5V,其在多个领域表现卓越。测试数据显示,GLM - 4.5V在42项主流测试中创造41项新记录,尤其在视觉智能体方...

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力,训练步数仅需其1/10

大规模强化学习在激发大型语言模型的复杂推理行为方面展现出显著效果,OpenAI 的 o1 系列和 DeepSeek-R1 的成功便是明证。然而,这些模型的核心训练方法在技...