标签:数据质量
10B超越Gemini-2.5-Pro!阶跃星辰端侧多模态天花板开源
阶跃星辰多模态智能团队最新开源的STEP3-VL-10B模型以100亿参数规模实现了超越千亿参数模型的性能突破。该模型在数学推理、视觉感知及复杂指令遵循等任务中,...
缩放定律Scaling正慢性死亡,算力收益递减,AI的下一个增长极是模型如何交互
AI领域正经历一场深刻的观念变革,传统缩放定律的统治地位开始动摇。前Google Brain科学家Sara Hooker的研究指出,过去十年被奉为圭臬的'更大即更好'原则正面...
大模型开发者必读!拆解世界级AI模型的诞生,Hugging Face把4年模型训练经验写成了一本开源指南
Hugging Face发布的《The Smol Training Playbook》手册,由12位顶尖工程师团队撰写,系统总结了构建世界级大语言模型的核心方法论。手册开篇便颠覆性地指出...
喂了几个月的垃圾推文,大模型得了「脑腐」,这病还治不好
德克萨斯 A&M 大学、德克萨斯大学奥斯汀分校和普渡大学的研究团队通过实验证实,大语言模型(LLM)长期接触低质量网络内容会导致认知能力显著下降,这种现象...
小扎豪掷143亿,却换不来AI燃料!数据之争下半场,中国冲出一匹黑马
在AI产业的发展进程中,数据的重要性日益凸显,高质量数据正成为决定AI上限的关键因素,全球“数据大战”已进入下半场。科技巨头们为获取高质量数据展开激烈角...
热议!DeepSeek V3.1惊现神秘「极」字Bug,模型故障了?
DeepSeek 最新的 V3.1 模型上线不到一周,因离奇 Bug 引发社区热议。该模型无论执行写代码还是整理物理试卷等任务,都会莫名其妙在文本中插入「极」字,甚至...
Meta华人新秀毕树超,重磅爆料下一代LLM路线!RL+预训练直通AGI
在哥伦比亚大学的演讲中,OpenAI前研究员毕树超深入探讨了通用人工智能(AGI)的发展路径与核心挑战。AGI的实现不仅需要跨领域泛化能力,还需与环境互动并适...
技术更新 or 组织重塑,企业如何用好“数据智能”?
大模型技术的快速发展正在深刻改变数据管理与分析的方式,Chat BI、Agent+Workflow等应用使得业务人员能够通过自然语言交互即时获取数据洞察,显著提升了生产...
强化学习Scaling Law错了?无需蒸馏,数据量只要1/6,效果还更好
研究团队通过系统分析揭示了强化学习训练中数据质量与模型推理能力提升的内在关联。核心发现表明,训练样本的质量和相关性远比数量重要,这一结论对传统认知...
Scaling Law要撞墙了吗?如何找到基座大模型的未来方向?
AI领域的发展似乎正面临一个转折点,即所谓的Scaling Law可能正走向尽头。这一规律曾支撑着AI技术的快速发展,但现在,随着模型参数规模的扩大,其带来的能力...
1
2




