标签:模型
Llama 4遭竞技场背刺!实锤用特供版刷榜,2000+对战记录公开
大模型竞技场(Chatbot Arena)官方团队lmarena.ai近日公开了对Llama-4-Maverick-03-26-Experimental版本的评测数据,并对其表现进行了详细分析。该模型在竞...
斯坦福2025 AI指数出炉!中美AI终极对决差距仅剩0.3%,DeepSeek领衔
2025年斯坦福HAI报告揭示了全球AI领域的最新趋势,重点分析了中美在AI模型性能上的差距缩小、推理成本的大幅下降以及小模型性能的显著提升。中美顶级AI模型的...
反击DeepSeek失败!Llama 4效果不好,Meta承认有问题
Meta生成式AI领导者Ahmad Al-Dahle针对Llama 4开源后的质疑进行了官方回应。Ahmad承认,由于模型在开发完成后立即发布,不同服务中的模型质量存在差异,并承...
Llama 4 刷榜作弊引热议,20 万显卡集群就做出了个这?
Meta近日发布了Llama 4系列模型,包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth,宣称这些模型经过大量未标注的文本、图像和视频数据训练,视觉理...
Llama 4训练作弊爆出惊天丑闻!AI大佬愤而辞职,代码实测崩盘全网炸锅
Meta最新发布的Llama 4本应成为AI领域的焦点,然而却因一系列问题引发了广泛争议。开源首日,Llama 4的代码能力表现极差,甚至不如GPT-4o等现有模型。更令人...
CLIP被淘汰了?LeCun谢赛宁新作,多模态训练无需语言监督更强!
视觉自监督学习(SSL)在多模态任务中的潜力得到了验证,研究表明,通过扩展模型和数据规模,SSL能够媲美甚至超越语言监督方法(如CLIP)。这项研究由杨立昆...
Llama 4发布36小时差评如潮!匿名员工爆料拒绝署名技术报告
Meta最新发布的基础模型Llama 4在发布36小时后,引发了广泛的负面评价,尤其是在代码能力方面表现不佳。经典的小球反弹测试中,模型未能正确模拟物理效果,小...
刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座
Llama 4 Behemoth作为教师模型,拥有2880亿个活跃参数和近2万亿个总参数,在数学、多语言处理和图像基准测试方面提供了最先进的性能。通过新的蒸馏损失函数和...
LLM「想太多」有救了!高效推理让大模型思考过程更精简
大语言模型(LLM)在复杂推理任务中表现出色,但常常出现「过度思考」的现象,导致推理过程冗长且效率低下。这种「过度思考」不仅增加了计算资源的消耗,还影...
Meta深夜开源Llama 4!首次采用MoE,惊人千万token上下文,竞技场超越DeepSeek
Meta在周末发布了其最新AI模型系列Llama 4,包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。这些模型经过大量未标注的文本、图像和视频数据训练,...