模型 | 第 12 页 | 学习AIGC

反击DeepSeek失败！Llama 4效果不好，Meta承认有问题

Meta生成式AI领导者Ahmad Al-Dahle针对Llama 4开源后的质疑进行了官方回应。Ahmad承认，由于模型在开发完成后立即发布，不同服务中的模型质量存在差异，并承...

AIGC动态

11个月前

Llama 4 刷榜作弊引热议，20 万显卡集群就做出了个这？

Meta近日发布了Llama 4系列模型，包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth，宣称这些模型经过大量未标注的文本、图像和视频数据训练，视觉理...

AIGC动态

11个月前

Llama 4训练作弊爆出惊天丑闻！AI大佬愤而辞职，代码实测崩盘全网炸锅

Meta最新发布的Llama 4本应成为AI领域的焦点，然而却因一系列问题引发了广泛争议。开源首日，Llama 4的代码能力表现极差，甚至不如GPT-4o等现有模型。更令人...

AIGC动态

11个月前

CLIP被淘汰了？LeCun谢赛宁新作，多模态训练无需语言监督更强！

视觉自监督学习（SSL）在多模态任务中的潜力得到了验证，研究表明，通过扩展模型和数据规模，SSL能够媲美甚至超越语言监督方法（如CLIP）。这项研究由杨立昆...

AIGC动态

11个月前

Llama 4发布36小时差评如潮！匿名员工爆料拒绝署名技术报告

Meta最新发布的基础模型Llama 4在发布36小时后，引发了广泛的负面评价，尤其是在代码能力方面表现不佳。经典的小球反弹测试中，模型未能正确模拟物理效果，小...

AIGC动态

11个月前

刚刚，Llama 4深夜开源击败DeepSeek V3！2万亿多模态巨兽抢回王座

Llama 4 Behemoth作为教师模型，拥有2880亿个活跃参数和近2万亿个总参数，在数学、多语言处理和图像基准测试方面提供了最先进的性能。通过新的蒸馏损失函数和...

AIGC动态

11个月前

LLM「想太多」有救了！高效推理让大模型思考过程更精简

大语言模型（LLM）在复杂推理任务中表现出色，但常常出现「过度思考」的现象，导致推理过程冗长且效率低下。这种「过度思考」不仅增加了计算资源的消耗，还影...

AIGC动态

11个月前

Meta深夜开源Llama 4！首次采用MoE，惊人千万token上下文，竞技场超越DeepSeek

Meta在周末发布了其最新AI模型系列Llama 4，包括Llama 4 Scout、Llama 4 Maverick和Llama 4 Behemoth。这些模型经过大量未标注的文本、图像和视频数据训练，...

AIGC动态

11个月前

刚刚，Meta发布Llama 4系列模型

Meta今日发布了Llama 4系列模型，标志着其在人工智能领域的又一重要进展。Llama 4系列是首批开放权重的原生多模态模型，支持超长上下文，并首次采用了混合专...

AIGC动态

11个月前

LIama 4发布重夺开源第一！DeepSeek同等代码能力但参数减一半，一张H100就能跑，还有两万亿参数超大杯

在训练细节方面，Meta采用了全新的训练技术MetaP，通过设置关键模型超参数，实现了在不同批量大小、模型宽度和深度之间的良好扩展和泛化。Llama 4系列在200种...

AIGC动态

11个月前

标签：模型

反击DeepSeek失败！Llama 4效果不好，Meta承认有问题

Llama 4 刷榜作弊引热议，20 万显卡集群就做出了个这？

Llama 4训练作弊爆出惊天丑闻！AI大佬愤而辞职，代码实测崩盘全网炸锅

CLIP被淘汰了？LeCun谢赛宁新作，多模态训练无需语言监督更强！

Llama 4发布36小时差评如潮！匿名员工爆料拒绝署名技术报告

刚刚，Llama 4深夜开源击败DeepSeek V3！2万亿多模态巨兽抢回王座

LLM「想太多」有救了！高效推理让大模型思考过程更精简

Meta深夜开源Llama 4！首次采用MoE，惊人千万token上下文，竞技场超越DeepSeek

刚刚，Meta发布Llama 4系列模型

LIama 4发布重夺开源第一！DeepSeek同等代码能力但参数减一半，一张H100就能跑，还有两万亿参数超大杯

热门网址

标签：模型

Trae-AI IDE

讯飞星辰

讯飞文书-办公助手

有言AI-视频创作

热门网址