大模型

LLM,VLM,模型

强化学习Scaling Law错了?无需蒸馏,数据量只要1/6,效果还更好

研究团队通过系统分析揭示了强化学习训练中数据质量与模型推理能力提升的内在关联。核心发现表明,训练样本的质量和相关性远比数量重要,这一结论对传统认知...

「9块9」 的中国 AI 耳机,疯狂收割老外

带有AI翻译功能的蓝牙耳机在海外市场呈现爆发式增长,其背后是中国供应链与新兴技术结合的典型案例。接入AI功能的蓝牙耳机通过TikTok等平台营销,月销售额从2...

嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁

由中国人民大学高瓴人工智能研究院与蚂蚁集团联合研发的LLaDA模型,通过创新性引入扩散模型架构,为破解大语言模型的逆诅咒难题提供了全新解决方案。该模型在...

一天开源五个模型,AI 热潮将加速今年中国智算规模增长43%|钛媒体AGI

阶跃星辰与吉利汽车集团联合宣布开源两款多模态大模型,包括全球参数量最大的开源视频生成模型Step-Video-T2V和首款产品级开源语音交互模型Step-Audio。Step-...

接力DeepSeek,阶跃星辰直接开源两款国产多模态大模型

国内AI创业公司阶跃星辰与吉利汽车集团联合开源Step-Video-T2V视频生成模型和Step-Audio语音交互模型。Step-Video-T2V以300亿参数量成为当前性能最优的开源视...

最强全模态模型Ola-7B横扫图像、视频、音频主流榜单,腾讯混元Research&清华&NTU联手打造

腾讯混元Research、清华大学i-Vision实验室与南洋理工大学S-Lab联合推出的Ola全模态语言模型,通过渐进式模态对齐策略实现了图像、视频和音频理解能力的突破...

马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

xAI团队发布了Grok-3系列模型及配套工具,标志着大规模算力与模型能力结合的新里程碑。该模型在20万块GPU集群上完成训练,成为首个突破10万GPU同步训练规模的...

春晚BOT扭秧歌的科技“秘籍” | 文末赠书

在蛇年春晚舞台上,由杭州宇树科技与新疆艺术学院联合呈现的《秧BOT》融合舞蹈引发广泛关注。16台名为“福兮”的人形机器人身着传统服饰,与真人演员共同完成了...

20万卡吞金兽 Grok 3 炸裂登场,卡帕西大神亲测:性能超过DeepSeek R1!马斯克:短期不开源

埃隆·马斯克旗下的人工智能公司xAI正式发布新一代AI模型Grok 3及其迷你版本Grok 3-mini,宣称这是迄今为止最强大的AI模型。Grok 3的核心突破在于首次将推理能...

马斯克正式发布Grok 3,这回真的把OpenAI干碎了。

马斯克在2025年2月的发布会上正式推出Grok 3人工智能模型,宣称其推理能力超越所有已发布的AI系统。该模型通过X平台向Premium用户即时开放使用,标志着xAI团...
1 364 365 366 367 368 850