人跑光了,AI视频炸了!马斯克狂发推:Grok Imagine三金封神

AIGC动态2小时前发布 AIera
59 0 0
人跑光了,AI视频炸了!马斯克狂发推:Grok Imagine三金封神

 

文章摘要


【关 键 词】 视频生成多模态AI高效泛化竞技场榜首AGI进展

Grok Imagine在DesignArena平台的三项核心视频任务中斩获Elo评分第一,分别以1337分、1298分和1291分领先视频生成竞技场、图像转视频及视频编辑类别,显著超越谷歌Veo 3.1、OpenAI Sora和Kling等主流模型。

其优势不依赖大参数规模或海量算力堆砌,而源于结构设计上的“高效泛化”能力,在质量、速度与成本间实现更优平衡:生成带音频视频的成本为4.20美元/分钟,远低于Veo的12美元与Sora的30美元。

该模型自2025年8月推出后快速迭代,从初期简单图像生成发展至支持复杂视频创作,平均处理耗时仅1分5秒,在文本转视频与图像转视频的Artificial Analysis基准测试中亦居首位。

团队采用用户反馈驱动的开发路径,强调AI对场景逻辑的理解而非单纯模仿,Haotian Liu等成员专注多模态技术融合,推动模型向“真正理解世界”的方向演进。

截至2026年初,Grok Imagine日均生成视频量已超过所有竞品总和,并于2026年1月开放API接口,支持开发者集成。

其崛起标志着AI视频领域正从依赖“蛮力计算”的阶段转向注重架构精巧与推理效率的“智慧革命”,挑战了“模型越大越强”的既有认知。

应用场景迅速拓展至内容创作、企业营销、教育培训乃至特斯拉车载系统与Optimus机器人训练等实际环节,显著降低专业级视频制作门槛。

未来视频创作有望如发短信般简易,个体创作者可即时实现创意表达

尽管当前限制于15秒片段长度且复杂场景尚需优化,但Grok Imagine的快速成长印证了小规模团队通过创新设计实现技术突破的可能性,也为通用人工智能(AGI)的推进提供了新路径。


原文和模型


【原文链接】 阅读原文 [ 1564字 | 7分钟 ]
【原文作者】 新智元
【摘要模型】 qwen3-vl-plus-2025-12-19
【摘要评分】 ★☆☆☆☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...