人跑光了，AI视频炸了！马斯克狂发推：Grok Imagine三金封神

59 0 0

文章摘要

Grok Imagine在DesignArena平台的三项核心视频任务中斩获Elo评分第一，分别以1337分、1298分和1291分领先视频生成竞技场、图像转视频及视频编辑类别，显著超越谷歌Veo 3.1、OpenAI Sora和Kling等主流模型。

其优势不依赖大参数规模或海量算力堆砌，而源于结构设计上的“高效泛化”能力，在质量、速度与成本间实现更优平衡：生成带音频视频的成本为4.20美元/分钟，远低于Veo的12美元与Sora的30美元。

该模型自2025年8月推出后快速迭代，从初期简单图像生成发展至支持复杂视频创作，平均处理耗时仅1分5秒，在文本转视频与图像转视频的Artificial Analysis基准测试中亦居首位。

团队采用用户反馈驱动的开发路径，强调AI对场景逻辑的理解而非单纯模仿，Haotian Liu等成员专注多模态技术融合，推动模型向“真正理解世界”的方向演进。

截至2026年初，Grok Imagine日均生成视频量已超过所有竞品总和，并于2026年1月开放API接口，支持开发者集成。

其崛起标志着AI视频领域正从依赖“蛮力计算”的阶段转向注重架构精巧与推理效率的“智慧革命”，挑战了“模型越大越强”的既有认知。

应用场景迅速拓展至内容创作、企业营销、教育培训乃至特斯拉车载系统与Optimus机器人训练等实际环节，显著降低专业级视频制作门槛。

未来视频创作有望如发短信般简易，个体创作者可即时实现创意表达。

尽管当前限制于15秒片段长度且复杂场景尚需优化，但Grok Imagine的快速成长印证了小规模团队通过创新设计实现技术突破的可能性，也为通用人工智能（AGI）的推进提供了新路径。

原文和模型

【原文链接】 阅读原文 [ 1564字 | 7分钟 ]
【原文作者】 新智元
【摘要模型】 qwen3-vl-plus-2025-12-19
【摘要评分】 ★☆☆☆☆

阿里云百炼

大模型服务平台是阿里云基于通义大模型等多种大模型的一站式大模型开发平台。

# AIGC动态 # 图像生成 # 大模型 # 机器人 # 视频生成 # 音频生成 # AGI进展 # 多模态AI # 竞技场榜首 # 视频生成 # 高效泛化

文章版权归作者所有，未经允许请勿转载。

超越Sora极限，120秒超长AI视频模型诞生！

新智元

3,349

试了下 Stable Video，我的建议是不如不用｜AI 测评室

AI前线

4,006

Sora发布！这次的惊艳居然不在模型，而是产品设计和制作流

硅星人Pro

2,739

Meta 眼镜支持多模态 Llama 3，实时翻译、物体识别，AI 眼镜的机会来了！

Founder Park

2,986

这家世界模型公司发布中国版Sora级视频生成大模型，走向世界模型打造新一代数据引擎

机器之心

3,782

解读OpenAI Sora文生视频技术原理

admin

3,381

暂无评论

暂无评论...

人跑光了，AI视频炸了！马斯克狂发推：Grok Imagine三金封神

文章摘要

原文和模型

西交大 x A*STAR 论文：让 AI 学会「保持一致」，多图生成迎来关键突破丨CVPR 2026

Meta内部Agent失控升级：首个Sev 1级事故曝光，系统数据裸奔了两小时

相关文章

暂无评论

热门网址

热门文章

人跑光了，AI视频炸了！马斯克狂发推：Grok Imagine三金封神

文章摘要

原文和模型

西交大 x A*STAR 论文：让 AI 学会「保持一致」，多图生成迎来关键突破丨CVPR 2026

Meta内部Agent失控升级：首个Sev 1级事故曝光，系统数据裸奔了两小时

相关文章

暂无评论

Trac-AI IDE

星辰Agent

讯飞文书-办公助手

热门网址

热门文章