马斯克视频生成模型首次交卷！电影级运镜+音效，免费可玩

313 0 0

文章摘要

Grok Imagine 1.0正式上线，作为xAI推出的最新视频音频生成模型，其能力覆盖文生视频、图生视频，单次生成时长达10秒，分辨率达720P，并显著提升了音频表现。模型能精准捕捉用户创意，例如生成细节丰富的“驯龙高手”AI版场景，角色语音情感饱满且与画面节奏同步。测试期内已生成12.45亿条视频，目前官网开放免费使用。

视频生成能力方面，Grok Imagine展现出电影级运镜理解、多主体自然互动及高指令遵循度。画面衔接流畅，支持竖屏横屏适配，并能通过用户动作表演驱动角色动画。剪辑功能支持增删对象、替换元素、调整场景氛围及物件细节，甚至将静态线稿转化为动态视频。第三方测试显示，该模型在文生视频、图生视频的延迟与成本控制上均居行业首位。Artificial Analysis和LMArena的评估数据证实其综合性能领先，IVEBench盲测中更是在效果一致性和指令遵循度等维度表现突出。

用户创作案例进一步验证了模型的实用性与趣味性。从跳舞的机器人到经典动画《猫和老鼠》的逼真还原，生成内容在表情变化、第一视角呈现等细节处理上均达到高完成度。官方强调，模型特别适合日常创意需求，如老照片动态化、热点梗图快速生成等，支持将片段拼接成完整短片。随着API的发布，开发者与普通用户均可通过官网直接体验这一工具。