马斯克视频生成模型首次交卷!电影级运镜+音效,免费可玩

AIGC动态3小时前发布 QbitAI
15 0 0
马斯克视频生成模型首次交卷!电影级运镜+音效,免费可玩

 

文章摘要


【关 键 词】 AI模型视频生成音频优化性能领先创意工具

Grok Imagine 1.0正式上线,作为xAI推出的最新视频音频生成模型,其能力覆盖文生视频、图生视频,单次生成时长达10秒,分辨率达720P,并显著提升了音频表现。模型能精准捕捉用户创意,例如生成细节丰富的“驯龙高手”AI版场景,角色语音情感饱满且与画面节奏同步。测试期内已生成12.45亿条视频,目前官网开放免费使用。

视频生成能力方面,Grok Imagine展现出电影级运镜理解、多主体自然互动及高指令遵循度。画面衔接流畅,支持竖屏横屏适配,并能通过用户动作表演驱动角色动画。剪辑功能支持增删对象、替换元素、调整场景氛围及物件细节,甚至将静态线稿转化为动态视频。第三方测试显示,该模型在文生视频、图生视频的延迟与成本控制上均居行业首位。Artificial Analysis和LMArena的评估数据证实其综合性能领先,IVEBench盲测中更是在效果一致性和指令遵循度等维度表现突出。

用户创作案例进一步验证了模型的实用性与趣味性。从跳舞的机器人到经典动画《猫和老鼠》的逼真还原,生成内容在表情变化、第一视角呈现等细节处理上均达到高完成度。官方强调,模型特别适合日常创意需求,如老照片动态化、热点梗图快速生成等,支持将片段拼接成完整短片。随着API的发布,开发者与普通用户均可通过官网直接体验这一工具。

原文和模型


【原文链接】 阅读原文 [ 865字 | 4分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★☆☆☆☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...