文章摘要
【关 键 词】 AI模型、视频生成、音频优化、性能领先、创意工具
Grok Imagine 1.0正式上线,作为xAI推出的最新视频音频生成模型,其能力覆盖文生视频、图生视频,单次生成时长达10秒,分辨率达720P,并显著提升了音频表现。模型能精准捕捉用户创意,例如生成细节丰富的“驯龙高手”AI版场景,角色语音情感饱满且与画面节奏同步。测试期内已生成12.45亿条视频,目前官网开放免费使用。
视频生成能力方面,Grok Imagine展现出电影级运镜理解、多主体自然互动及高指令遵循度。画面衔接流畅,支持竖屏横屏适配,并能通过用户动作表演驱动角色动画。剪辑功能支持增删对象、替换元素、调整场景氛围及物件细节,甚至将静态线稿转化为动态视频。第三方测试显示,该模型在文生视频、图生视频的延迟与成本控制上均居行业首位。Artificial Analysis和LMArena的评估数据证实其综合性能领先,IVEBench盲测中更是在效果一致性和指令遵循度等维度表现突出。
用户创作案例进一步验证了模型的实用性与趣味性。从跳舞的机器人到经典动画《猫和老鼠》的逼真还原,生成内容在表情变化、第一视角呈现等细节处理上均达到高完成度。官方强调,模型特别适合日常创意需求,如老照片动态化、热点梗图快速生成等,支持将片段拼接成完整短片。随着API的发布,开发者与普通用户均可通过官网直接体验这一工具。
原文和模型
【原文链接】 阅读原文 [ 865字 | 4分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★☆☆☆☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...



