Artificial Analysis 榜单第二,SkyReels-V4 宣告 AI 视频进入「全栈统一」阶段
文章摘要
【关 键 词】 AI视频、天工模型、全栈能力、音画同步、产业赋能
在AI视频赛道权威评测平台Artificial Analysis的最新带音频文生视频榜单上,昆仑天工的SkyReels-V4以1090的ELO评分位列全球第二,仅落后第一名3分,Google Veo 3.1、OpenAI Sora 2等大厂模型均排在其后;在包含所有历史版本的全量排名中,它也跻身第四。该榜单并非仅评判画面质量,而是综合考量画面、声音及两者同步程度的完整视频表现,这一排名印证了其在多维度的突出实力。
SkyReels-V4具备“万物可参考”的运动参考能力,能将不同形象精准映射至参考动作轨迹,包括单主体跨物种动作迁移、多主体分别替换且动作互不干扰等,运动参考能力可实现不同形象的动作精准映射,大幅提升素材复用率与商业价值。同时,它拥有覆盖全创作流程的全栈能力,可直接生成带对白、背景音乐与镜头切换的短剧,支持多语言语音生成,还能完成去水印、添加元素、删除主体等精细化编辑,其全栈能力可覆盖从生成到编辑、画面到声音的整条视频创作工作流,无需切换多工具完成任务。
其核心技术支撑在于统一拼接框架与双流MMDiT架构:统一拼接框架将所有视频任务转化为遮罩配置与参考素材注入的统一操作,实现多任务共用一套参数;双流MMDiT架构通过双向交叉注意力与RoPE频率缩放技术,实现音视频从底层生成阶段的毫秒级精准同步,解决了多数模型音视频分离生成的对齐问题。
SkyReels-V4的表现代表了AI视频模型从单项能力向全流程统一演进的行业趋势,其统一框架的技术选择,成为AI视频生成赛道向全流程覆盖演进的信号。对创作者而言,它提升了创作连贯性并降低门槛;对内容产业来说,在短剧、短视频等中腰部内容市场,或将重新定义制作的“最低可行团队”,显著提升产业效率。SkyReels系列从垂直场景到全栈能力的迭代路径,也验证了全栈统一模型的可行性。
原文和模型
【原文链接】 阅读原文 [ 3365字 | 14分钟 ]
【原文作者】 Founder Park
【摘要模型】 doubao-seed-1-8-251228
【摘要评分】 ★★★★☆



