字节Seedance 2.0发论文了,171人署名,吴永辉曾妍在列

AIGC动态2小时前发布 QbitAI
64 0 0
字节Seedance 2.0发论文了,171人署名,吴永辉曾妍在列

 

文章摘要


【关 键 词】 字节跳动视频生成技术论文多模态团队薪资

字节跳动旗下现象级 AI 视频技术 Seedance 2.0 已在 arXiv 正式发布论文,公开了长达 26 页的评测基准及完整的 170 位团队成员名单,署名和尊重细节十分到位。与此同时,该技术正通过 Byteplus 平台向全球 100 多个国家的企业客户开放,支持通过预付费 API 直接调用,生成 4 到 15 秒的最高 720p 多模态视频,但服务列表中没有美国。技术方案主要解决了过往生成式视频工具在尝试引用真实素材时难以保持一致性的瓶颈,通常单文本输入需要大量反复试验才能制作出可用作品。

作为原生统一模型,系统能够同时接收文本、图像、音频和视频作为输入,统一理解四种指令并融合生成。这种能力使得人物走路、跑步及打架跳舞等动作更自然且符合物理规律,多人互动也不乱,音画天生同步且口型对得准。 模型还具备自动分镜头、运镜及剪辑节奏的导演能力,支持对指定人物、动作场景进行修改或在现有视频后无缝续拍。评测部分覆盖多个主流基准,质量、运动及语义一致性等维度数据显示,该技术已站上第一梯队,多项指标大幅领先同期对手。

团队方面,相比 Seedance 1.5 Pro 时期的 197 人,不到半年时间换血近半,其中稳定不变的核心人物包括直接向 CEO 汇报的吴永辉及位于美国帕洛阿尔托的预训练负责人曾妍。针对此前关于高薪挖角研究员的传闻,抖音副总裁李亮予以辟谣,称团队薪资体系统一,近期未招聘到近亿元年薪员工。不过随后披露的薪资结构显示,员工收益包含现金及期权,若业务发展良好,不排除技术人员四年后收益达到数亿元。 这一表述被视作变相的招聘广告,展示了公司对核心技术人才的重视程度及未来收益预期,数亿字的潜在收益比任何招聘广告都有杀伤力。论文地址已公开供各界查阅,标志着该技术在学术界与产业界的双重推进,展现了字节在 AI 视频生成领域的雄厚实力与全球布局策略。

原文和模型


【原文链接】 阅读原文 [ 895字 | 4分钟 ]
【原文作者】 量子位
【摘要模型】 qwen3.5-397b-a17b
【摘要评分】 ★☆☆☆☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...