Sora2之后,又来了个全新的影视级AI视频模型,它的名字,叫GAGA。

AIGC动态2个月前发布 admin
524 0 0
Sora2之后,又来了个全新的影视级AI视频模型,它的名字,叫GAGA。

 

文章摘要


【关 键 词】 AI视频音画同步人物表演影视级别国产模型

Sand.ai团队正式发布了全新的音画同步视频模型GAGA-1,该模型在人物表演领域展现出显著的技术突破。经过六个月的开发周期,这款国产模型目前已开放免费使用,无需邀请码或排队。GAGA-1的核心优势在于影视级的人物台词表演能力,其生成效果在短剧和影游级别场景中表现优异,部分案例甚至能达到电视剧制作标准。

模型操作采用图+文结合的输入方式,用户需提供角色图像和文字Prompt。测试显示,5-10秒时长的视频生成效果最佳,建议台词控制在20字以内。在具体案例中,模型能准确呈现”笑着说”、”叹气咬唇”、”歇斯底里”等复杂情绪,面部微表情和头发动态等细节处理尤为出色。不过当Prompt超过20字时,会出现吞字现象,且台词情感表达水平仍逊于面部表演。

技术层面存在若干待优化点:大幅度动作支持有限,如擦眼泪时可能出现手部变形;多语言支持不均衡,日语表现明显弱于中英文;音色一致性尚未解决,每次生成的语音特征存在差异。团队透露音频上传和角色音色固定功能已在开发中。与同类产品相比,GAGA-1在亚洲人像处理方面具有特色,但需配合第三方绘图工具才能获得理想角色形象。

应用场景覆盖短剧制作、互动影游NPC对话、小说角色可视化等领域。成本优势将成为其重要竞争力,开发者明确表示定价将远低于Sora2和Veo3。虽然目前存在创作限制,但模型为内容创作者提供了低门槛的视频生产工具,特别适合需要快速原型验证的场景。用户可通过Gaga Actor功能体验核心技术,而团队画图模块Banana的审美风格可能不符合所有亚洲用户的偏好。

原文和模型


【原文链接】 阅读原文 [ 2455字 | 10分钟 ]
【原文作者】 数字生命卡兹克
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...