陈天桥旗下盛大AI东京研究院于SIGGRAPH Asia正式亮相,揭晓数字人和世界模型成果

陈天桥旗下盛大AI东京研究院于SIGGRAPH Asia正式亮相,揭晓数字人和世界模型成果

 

文章摘要


【关 键 词】 人工智能数字人交互智能时空智能技术突破

盛大集团旗下盛大AI东京研究院在SIGGRAPH Asia 2025期间首次公开亮相,展示了其在数字人“交互智能”和世界模型“时空智能”两大方向的研究成果。这一举措标志着盛大集团正式登上国际顶级学术与产业舞台,其战略愿景源于创始人陈天桥对脑科学与AI融合的长期投入。他提出的“发现式智能”理念强调了智能体认知基底的重要性,而交互智能的实现则得益于集团内部EverMind团队产品EverMemOS的技术协同。

当前数字人技术面临的核心问题是“灵魂缺失”,即用户在交互中感受到的“空洞感”或“断裂感”。这一问题源于三个系统性挑战:长期记忆与人格一致性、多模态情感表达的缺失,以及缺乏自主进化能力。盛大AI首席科学家郑波博士指出,标准的大语言模型在长时间对话中难以维持稳定的人格设定,导致“人格漂移”现象;同时,数字人普遍存在“僵尸脸”问题,缺乏自然的微表情和反应;此外,大多数数字人无法从交互中学习和成长,限制了其从“模仿”走向真正“智能”的潜力。

在SIGGRAPH Asia闭门研讨会上,来自学术界和产业界的顶尖专家一致认为,未来数字人的核心竞争力将体现在交互智能上,必须具备长期记忆、多模态情感表达和自主演进三大关键能力。与会专家包括香港大学、早稻田大学、东京科学大学等知名学者,他们共同探讨了数字人技术的未来发展方向。

为解决这些挑战,盛大AI东京研究院推出了Mio(Multimodal Interactive Omni-Avatar)框架。Mio由五个高度协同的核心模块构成:认知核心(Thinker)、语音引擎(Talker)、面部动画师(Facial Animator)、身体动画师(Body Animator)和渲染引擎(Renderer)。认知核心采用“介于叙事时间的知识图谱”技术,显著提升了人格保真度;面部动画师通过统一的“听-说”框架,消除了“僵尸脸”现象;身体动画师则利用流式扩散模型,实现了实时且高质量的全身动作生成。

Mio的推出标志着数字人技术从“形似”向“神似”的跨越。在测试中,Mio的整体交互智能分数(IIS)达到76.0,较之前最优技术水平提升8.4分,为行业树立了新的性能标杆。这一突破预计将为虚拟陪伴、互动叙事和沉浸式游戏等领域带来革命性变革。盛大AI东京研究院已公开发布Mio项目的完整技术报告、预训练模型和评估基准,呼吁全球研究者、开发者和创造者共同构建下一代拥有智能与灵魂的数字生命。

原文和模型


【原文链接】 阅读原文 [ 2736字 | 11分钟 ]
【原文作者】 机器之心
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...