陈天桥旗下盛大AI东京研究院于SIGGRAPH Asia正式亮相，揭晓数字人和世界模型成果

AIGC动态3个月前发布 almosthuman2014

548 0 0

陈天桥旗下盛大AI东京研究院于SIGGRAPH Asia正式亮相，揭晓数字人和世界模型成果

文章摘要

盛大集团旗下盛大AI东京研究院在SIGGRAPH Asia 2025期间首次公开亮相，展示了其在数字人“交互智能”和世界模型“时空智能”两大方向的研究成果。这一举措标志着盛大集团正式登上国际顶级学术与产业舞台，其战略愿景源于创始人陈天桥对脑科学与AI融合的长期投入。他提出的“发现式智能”理念强调了智能体认知基底的重要性，而交互智能的实现则得益于集团内部EverMind团队产品EverMemOS的技术协同。

当前数字人技术面临的核心问题是“灵魂缺失”，即用户在交互中感受到的“空洞感”或“断裂感”。这一问题源于三个系统性挑战：长期记忆与人格一致性、多模态情感表达的缺失，以及缺乏自主进化能力。盛大AI首席科学家郑波博士指出，标准的大语言模型在长时间对话中难以维持稳定的人格设定，导致“人格漂移”现象；同时，数字人普遍存在“僵尸脸”问题，缺乏自然的微表情和反应；此外，大多数数字人无法从交互中学习和成长，限制了其从“模仿”走向真正“智能”的潜力。

在SIGGRAPH Asia闭门研讨会上，来自学术界和产业界的顶尖专家一致认为，未来数字人的核心竞争力将体现在交互智能上，必须具备长期记忆、多模态情感表达和自主演进三大关键能力。与会专家包括香港大学、早稻田大学、东京科学大学等知名学者，他们共同探讨了数字人技术的未来发展方向。

为解决这些挑战，盛大AI东京研究院推出了Mio（Multimodal Interactive Omni-Avatar）框架。Mio由五个高度协同的核心模块构成：认知核心（Thinker）、语音引擎（Talker）、面部动画师（Facial Animator）、身体动画师（Body Animator）和渲染引擎（Renderer）。认知核心采用“介于叙事时间的知识图谱”技术，显著提升了人格保真度；面部动画师通过统一的“听-说”框架，消除了“僵尸脸”现象；身体动画师则利用流式扩散模型，实现了实时且高质量的全身动作生成。

Mio的推出标志着数字人技术从“形似”向“神似”的跨越。在测试中，Mio的整体交互智能分数（IIS）达到76.0，较之前最优技术水平提升8.4分，为行业树立了新的性能标杆。这一突破预计将为虚拟陪伴、互动叙事和沉浸式游戏等领域带来革命性变革。盛大AI东京研究院已公开发布Mio项目的完整技术报告、预训练模型和评估基准，呼吁全球研究者、开发者和创造者共同构建下一代拥有智能与灵魂的数字生命。