视频生成
视频,video
计算所 x 上交大论文:只用双人数据,也能生成多人动画丨CVPR 2026
MultiAnimate是一种面向多人物姿态驱动动画生成的新型框架,核心目标是解决在复杂互动场景中人物身份混淆、动作错位及空间关系失真的问题。该方法通过引入人...
对话VAST曹炎培:2秒才是3D生成本该有的速度
VAST推出的Tripo P1.0模型实现了仅凭提示词或单张参考图即可在2秒内生成高质量3D模型的能力,其核心突破在于首次在原生三维空间中实现概率生成,彻底重构了AI...
AI的七窍打通了!谷歌发布Gemini Embedding 2原生多模态嵌入模型
谷歌正式发布了名为 Gemini Embedding 2 的新型基础架构,实现了 AI 像人类一样用五种感官同步感知世界。这个系统将文字、图像、视频、音频和文档数据全部整...
我的短剧时间线,AI剧把真人剧挤没了
短剧行业正经历显著变革,真人短剧面临寒冬。配音价格从每分钟 115 元降至 45 元,群演日薪减半,西安等地从业者月薪降幅明显。平台政策转向亦是重要信号,红...
谷歌AGI底座降临!首个原生全模态嵌入模型上线,已实现全模态SOTA
谷歌正式发布了首个原生全模态 Embedding 模型 Gemini Embedding 2,该模型能够将文本、图像、音视频及 PDF 文档无损融合于统一向量空间。这一突破性进展实现...
对话赵天奇:从AI短剧到互动影游,聚力维度的“升维”之战
聚力维度创始人赵天奇认为 3D AI 技术具有广泛应用前景,但团队目前重心放在 AI 影视,特别是 AI 漫剧与短剧领域。选择该赛道是因为漫剧和短剧最接近自由奔放...
让龙虾看懂屏幕!谷歌多模态新成果,文本图像视频音频进同一空间
谷歌发布了首款原生多模态嵌入模型 Gemini Embedding 2。该模型的核心突破在于将文本、图像、视频、音频及文档等多种数据类型映射至同一个统一的嵌入空间。不...
光轮智能完成 10 亿元融资,全球首个具身数据独角兽诞生
近日,光轮智能正式完成 10 亿元 A++ 及 A+++ 轮融资,引入新希望集团、鼎邦投资等产业及财务机构。本轮融资完成后,光轮智能成为全球首个具身数据领域的独角...
给龙虾定MBTI、发工牌,还让龙虾偷技能…打工人得适应新环境了
近期AI圈掀起低门槛本地部署大模型的热潮,多家头部厂商相继推出方案,大幅降低部署门槛。开发者群体围绕这类大模型Agent(文中俗称“龙虾”)完成了多个创意场...
人人相信AI参与了战争,人人都想给自己装个龙虾
称Claude与Palantir合作打造的AI系统主导击杀哈梅内伊的内容在中文互联网广泛传播,内容细致描绘了AI清洗海量情报、指挥行动完成精准清除的全过程,完美迎合...




