视频生成
视频,video
Wan2.2-Animate又火了,5分钟让抠脚大汉秒变高冷女神。
阿里开源模型Wan2.2 Animate近期因生成高精度换脸视频引发广泛关注。该技术通过结合静态人物图像与动态参考视频,能精准复刻表情和动作,甚至支持声音替换,...
德明利亮相安博会,推出面向智能安防的多维度存储解决方案
深圳CPSE安博会于10月28日在福田会展中心开幕,聚焦AI与大数据的智能安防创新。德明利展示了针对高清视频、多路流与AI分析场景的全链路存储解决方案,满足智...
世界模型有了开源基座Emu3.5!拿下多模态SOTA,性能超越Nano Banana
北京智源人工智能研究院最新发布的悟界·Emu3.5标志着开源原生多模态世界模型的重大突破。该模型以34B参数量实现图、文、视频任务的统一处理,其核心突破在于...
智源悟界 · Emu3.5 重塑世界模型格局:首提多模态 Scaling 范式,AI 理解世界再进化
北京智源人工智能研究院发布了大规模多模态世界模型“悟界·Emu3.5”,该模型在模拟复杂物理世界方面展现出惊人的逼真度,并揭示了“多模态Scaling范式”的存在。...
刚刚,智源悟界·Emu3.5登场,原生具备世界建模能力
北京智源人工智能研究院发布了其多模态系列模型的最新力作——悟界・Emu3.5,被定义为“多模态世界大模型”。这一模型通过在超过10万亿的多模态Token上进行端到端...
理想智驾逆袭往事:端到端的百日冲刺
李想在2024年3月的春季战略会上对自动驾驶团队发出严厉警告,要求必须转向端到端技术路线,否则团队将面临重组。这一指令源于理想智驾长期处于行业追赶状态,...
全球首个具身智能开放平台来了!让大模型长出“身体”,像人一样自然表达交互
魔珐科技发布了全球首个面向开发者的具身智能3D数字人开放平台——魔珐星云,该平台旨在为大语言模型和AI智能体赋予身体和表达能力,实现自然的多模态交互。通...
刚刚,最佳VLA模型GigaBrain-0开源:世界模型驱动10倍数据,真机碾压SOTA
国内首个利用世界模型生成数据实现真机泛化的端到端VLA具身基础模型GigaBrain-0正式发布。该模型由极佳视界与湖北人形机器人创新中心联合开发,标志着通用机...
特想聊聊这款思路不一样的 Agent 产品
FlowithOS作为一款新兴的Agent产品,在任务自动化执行方面展现出显著优势。通过实际测试,该产品能够理解网页结构并完成多步骤操作,如下载X平台视频时准确识...
14万买台人形保姆?1X新品登场,扫地洗碗干收纳,还能迎宾接客陪唠嗑
1X公司近日发布了家用人形机器人NEO,定价2万美元或每月499美元订阅,计划2026年在美国首发。NEO身高167厘米,体重仅30公斤,采用肌腱驱动系统,运行噪音仅22...




