视频生成

视频,video

JanusVLN:双重隐式记忆解耦语义与空间,开创视觉语言导航记忆新范式

JanusVLN框架通过双重隐式神经记忆机制,实现了视觉语言导航(VLN)中语义与空间信息的有效解耦。传统VLN方法依赖显式记忆存储历史观测数据,面临空间信息损...

APP 上线 40 天后,Sora 核心团队分享了他们对于 AI 社交的关键思考

Sora APP在短短5天内实现了100万次下载,速度甚至超过了ChatGPT的早期表现。更引人注目的是,其近200万周活跃用户中,70%参与了内容创作,这一数据远超传统互...

好好的机器人,为啥要加个乳房?

小鹏IRON机器人因其仿人设计和胸部结构引发热议。针对网友质疑的“人假扮”问题,官方已通过视频澄清,展示机器内部构造。而胸部设计的合理性成为焦点——该区域...

对话何小鹏:在物理AI时代,数据是新的石油

小鹏汽车在第七届科技日上展示了其向AI公司转型的战略布局,核心聚焦智能汽车、机器人、Robotaxi与飞行汽车四大板块。这四大业务并非简单并列,而是以智能驾...

AI时代,中国人终于愿意为软件付费了

近期,国内软件行业掀起了一轮显著的涨价潮,涉及办公软件、视频工具等多个领域。据不完全统计,2024年以来,软件会员费用平均涨幅达20-30%,AI功能的集成成...

谢赛宁×李飞飞×LeCun首次联手!寒武纪-S「空间超感知」AI震撼登场

Yann LeCun、李飞飞和谢赛宁联合发表的论文《Cambrian-S:迈向视频中的空间超感知》提出了一种突破性观点:当前基于大语言模型(LLM)的AI技术存在根本性缺陷...

美团AI新品,专为程序员配送:不挑Python还是C++

美团近期推出了一款名为Meituan CatPaw的AI IDE编程工具,旨在通过Agent驱动编程体验革新,帮助开发者提升效率。该工具目前免费开放,支持多种主流编程语言,...

全球第二、国内第一!最强文本的文心5.0 Preview一手实测来了

百度文心5.0 Preview模型在LMArena全球文本竞技场测试中取得1432分,与OpenAI的GPT-4.5 Preview及Anthropic的两款Claude模型并列全球第二,同时位列国内第一...

银河通用全新模型统一机器人导航任务,7B参数模型支持实时部署

导航能力是机器人移动操作的基础能力,也是扩展其工作范围和应用场景的关键因素。然而,当前导航任务通常针对特定任务和机器人设计,导致大量研究精力投入任...

本周 AI 项目推荐|Mem0, Memories.ai……AI 记忆大爆炸

AI记忆领域正成为技术创新的新焦点,多个以'Mem'为前缀的算法框架及产品相继涌现,试图解决大模型在长上下文管理和个性化服务中的核心挑战。这些项目通过不同...
1 2 3 217