大模型

LLM,VLM,模型

北大王选所彭宇新团队:让多模态大模型学会「看懂物种关系」丨CVPR 2026

当前多模态大模型推动视觉理解能力提升,已在多种视觉任务中实现较高水平的识别推理,但在复杂层级视觉识别任务中仍存在明显不足。现实世界诸多视觉概念天然...

鹅厂门口免费装龙虾,几百人排爆了!一代人有一代人的鸡蛋要领

腾讯云Lighthouse在腾讯门口举办免费现场部署OpenClaw的活动,由工程师坐镇提供从安装部署、模型配置到IM渠道打通的一条龙服务,还可帮助用户解锁热门使用技...

Meta被骂跑偏后摊牌!Alex Wang回应新团队目标:个人Agent全球化部署,Manus已在应用上开路

Meta近期加码AI人才招募,新成立的超级人工智能实验室(MSL)吸纳了“氛围编程”应用Gizmo的核心团队,该应用支持普通用户通过提示词直接生成小程序、游戏等互...

GPU时代落幕?硅谷巨头集体「叛逃」,英伟达1500亿疯狂自救

英伟达2026财年营收、净利润均表现亮眼,数据中心业务三年增长13倍,但财报发布后股价大幅下跌,华尔街已经嗅到行业变局:英伟达多家核心头部客户开始分散算...

Transformer论文作者重造龙虾,Rust搓出钢铁版,告别OpenClaw裸奔漏洞

原本热门的AI智能体框架OpenClaw存在严重安全问题,其架构设计存在原生缺陷,用户的邮箱凭证、API密钥等敏感信息会直接送入大语言模型提供商的服务器,用户所...

GPT-5.4:OpenAI做了个Kimi K2.5 +MiniMax M2.5?

3月5日,OpenAI正式发布为追赶Claude打造的能力“N合1”统一模型GPT-5.4,该模型的研发方向与能力设置,大量参考了在agent领域深耕的开源模型Kimi K2.5和MiniMa...

FlashAttention-4正式发布:算法流水线大改,矩阵乘法级速度

经过一年开发,深度学习底层优化技术FlashAttention推出大版本更新FlashAttention-4,专门适配新一代Blackwell架构GPU。在Blackwell GPU上,注意力机制的执行...

彻底告别VE与VAE!商汤硬核重构多模态:砍掉所有中间编码器

当前多模态大模型领域长期遵循搭配视觉编码器负责感知理解、变分自编码器完成内容生成的默认范式,这种设计在感知与生成之间留下天然鸿沟,后续业界提出的共...

李飞飞50亿美金赛道被开源!浙大教授章国锋带队创业,打造无限时长实时3D世界模型

当前AI世界模型发展中,虚拟数字世界智能体可灵活运行,但现实具身机器人仍难以适配复杂物理空间,二者的鸿沟本质是智能体空间智能感知的缺失。2024年李飞飞...

越过 L3 直达 L4,小鹏就是中国智驾的 DeepSeek

3月2日,小鹏在第二代VLA体验日正式宣布该技术将于当月推送落地。此前何小鹏2月初预热称第二代VLA将是智驾的“DeepSeek时刻”,行业中“DeepSeek时刻”通常代指三...
1 2 3 4 841