ICLR 2026 | 让多模态模型学会主动说话:主动交互从训练到评估的完整方案
本文系统性地介绍了视频多模态大模型实现“主动交互”的最新研究进展,聚焦于北京大学王选计算机研究所发布的ProactiveVideoQA与MMDuet2两项关键工作。核心目标...
让Agent真正“行动”起来,Agent Skill开发者大赛正式启动!
本次Agent Skill开发者大赛由AIGC开放社区与算泥社区联合主办,旨在推动人工智能从“概念演示”向“生产力落地”阶段跨越。赛事聚焦AI代理(Agent)在真实场景中...
Meta超智能体开源:任意可计算任务中,能自我改进实现无尽演化
DGM-Hyperagents(DGM-H)提出了一种突破性架构,使AI系统首次实现对自身改进机制的动态优化。该系统将任务执行模块与元智能体整合于同一可编辑程序中,支持...
龙虾为啥越养越贵,越用越蠢?
OpenClaw的困境核心并非技术缺陷,而是其面向开发者调试场景的设计被普通用户误用,导致严重场景错配。该系统三大关键问题——心跳保活机制、单模型全场景默认...
这是近几年百度最打动我的 AI 产品。
本文围绕百度新推出的DuMate产品展开,重点探讨其作为“AI搭子”角色在个人与团队工作场景中的实际应用价值。文章开篇即肯定该产品的设计感与理念先进性,将其...
论芯率先跑进AI for EDA产线:读芯片协议文档速度25倍,揪出respin级bug
当前芯片设计复杂度持续攀升,但关键验证环节中“读文档”这一传统人工步骤长期未被工具化,成为效率瓶颈。在流片前需工程师耗时数周至数月解析数百页协议规范...
ChatGPT 让所有人变成了超级个体,却没让你的公司成为超级组织
当前企业AI应用面临显著的生产力“剪刀差”现象:个体效率提升明显,但组织整体产出与竞争力未见实质增长。核心矛盾在于——技术工具升级并未同步重构组织逻辑。...
AI 为什么不会规划?Yann LeCun团队:问题出在「时间是弯的」
本文探讨了构建具备世界建模与规划能力的AI系统所面临的核心挑战,聚焦于潜在空间中时间轨迹的几何结构问题。研究指出,当前预训练视觉编码器在潜在空间生成...
GitLab创始人抗癌实录:他用创始人思维和AI救了自己
Sid Sijbrandij作为GitLab联合创始人,在确诊罕见骨肉瘤并经历标准治疗失败后,以“创始人模式”主导自身抗癌过程。他拒绝将疾病决策权全权委托医生,转而以构...
补上“最后一块短板”:镭神西安切入封装设备核心赛道
国内封测产业已跃居世界前列,但焊线机作为后道关键设备仍被海外厂商主导,成为“最难啃的骨头”。该设备属经验驱动型系统工程,其核心挑战在于复杂工艺窗口的...