JanusVLN:双重隐式记忆解耦语义与空间,开创视觉语言导航记忆新范式
JanusVLN框架通过双重隐式神经记忆机制,实现了视觉语言导航(VLN)中语义与空间信息的有效解耦。传统VLN方法依赖显式记忆存储历史观测数据,面临空间信息损...
杨植麟带 Kimi 团队深夜回应:关于 K2 Thinking 爆火后的一切
月之暗面发布的Kimi K2 Thinking模型以其“模型即Agent”的设计理念引发行业震动。该模型通过创新的KDA(Kimi Delta Attention)注意力机制,有效解决了MoE模型...
APP 上线 40 天后,Sora 核心团队分享了他们对于 AI 社交的关键思考
Sora APP在短短5天内实现了100万次下载,速度甚至超过了ChatGPT的早期表现。更引人注目的是,其近200万周活跃用户中,70%参与了内容创作,这一数据远超传统互...
独家丨轻舟智航已组建无人物流车业务,在苏州、金华等地运营
轻舟智航已在内部组建无人物流配送业务,其无人物流车已在苏州、金华等地投入运营。这一举措标志着该公司从乘用车和Robobus领域正式拓展至物流赛道,形成“出...
三年三次「破局」,江原科技如何打通国产AI芯片全链路?
在AI芯片领域长期被国际巨头垄断的背景下,江原科技通过自主研发实现了国产AI芯片的重大突破。2022年10月美国出口管制令发布后,李瑛带领团队创立江原科技,...
刚刚,豆包编程模型来了,我们用四个关卡考了考它!
AI编程助手正经历从代码补全工具向具备自主规划能力的Agentic Coder演进。2025年,行业分化为IDE增强和任务委托两条技术路线,前者以GitHub Copilot为代表提...
打破显存墙:谢赛宁团队提出CLM,单卡RTX 4090「撬动」1亿高斯点
3D Gaussian Splatting (3DGS)是一种基于各向异性3D高斯体构建场景表示的新视角合成技术,能够通过带位姿的图像训练快速渲染未见视角,在渲染速度和图像质量...
从“给答案”到“教动脑”:这届小学生被AI教会主动思考
当前教育领域正迎来AI技术带来的深刻变革,各类智能学习产品正从单一工具向拟人化教学系统演进。AI教育产品的核心矛盾已从“效率提升”转向“思维培养”,传统快...
大模型开发者必读!拆解世界级AI模型的诞生,Hugging Face把4年模型训练经验写成了一本开源指南
Hugging Face发布的《The Smol Training Playbook》手册,由12位顶尖工程师团队撰写,系统总结了构建世界级大语言模型的核心方法论。手册开篇便颠覆性地指出...
模型性能提升近50%,成本削减83%!约翰·霍普金斯大学发布专业领域提示优化框架
约翰·霍普金斯大学提出的EGO-Prompt框架通过进化图优化技术,显著提升了小型语言模型在专业领域任务中的性能,同时大幅降低推理成本。该框架的核心创新在于将...