标签:深度学习
从「时域建模」到「频域融合」:中山大学团队为传感器人体活动识别提供新思路 | TPAMI 2026
中山大学团队在传感器人体活动识别领域提出了一种名为三重频域融合的创新框架,从物理机制层面突破了该领域长期存在的核心瓶颈。现有方法通常将惯性测量单元...
去往 Capital One 的俞栋,曾是 Hinton 的「救命恩人」
原腾讯AI Lab首席科学家俞栋近日加入Capital One担任副总裁,负责AI基础研究工作,这一动向折射出顶尖技术专家向金融机构流动的显著趋势。早在2009年前后,俞...
计算所程学旗团队:随机剪枝 AI 攻击策略,让对抗样本更具「通用攻击力」丨CVPR 2026
深度学习已广泛应用于自动驾驶、智能安防、医疗影像分析、智能终端等计算机视觉关键场景,但深度神经网络存在决策边界脆弱性问题,人类几乎无法察觉的微小输...
FlashAttention-4正式发布:算法流水线大改,矩阵乘法级速度
经过一年开发,深度学习底层优化技术FlashAttention推出大版本更新FlashAttention-4,专门适配新一代Blackwell架构GPU。在Blackwell GPU上,注意力机制的执行...
比SOTA快9倍,谷歌DeepMind时空重建,把视频变成时空搜索引擎
谷歌DeepMind联合伦敦大学和牛津大学发布的D4RT时空重建框架,彻底改变了传统视频3D重建的方式。D4RT不再采用一次性计算整个场景的笨重方法,而是通过按需查...
陈天奇、贾扬清点赞:Vibe Coding版PyTorch,连论文都是AI写的
英伟达杰出工程师许冰开源了全球首个完全由AI智能体生成的深度学习系统VibeTensor,该项目从底层架构到上层接口的所有代码均由AI生成,没有一行人类编写的代...
租了8张H100,他成功复现了DeepSeek的mHC,结果比官方报告更炸裂
DeepSeek提出的mHC架构通过多流并行设计和双拟随机矩阵约束,解决了传统Transformer在大规模训练中的信号爆炸问题。传统残差连接采用单一信息流设计,而超连...
DeepSeek-V4蓄势待发!梁文锋署名论文或开启第二个DeepSeek时刻
DeepSeek与北京大学联合发布的最新研究论文,展示了下一代模型DeepSeek-V4的架构基础。该模型预计将于2024年2月发布,具备强大的编程能力,可能超越当前市场...
DeepSeek开源大模型记忆模块!梁文锋署名新论文,下一代稀疏模型提前剧透
DeepSeek团队最新研究通过引入条件记忆机制,为Transformer架构补足了原生缺乏的知识查找功能。该研究提出名为Engram的创新模块,其核心思想是将传统N-gram方...
梁文锋DeepSeek新论文!接棒何恺明和字节,又稳了稳AI的“地基”
DeepSeek在2026年初发布了一篇关于mHC(流形约束超连接)的论文,这项研究对Transformer架构中最基础的残差连接(Residual Connection)进行了重要改进。残差...



