标签:深度学习

比SOTA快9倍,谷歌DeepMind时空重建,把视频变成时空搜索引擎

谷歌DeepMind联合伦敦大学和牛津大学发布的D4RT时空重建框架,彻底改变了传统视频3D重建的方式。D4RT不再采用一次性计算整个场景的笨重方法,而是通过按需查...

陈天奇、贾扬清点赞:Vibe Coding版PyTorch,连论文都是AI写的

英伟达杰出工程师许冰开源了全球首个完全由AI智能体生成的深度学习系统VibeTensor,该项目从底层架构到上层接口的所有代码均由AI生成,没有一行人类编写的代...

租了8张H100,他成功复现了DeepSeek的mHC,结果比官方报告更炸裂

DeepSeek提出的mHC架构通过多流并行设计和双拟随机矩阵约束,解决了传统Transformer在大规模训练中的信号爆炸问题。传统残差连接采用单一信息流设计,而超连...

DeepSeek-V4蓄势待发!梁文锋署名论文或开启第二个DeepSeek时刻

DeepSeek与北京大学联合发布的最新研究论文,展示了下一代模型DeepSeek-V4的架构基础。该模型预计将于2024年2月发布,具备强大的编程能力,可能超越当前市场...

DeepSeek开源大模型记忆模块!梁文锋署名新论文,下一代稀疏模型提前剧透

DeepSeek团队最新研究通过引入条件记忆机制,为Transformer架构补足了原生缺乏的知识查找功能。该研究提出名为Engram的创新模块,其核心思想是将传统N-gram方...

梁文锋DeepSeek新论文!接棒何恺明和字节,又稳了稳AI的“地基”

DeepSeek在2026年初发布了一篇关于mHC(流形约束超连接)的论文,这项研究对Transformer架构中最基础的残差连接(Residual Connection)进行了重要改进。残差...

下载量超 1300 万,昇思 MindSpore:AI 框架迈入“超节点时代”

昇思MindSpore社区在开源五周年之际公布了显著的发展成果:累计下载量突破1300万次,核心贡献开发者超过5.2万人,代码核入量达12万次,服务全球150多个国家和...

浙江大学研究员彭思达:底层空间感知技术对训练机器人有何作用?丨GAIR 2025

浙江大学研究员彭思达在GAIR 2025论坛上提出,人类行为数据可作为训练人形机器人的重要资源,通过采集人类日常活动记录,结合空间感知技术解决具身智能领域的...

统一视觉多模态与多任务!快手可灵与港科大团队发布视频生成模型,加速真实世界理解

统一多模态多任务的视频生成模型UnityVideo通过整合多种视觉模态,显著提升了模型对物理世界的理解能力和生成质量。该模型由港科大、港中文、清华大学和快手...

何恺明NeurIPS 2025演讲盘点:视觉目标检测三十年

NeurIPS 2025会议上,由任少卿、何恺明、Ross Girshick和孙剑合著的《Faster R-CNN》论文荣获'时间检验奖',这标志着该工作对计算机视觉领域长达十年的深远影...
1 2 3 16