标签:深度学习

颠覆传统RAG,创新大模型检索增强—Insight-RAG

Megagon实验室的研究人员提出了一种创新框架Insight-RAG,旨在解决传统RAG方法在检索深度和多源信息整合方面的不足。传统RAG方法依赖表面相关性检索文档,容...

OpenAI、谷歌等一线大模型科学家公开课,斯坦福CS 25春季上新!

斯坦福大学的CS25课程专注于Transformer架构,吸引了众多AI领域的顶尖研究者参与。这门课程的最新版本「CS25: Transformers United V5」邀请了Google DeepMin...

抖音公开了他们的推荐算法原理,强烈推荐一读

抖音最近公开了其推荐算法的逻辑,揭示了如何通过机器学习预测用户行为,并实现高效的信息匹配。推荐算法的本质是一个信息过滤系统,通过分析用户的历史行为...

清华系具身智能公司「千寻智能」获 5.28 亿元 Pre-A 轮融资

具身智能领域近期迎来重要进展,清华系公司千寻智能完成5.28亿元Pre-A轮融资,由阿美风险投资旗下Prosperity7 Ventures领投,招商局创投、广发信德等多家资本...

腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?

近年来,Transformer架构在自然语言处理领域取得了显著成就,但其计算复杂度和内存占用问题逐渐成为瓶颈。与此同时,Mamba作为一种新兴的状态空间模型(SSM)...

13年后,AlexNet源代码终于公开:带注释的原版

谷歌首席科学家 Jeff Dean 宣布,谷歌与计算机历史博物馆(CHM)合作,共同发布了 AlexNet 的源代码,并将长期保存这些代码。AlexNet 是一个由多伦多大学研究...

团队“DeepSeek”化!字节 Seed Edge启动不足两月,冲刺AGI再发新作,训练成本再节省40%

字节跳动正式设立了代号为“Seed Edge”的研究项目,旨在探索通用人工智能(AGI)的新方法。该项目团队近期发布了一项名为Comet的关键优化技术,该技术针对MoE...

MIT 最新扩散模型课程:从微分方程探索 AIGC 的边界

MIT计算机系教授Peter Holderrieth和Ezra Erives在其最新课程系列“Generative AI with Stochastic Differential Equations”中,深入探讨了生成式人工智能(AI...

DeepSeek最新论文解读:NSA,物美价廉的超长上下文方案

DeepSeek最新提出的原生稀疏注意力(NSA)机制解决了传统稀疏注意力技术在训练与推理阶段的割裂问题。传统方法通常只能在推理阶段应用稀疏注意力,导致模型能...

刘知远详解 DeepSeek 出圈背后的逻辑:自身算法的创新以及 OpenAI 的傲慢

在探讨人工智能(AI)如何赋能全人类,实现大模型和通用人工智能的普及时,高效性成为了一个核心议题。智能革命被认为将经历与信息革命相似的阶段,即提高能...
1 2 3 12