标签:扩散模型
谢赛宁REPA得到大幅改进,只需不到4行代码
反直觉的发现颠覆了传统认知:驱动生成模型性能的关键因素并非预训练视觉编码器的全局语义信息(如ImageNet分类准确率),而是其提取的空间结构特征。一项由A...
华为新开源!扩散语言模型突破32K上下文,还解锁了「慢思考」
华为发布openPangu-R-7B-Diffusion模型,标志着文本生成领域从自回归向扩散语言模型的重要范式转变。该模型基于openPangu-Embedded-7B进行少量数据续训练,成...
何恺明团队重磅新作:去掉VAE,无需Tokenizer,纯Transformer预测数据比预测噪声更高效
麻省理工学院何恺明团队发布了一项颠覆性研究,直指当前扩散生成模型的核心痛点。研究指出主流模型实际上并没有在做去噪工作,回归最原始的洁净数据预测才是...
视觉生成的另一条路:Infinity 自回归架构的原理与实践
以ChatGPT、DeepSeek为代表的大语言模型取得了巨大成功,但在视觉生成领域,扩散模型仍是主流方法。视觉自回归方法因其更好的scaling特性和统一理解与生成任...
长文本生成迎来新突破:拓元智慧推出 DrDiff ,实现效率与质量双提升
DrDiff框架通过动态资源调度机制,解决了长文本生成中效率与质量难以兼得的根本性挑战。该框架由拓元智慧团队联合中山大学、阿里巴巴及Snap Inc的研究团队开...
谢赛宁团队用RAE实现从8%到84%的飞跃,宣告VAE时代结束
谢赛宁团队提出的表征自编码器(RAE)架构在图像生成领域取得重大突破,将ImageNet图像生成的FID指标提升至1.13,标志着传统变分自编码器(VAE)时代的终结。...
蚂蚁dInfer框架,让扩散大语言模型推理速度再飙10倍,相同模型性能下超越自回归模型
蚂蚁集团开源了业界首个高性能扩散语言模型推理框架dInfer,旨在解决扩散模型在推理效率上的瓶颈问题。长期以来,自回归模型在自然语言处理领域占据主导地位...
北航团队提出新的离线分层扩散框架:基于结构信息原理,实现稳定离线策略学习|NeurIPS 2025
北航彭浩团队的研究提出了一个名为SIHD的新型框架,旨在解决离线强化学习中分层扩散模型的局限性。该框架通过分析离线轨迹中的结构信息,自适应地构建多尺度...
清华、NVIDIA、斯坦福提出DiffusionNFT:基于前向过程的扩散强化学习新范式,训练效率提升25倍
清华大学朱军教授团队、NVIDIA Deep Imagination研究组与斯坦福Stefano Ermon团队联合提出了一种名为Diffusion Negative-aware FineTuning(DiffusionNFT)的...
「流匹配」成ICML 2025超热门主题!网友:都说了学物理的不准转计算机
生成式AI领域的最新研究热点集中在探索更高质量、更稳定、更简洁且更通用的模型形态,其中流匹配(Flow Matching)技术成为了焦点。流匹配技术源自流体力学,...





