标签:扩散模型
CVPR 2026 生成式 AI 观察梳理:视觉模型开始重写默认设定
视觉人工智能领域的技术发展正经历从既定范式内性能堆叠向底层建模范式重构的关键转折。过去依赖的模型扩容与采样微调策略虽能短暂推升基准指标,但当前前沿...
清华段岳圻团队论文:从调参数到做控制,文生图迎来一次方法论升级丨CVPR 2026
实验验证环节构建于多尺度模型集群与分层评价体系之上,同步覆盖数据分布匹配度、跨模态语义一致性以及多维人类视觉偏好。测试数据表明,重构后的控制逻辑在...
上交大 x vivo 团队:一个简单改动,让 diffusion 全面提升丨CVPR 2026
当前生成式人工智能虽具备强大生成能力,但在稳定性与可控性方面仍面临挑战。扩散模型在不同生成阶段对条件信息的依赖程度存在差异,而传统方法默认引导强度...
港大赵恒爽团队论文:让扩散模型既拿高分又不「作弊」丨CVPR 2026
GDRO是一种针对扩散模型的后训练方法,核心创新在于引入组级奖励排序机制以优化生成能力。该方法旨在解决当前生成模型中普遍存在的“奖励作弊”问题——即模型为...
让搜索Agent不「傻等」:人大团队依托扩散模型实现「一心二用」,边等搜索结果边思考,加速15%性能不减
传统搜索Agent普遍采用ReAct框架,执行流程为严格串行的想→调工具→等结果→再想→再调工具→再等……,每轮“思考”与“调用工具”环节完全串行,等待搜索引擎返回结果...
华为发布业界首个扩散语言模型Agent,部分场景提速8倍!
大模型通往现实世界的“最后三公里”中,Agent已成为最具代表性的技术路径。当前行业共识已从单纯追求“答对问题”转向更复杂的评估维度:能否以最短路径、最少交...
大道至简,何恺明团队新作pMF开启像素级「无潜、单步」生成范式
何恺明团队的最新研究提出了一种名为pixel MeanFlow(pMF)的创新框架,旨在解决当前主流扩散模型与流匹配模型在多步采样和潜空间依赖上的局限性。该框架能够...
Sebastian Raschka 2026预测:Transformer统治依旧,但扩散模型正悄然崛起
2026年标志着大型语言模型(LLM)发展进入以效率优化和混合架构为主导的新阶段。尽管Transformer架构仍是当前AI生态系统的基石,但行业焦点已从单纯扩大参数...
自动驾驶VLA新SOTA:复旦联合团队提出WAM-Diff重塑端到端自动驾驶
复旦大学与引望智能科技联合提出的WAM-Diff框架,在NAVSIM-v1榜单上以91.0 PDMS的预测驾驶得分刷新了自动驾驶领域的性能记录。这一端到端自动驾驶系统通过掩...
加速200倍,单显卡1.8秒生成5秒高清视频!清华与Vidu解开了视频扩散模型的速度枷锁
TurboDiffusion技术通过稀疏注意力、蒸馏量化和硬件优化,将视频生成速度提升至实时水平。传统视频扩散模型因计算复杂度高而效率低下,尤其在处理时间连贯性...





