标签：并行解码

扩散语言模型新发现：其计算潜力正在被浪费？

掩码扩散语言模型（MDLM）作为一种新兴的生成范式，挑战了传统自回归模型从左到右的token生成方式。这种模型通过训练时随机遮蔽序列位置并学习填充，具备多to...

AIGC动态

4个月前

蚂蚁dInfer框架，让扩散大语言模型推理速度再飙10倍，相同模型性能下超越自回归模型

蚂蚁集团开源了业界首个高性能扩散语言模型推理框架dInfer，旨在解决扩散模型在推理效率上的瓶颈问题。长期以来，自回归模型在自然语言处理领域占据主导地位...

AIGC动态

5个月前

英伟达、港大等发布创新KV缓存，实现扩散模型无训练加速

扩散语言模型（Diffusion Language Models, dLLM）与传统的自回归模型（如GPT系列）在文本生成方式上存在显著差异。扩散模型通过逐步去除文本中的噪声来生成...

AIGC动态

8个月前