标签:并行解码

英伟达、港大等发布创新KV缓存,实现扩散模型无训练加速

扩散语言模型(Diffusion Language Models, dLLM)与传统的自回归模型(如GPT系列)在文本生成方式上存在显著差异。扩散模型通过逐步去除文本中的噪声来生成...