标签:双向注意

Mythos阴影里谷歌悄悄发模型,速度暴涨4倍

谷歌近期发布了DiffusionGemma文本生成模型,该模型摒弃了传统的自回归逐Token生成方式,转而采用扩散模型架构。通过在包含256个Token的画布上从随机噪声出发...