标签:状态追踪

DeepMind:Transformer存在拓扑缺陷,思维链治标不治本

当前大语言模型普遍采用思维链机制来提升推理能力,但这导致推理成本大幅上升。谷歌DeepMind的研究指出,Transformer架构本身存在不擅长追踪状态的结构性缺陷...