标签:AI压缩

谷歌迎来“DeepSeek时刻”!TurboQuant引爆AI圈、全球开发者疯狂复现:6倍无损压缩,内存股集体暴跌

谷歌研究院近期发布TurboQuant压缩算法,实现了大语言模型运行中键值缓存(KV cache)的极致无损压缩:可将内存占用降低至少6倍,并在H100显卡上实现最高8倍...