标签:量化压缩

内存股集体大跌,原因竟是谷歌这篇一年前的论文

谷歌近日发布的一项名为TurboQuant的新型压缩技术,引发全球内存芯片股集体重挫。该技术首次公开于2025年4月的arXiv论文《TurboQuant: Online Vector Quantiz...

VLM 实现 10%的精度提高,13.1倍加速!纽约大学新算法让视觉语言模型更小、更快、更准确

纽约大学的研究团队通过创新的QSVD方法,为视觉语言模型(VLM)的效率提升带来了突破性进展。该方法在普通GPU上实现了高达13.1倍的运行速度提升,同时保持模...