标签：量化压缩

内存股集体大跌，原因竟是谷歌这篇一年前的论文

谷歌近日发布的一项名为TurboQuant的新型压缩技术，引发全球内存芯片股集体重挫。该技术首次公开于2025年4月的arXiv论文《TurboQuant: Online Vector Quantiz...

AIGC动态

1周前

VLM 实现 10%的精度提高，13.1倍加速！纽约大学新算法让视觉语言模型更小、更快、更准确

纽约大学的研究团队通过创新的QSVD方法，为视觉语言模型（VLM）的效率提升带来了突破性进展。该方法在普通GPU上实现了高达13.1倍的运行速度提升，同时保持模...

AIGC动态

5个月前