标签:量化压缩

VLM 实现 10%的精度提高,13.1倍加速!纽约大学新算法让视觉语言模型更小、更快、更准确

纽约大学的研究团队通过创新的QSVD方法,为视觉语言模型(VLM)的效率提升带来了突破性进展。该方法在普通GPU上实现了高达13.1倍的运行速度提升,同时保持模...