标签:微调技术
逆天!Mata用13个参数26字节让模型正确率从76%飙升至91%
Meta FAIR等机构研究人员开发出一种名为TinyLoRA的极致微调技术,仅需调整13个参数(26字节)即可显著提升大语言模型的数学推理能力。该方法配合强化学习框架...
2张4090竟能本地微调万亿参数Kimi K2!趋境联合清华北航把算力门槛击穿了
微调超大参数模型的成本门槛已被显著降低,仅需2-4张消费级显卡即可在本地完成对DeepSeek 671B或Kimi K2 1TB等万亿级参数模型的微调。这一突破性进展源于KTra...






