Murati翁荔陈丹琦公司发布首个产品,让大模型微调门槛暴降,要重新发明一个OpenAI

AIGC动态13小时前发布 QbitAI
67 0 0
Murati翁荔陈丹琦公司发布首个产品,让大模型微调门槛暴降,要重新发明一个OpenAI

 

文章摘要


【关 键 词】 AI模型微调工具基础设施研究生产力社交模式

Thinking Machines Lab发布了首个产品Thinker,旨在简化模型微调过程。该工具让研究人员能够像修改Python代码一样轻松地进行模型微调,同时保留90%的控制权。联合创始人翁荔指出,GPU价格昂贵且基础设施设置复杂,使得前沿模型的使用具有挑战性,而Thinker正是为了解决这一问题而设计。大神卡帕西评价这一产品“很酷”,认为它在抽象化和可调性之间取得了卓越的平衡。

Thinker是一个灵活的API,专注于语言模型微调。研究人员可以控制算法和数据,而无需担心基础设施管理。首批支持的模型包括Qwen3和Llama3系列,从小模型切换到大模型只需修改一个字符串。Thinker提供了底层训练步骤的API,如forward_backward和sample,同时自动处理调度、扩展和错误恢复。此外,它还使用LoRA技术,允许多个训练任务共享GPU,降低成本并提高实验并行性。微软研究员发现,Thinker采用了经典的REINFORCE算法,配合优势函数,而没有使用梯度裁剪。

微调的优势正在被社区广泛探讨。早期迹象表明,微调不仅能改变大模型的输出风格,还能缩小任务范围。当训练样本数量较大时,微调小模型可能比构建复杂的few-shot prompt更有效。AI应用正逐渐演变为大规模流水线,其中许多环节更适合微调而非提示。Thinker的简化微调过程为实验最佳方案提供了便利。

与此同时,Thinking Machines Lab试图“重新发明一个OpenAI”,重建其早期版本。创始人Murati强调,公司将公开分享研究成果,给予研究人员更多自由。另一方面,OpenAI正朝着社交化方向发展。ChatGPT的APP代码显示,它可能推出“社交模式”,包括群聊功能、头像和昵称设置。这一变化意味着ChatGPT中的“Chat”可能不仅限于人机交互,还包括人类之间的聊天。此外,OpenAI还在开发由Sora 2驱动的“AI抖音”,进一步拓展其社交功能。

原文和模型


【原文链接】 阅读原文 [ 1002字 | 5分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★☆☆☆☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...