Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降，要重新发明一个OpenAI

1,023 0 0

文章摘要

Thinking Machines Lab发布了首个产品Thinker，旨在简化模型微调过程。该工具让研究人员能够像修改Python代码一样轻松地进行模型微调，同时保留90%的控制权。联合创始人翁荔指出，GPU价格昂贵且基础设施设置复杂，使得前沿模型的使用具有挑战性，而Thinker正是为了解决这一问题而设计。大神卡帕西评价这一产品“很酷”，认为它在抽象化和可调性之间取得了卓越的平衡。

Thinker是一个灵活的API，专注于语言模型微调。研究人员可以控制算法和数据，而无需担心基础设施管理。首批支持的模型包括Qwen3和Llama3系列，从小模型切换到大模型只需修改一个字符串。Thinker提供了底层训练步骤的API，如forward_backward和sample，同时自动处理调度、扩展和错误恢复。此外，它还使用LoRA技术，允许多个训练任务共享GPU，降低成本并提高实验并行性。微软研究员发现，Thinker采用了经典的REINFORCE算法，配合优势函数，而没有使用梯度裁剪。

微调的优势正在被社区广泛探讨。早期迹象表明，微调不仅能改变大模型的输出风格，还能缩小任务范围。当训练样本数量较大时，微调小模型可能比构建复杂的few-shot prompt更有效。AI应用正逐渐演变为大规模流水线，其中许多环节更适合微调而非提示。Thinker的简化微调过程为实验最佳方案提供了便利。

与此同时，Thinking Machines Lab试图“重新发明一个OpenAI”，重建其早期版本。创始人Murati强调，公司将公开分享研究成果，给予研究人员更多自由。另一方面，OpenAI正朝着社交化方向发展。ChatGPT的APP代码显示，它可能推出“社交模式”，包括群聊功能、头像和昵称设置。这一变化意味着ChatGPT中的“Chat”可能不仅限于人机交互，还包括人类之间的聊天。此外，OpenAI还在开发由Sora 2驱动的“AI抖音”，进一步拓展其社交功能。