Thinking Machines 发布 Tinker API，实现灵活的模型微调

72 0 0

文章摘要

Thinking Machines 公司推出的 Tinker API 为开放权重语言模型的微调提供了新的解决方案。该服务通过抽象化集群管理，使开发者能够通过简单的 Python 调用进行模型微调，显著降低了基础设施开销。 Tinker 支持从小型模型到大型混合专家系统（如 Qwen-235B-A22B）的多种架构，开发者仅需更改代码中的字符串即可实现模型切换。其提供的原语（如 forward_backward 和 sample）为后训练方法提供了灵活的构建块，同时集成了 LoRA 技术，有效提高了 GPU 内存利用率，特别适合资源有限的研究团队。

为了帮助开发者快速上手，该公司还发布了开源项目 Tinker Cookbook，其中包含强化学习方法和偏好优化等常见微调技术的实现案例。普林斯顿、斯坦福等机构的早期用户已将其应用于定理证明、化学推理和多智能体强化学习等前沿领域。与 Hugging Face 的 Trainer API 或 OpenAI 的微调端点不同，Tinker 的设计理念更侧重于暴露底层原语，在提供高度控制权的同时避免了基础设施管理的复杂性。

行业专家对 Tinker 的平衡设计给予了积极评价。AI 专业人士 Ignacio de Gregorio 认为，该方案成功解决了企业在分布式训练中的痛点，实现了目标与资源外包的平衡。创始人 Mira Murati 强调，Tinker 通过清晰的抽象层处理了分布式训练的复杂性，既支持创新研究，又提供了可靠的基线参考。

目前该平台处于封闭测试阶段，采用早期免费、后期按量计费的商业模式。开发者和研究团队可直接向 Thinking Machines 申请访问权限。随着 Tinker 的推出，开放权重模型的微调领域将迎来更灵活、更易用的工具选择。