登顶！快手发布开源编程模型，720亿参数，创下编程能力新纪录

52 0 0

文章摘要

快手在AI领域的突破性进展集中体现在其最新发布的KAT-Dev-72B-Exp代码大模型上。这款专为软件工程设计的720亿参数模型，在SWE-Bench Verified测试中以74.6%的准确率位居开源模型榜首，与闭源GPT-5仅相差0.3个百分点。该成绩标志着快手在代码智能领域的技术实力已接近行业顶尖水平。

模型架构的创新设计是其核心竞争力的关键。基于自研SeamlessFlow强化学习框架，团队实现了训练逻辑与Agent的完全解耦，支持多智能体和在线强化学习等复杂场景。通过重写注意力内核，模型获得了更高效的代码分析能力，特别擅长处理跨文件的复杂代码库。Trie Packing机制的引入和训练引擎的重构优化，使模型能高效处理共享前缀轨迹，显著提升了对代码库整体结构的理解能力。

强化学习训练方法的突破是另一大技术亮点。采用”基于通过率的优势分布重塑”技术，模型在稳定性和创新性之间取得平衡——既鼓励尝试新方法，又避免过度冒险。这种训练方式使模型通过与环境持续互动来积累经验，而非依赖传统监督学习的标准答案模式，从而培养出更接近人类工程师的问题解决能力。

模型展现出独特的工程化实践能力。不同于通用大模型，KAT-Dev-72B-Exp集成了多智能体协作理念，可直接与开发环境交互：通过结构化XML语言操作文件系统、编辑代码、运行测试脚本，实现从代码生成到验证的完整闭环。这种”会动手”的特性使其更贴近实际开发场景，例如能执行查看项目文件、运行pytest测试等具体操作。

快手的AI战略已形成技术变现的良性循环。公司成立可灵AI事业部整合大模型业务，由高级副总裁亲自带队，持续投入KAT编码大模型系列研发。继开源的32B版本和未公开的KAT-Coder后，此次实验版72B模型的发布，进一步强化了其在编程智能体领域的布局。这种”投入-变现-再投入”的模式，正推动快手突破传统短视频业务的天花板，向技术驱动型公司转型。

该模型的开源属性将影响开发者生态。作为当前性能最强的开源代码模型，KAT-Dev-72B-Exp为构建编程智能体提供了新工具，其创新的强化学习框架和工程实践方案，可能对AI辅助开发领域产生深远影响。快手通过持续的技术输出，正在重塑其从短视频平台到AI技术提供商的双重身份。