
文章摘要
快手在AI领域的突破性进展集中体现在其最新发布的KAT-Dev-72B-Exp代码大模型上。这款专为软件工程设计的720亿参数模型,在SWE-Bench Verified测试中以74.6%的准确率位居开源模型榜首,与闭源GPT-5仅相差0.3个百分点。该成绩标志着快手在代码智能领域的技术实力已接近行业顶尖水平。
模型架构的创新设计是其核心竞争力的关键。基于自研SeamlessFlow强化学习框架,团队实现了训练逻辑与Agent的完全解耦,支持多智能体和在线强化学习等复杂场景。通过重写注意力内核,模型获得了更高效的代码分析能力,特别擅长处理跨文件的复杂代码库。Trie Packing机制的引入和训练引擎的重构优化,使模型能高效处理共享前缀轨迹,显著提升了对代码库整体结构的理解能力。
强化学习训练方法的突破是另一大技术亮点。采用”基于通过率的优势分布重塑”技术,模型在稳定性和创新性之间取得平衡——既鼓励尝试新方法,又避免过度冒险。这种训练方式使模型通过与环境持续互动来积累经验,而非依赖传统监督学习的标准答案模式,从而培养出更接近人类工程师的问题解决能力。
模型展现出独特的工程化实践能力。不同于通用大模型,KAT-Dev-72B-Exp集成了多智能体协作理念,可直接与开发环境交互:通过结构化XML语言操作文件系统、编辑代码、运行测试脚本,实现从代码生成到验证的完整闭环。这种”会动手”的特性使其更贴近实际开发场景,例如能执行查看项目文件、运行pytest测试等具体操作。
快手的AI战略已形成技术变现的良性循环。公司成立可灵AI事业部整合大模型业务,由高级副总裁亲自带队,持续投入KAT编码大模型系列研发。继开源的32B版本和未公开的KAT-Coder后,此次实验版72B模型的发布,进一步强化了其在编程智能体领域的布局。这种”投入-变现-再投入”的模式,正推动快手突破传统短视频业务的天花板,向技术驱动型公司转型。
该模型的开源属性将影响开发者生态。作为当前性能最强的开源代码模型,KAT-Dev-72B-Exp为构建编程智能体提供了新工具,其创新的强化学习框架和工程实践方案,可能对AI辅助开发领域产生深远影响。快手通过持续的技术输出,正在重塑其从短视频平台到AI技术提供商的双重身份。
原文和模型
【原文链接】 阅读原文 [ 1365字 | 6分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★☆☆