字节前技术负责人创业,联手清华姚班校友,编程智能体世界登顶
文章摘要
【关 键 词】 AI编程、智能体、工程时代、代码修复、企业效能
人工智能编程正经历从快速原型开发向企业级工程实践的范式转变。由Andrej Karpathy提出的Vibe Coding概念虽然能通过自然语言提示生成单脚本代码,但在处理复杂工程问题时暴露出上下文理解深度不足、跨文件修改能力有限等缺陷。词元无限团队开发的InfCode智能体系统在SWE-Bench Verified和Multi-SWE-bench-CPP两项权威基准测试中分别取得79.4%和25.58%的通过率,标志着AI编程进入以多智能体协同为核心的工程化阶段。
InfCode的核心突破在于建立了功能意图驱动的代码定位体系。通过代码意图分析机制,系统能超越传统RAG的字面匹配局限,将自然语言描述映射到具体实现单元。在C++等系统语言场景中,其基于AST的结构化检索引擎可精准识别类定义和成员函数,解决跨文件修改时标识符歧义问题。研究显示,该系统在需要修改200余行代码的复杂任务中仍保持稳定表现。
对抗式双智能体架构构成了InfCode的技术支柱。代码补丁生成器与测试补丁生成器形成闭环迭代:前者负责通过现有测试集,后者持续生成边界用例验证鲁棒性。这种设计使补丁质量随迭代轮次呈指数级提升,最终输出符合工程标准的解决方案。实验数据表明,经过五轮对抗优化的补丁在Multi-SWE-bench-CPP上的通过率较单轮生成模式提升317%。
团队采用生成-筛选两阶段流程确保修复可靠性。在并行生成的容器环境中,系统通过真实构建测试验证补丁的行为一致性和副作用控制。该机制有效避免了过拟合特定测试用例的情况,其筛选出的解决方案平均涉及7.3个文件修改,最长依赖链达到14个函数调用层级,展现出处理企业级复杂依赖的能力。
技术突破背后是兼具学术深度与产业经验的跨学科团队。核心成员包含字节跳动前软件工程实验室负责人、清华姚班算法专家及连续创业者,形成从技术研发到商业落地的完整闭环。该团队正推动AI编程从工具效能层面向软件工程全生命周期演进,其提出的「数字员工」平台概念正在重构传统开发范式。通过将语义理解、语法分析与多智能体协作相结合,InfCode为工业界提供了处理系统级代码库的新方法论,这或许预示着软件开发即将迎来智能体驱动的组织级进化。
原文和模型
【原文链接】 阅读原文 [ 3630字 | 15分钟 ]
【原文作者】 机器之心
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★




