文章摘要
【关 键 词】 代码生成、Codex、AI编程、智能体、软件工程
OpenAI内部研发出现重大变化,其工程师已很少手写代码,一个内部项目在五个月内产出100万行代码,从零搭建出覆盖应用逻辑、基础设施、工具文档全环节的完整软件内部Beta版,所有代码全部由Codex生成。这种转变和OpenAI自下而上的工程师文化密切相关,公司保持小团队快决策的创业氛围,工程师拥有极高自主权,项目多由研究员自发发现问题、小团队围绕创意推进,Codex本身就源自十几人小团队七周从创意到上线的快速推进。
在大规模应用Codex生成代码后,研发团队发现新瓶颈,AI生成代码的速度已经足够,最容易卡住的环节变成人工检查代码的QA环节。为此团队转变开发思路,干脆让Codex模仿工程师,自己去“看”和“用”应用,最终形成了“人类掌舵,智能体执行”的Harness Engineering,即AI驾驭工程开发新模式。在新模式下,人类的角色,从执行者变成系统的设计者和校准者,工程师不再直接写代码,转而拆解任务、设计能力、搭建系统,让agent稳定生成正确代码。工程师具体负责五方面工作:让应用对AI可读,将隐性知识转化为机器可访问的内容,总结出“要给Codex的是一张地图,而不是一本1000页的说明书”,避免过量信息淹没重点;设计边界清晰、规则明确的AI友好架构;将开发审美转化为可执行的“品味不变量”lint规则,让AI自动遵守;清理AI生成的不规范代码,通过编码规则让Codex自动完成重构,避免技术债堆积。
为了支撑全流程自动化,OpenAI为Codex拓展了核心能力:接入Chrome DevTools协议,解决了LLM 本身是看不见 UI 的问题,让Agent可以像人类一样调试操作、完成测试修复;接入完整可观测系统,收集日志、性能指标、调用链数据,让Agent可以排查系统内部问题,形成从发现问题到验证修复的自动反馈循环,可独立完成从写代码到通过评审的完整开发流程。目前这套模式依赖专门设计的仓库结构和工具链,难以直接照搬,AI生成代码长期管控等问题仍在探索,但可以预见软件工程的重点可能会逐渐从“写代码”,转向设计环境、规则和反馈机制,推动AI agent更深入参与复杂软件开发。
原文和模型
【原文链接】 阅读原文 [ 3198字 | 13分钟 ]
【原文作者】 AI前线
【摘要模型】 doubao-seed-2-0-lite-260215
【摘要评分】 ★★★☆☆



