OpenAI工程师不写代码了：AI写得太快，人类检查跟不上，Agent直接包办开发

48 0 0

文章摘要

OpenAI内部研发出现重大变化，其工程师已很少手写代码，一个内部项目在五个月内产出100万行代码，从零搭建出覆盖应用逻辑、基础设施、工具文档全环节的完整软件内部Beta版，所有代码全部由Codex生成。这种转变和OpenAI自下而上的工程师文化密切相关，公司保持小团队快决策的创业氛围，工程师拥有极高自主权，项目多由研究员自发发现问题、小团队围绕创意推进，Codex本身就源自十几人小团队七周从创意到上线的快速推进。

在大规模应用Codex生成代码后，研发团队发现新瓶颈，AI生成代码的速度已经足够，最容易卡住的环节变成人工检查代码的QA环节。为此团队转变开发思路，干脆让Codex模仿工程师，自己去“看”和“用”应用，最终形成了“人类掌舵，智能体执行”的Harness Engineering，即AI驾驭工程开发新模式。在新模式下，人类的角色，从执行者变成系统的设计者和校准者，工程师不再直接写代码，转而拆解任务、设计能力、搭建系统，让agent稳定生成正确代码。工程师具体负责五方面工作：让应用对AI可读，将隐性知识转化为机器可访问的内容，总结出“要给Codex的是一张地图，而不是一本1000页的说明书”，避免过量信息淹没重点；设计边界清晰、规则明确的AI友好架构；将开发审美转化为可执行的“品味不变量”lint规则，让AI自动遵守；清理AI生成的不规范代码，通过编码规则让Codex自动完成重构，避免技术债堆积。

为了支撑全流程自动化，OpenAI为Codex拓展了核心能力：接入Chrome DevTools协议，解决了LLM 本身是看不见 UI 的问题，让Agent可以像人类一样调试操作、完成测试修复；接入完整可观测系统，收集日志、性能指标、调用链数据，让Agent可以排查系统内部问题，形成从发现问题到验证修复的自动反馈循环，可独立完成从写代码到通过评审的完整开发流程。目前这套模式依赖专门设计的仓库结构和工具链，难以直接照搬，AI生成代码长期管控等问题仍在探索，但可以预见软件工程的重点可能会逐渐从“写代码”，转向设计环境、规则和反馈机制，推动AI agent更深入参与复杂软件开发。