Claude Code大泄露:别光Clone了,当今最顶Harness开源了

AI-Agent2小时前发布 Si-Planet
55 0 0
Claude Code大泄露:别光Clone了,当今最顶Harness开源了

 

文章摘要


【关 键 词】 生产级Harness上下文工程工具调度子代理隔离Hook平台

本文系统剖析了Anthropic开源的Claude Code项目中所展现的生产级agent harness设计思想与工程实践,核心聚焦于如何将模型能力转化为稳定、可复现的工程系统。文章指出,当前行业常将agent失败归咎于模型能力不足,但实际瓶颈在于缺乏严谨的系统级架构支撑;Claude Code正是以自身为样本,完整呈现了一套高度结构化、工程化的解决方案。其核心理念是“模型只是引擎,harness才是整辆车”,并基于大量真实场景问题构建出可落地的技术框架。

在存储层,团队针对“上下文退化”(context rot)难题采用分层约束策略:Skill列表仅占窗口1%且限制250字符,避免冗余信息稀释注意力——“描述写500字和写50字匹配率没有差别,多出来的全是浪费。”;System prompt拆分为固定缓存部分与动态变化部分,实现API调用效率优化;大型工具输出结果不塞入上下文,而是以文件路径引用替代,极大释放上下文容量。“大的工具调用结果不放上下文,直接写到磁盘,给模型一个文件路径。”此外,面对“context anxiety”导致的模型急促收尾问题,系统构建三级压缩机制,仅当一级失败后才触发更激进策略,并设定了连续失败3次自动熔断规则——“连续失败3次就停,不再尝试。”该机制源自BigQuery统计分析,精准定位无效操作损耗源头。

记忆模块上,系统拒绝全量缓存,转而通过后台子agent定期提炼关键语句注入新上下文;但非简单回溯,而是由Sonnet模型判断相关性,对刚使用过的工具文档实施过滤——“刚用过的工具,它的参考文档不会被推进来:只是重复信息,占位置没有额外价值。”这一设计既节省token,又确保上下文焦点始终贴近任务目标。

网络层强调工具接入需有明确边界与调度逻辑:50+工具采用延迟加载模式,除ToolSearch外,其他工具仅在需要时触发完整定义;工具属性如并行性、文件修改权限等直接嵌入调度引擎,成为执行决策依据。“每个工具还带着一套属性……是调度引擎决定怎么执行这个工具的依据。”对于用户确认环节,则引入前瞻性分类器预判,在弹窗启动前完成风险评估,大幅减少响应延迟——“如果分类器判断‘这个命令大概率没问题’,弹窗直接跳过。”

容器层的sub-agent设计体现上下文隔离原则:支持同步、异步后台、Worktree文件隔离及跨机器四种运行模式,按风险程度灵活选配;子agent拥有独立生命周期,其创建连接由自身管理,与父代理共享连接则不予破坏——“子 agent 自己建的连接,退出时自己关。复用父 agent 已有的连接,不能关,因为父 agent 还在用。”

最后一项重要升级是Hook系统,开放27个事件节点允许外部干预,使原生harness变为可扩展底座:不仅拦截,还可篡改输入输出;支持脚本式与Haiku模型驱动式两种插件形态——“插进来能干什么?不只是拦截,还能改。”这种设计让不同企业安全合规要求得以轻量化适配,无需深度定制即可达成定制化需求。

整体来看,Claude Code 512000行代码的深层价值不在模型本身,而在于它提供了从理论走向工业生产的完整方法论——“问题比‘哪个模型更聪明’更难回答,也更值钱。” 文章强调,此类架构并非独创,而是任何希望将agent投入实战的企业必须跨越的关键阶段。

原文和模型


【原文链接】 阅读原文 [ 2997字 | 12分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 qwen3-vl-flash-2026-01-22
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...