GitHub 通过每日审计与 MCP 精简，将 Agent 工作流 Token 成本最高降低 62%

44 0 0

文章摘要

在持续集成环境中运行大语言模型智能体时，定时执行的自动化任务往往会持续累积隐性成本。为应对这一挑战，相关团队通过统一的接口代理转发所有调用，并详细记录输入、输出和缓存词元的使用情况。为了实现跨模型的成本比较，团队设计了等效词元指标，通过对不同类型词元赋予特定权重并结合模型系数，确保该指标的下降能够准确反映实际成本的降低。

整个优化机制由审计器和优化器两个智能体工作流共同驱动，形成自动化的管理闭环。审计器负责汇总资源消耗并识别高成本任务，优化器则通过分析源码和日志自动创建工单并提供优化建议。在具体实践中，团队发现最常见的低效来源是未被使用的模型上下文协议工具，每次请求携带冗余的工具定义会显著增加上下文负载，而移除这些未使用的工具能够有效减少单次调用的上下文体积。同时，部分数据获取操作被改为直接执行命令行指令，从而避免认证信息泄露。

该优化策略在十多个生产环境工作流中取得了显著成效，多个核心工作流的等效词元消耗降幅达到百分之四十至百分之六十以上。不过，精简工具策略也存在一定的局限性，当工具清单在整体上下文中占比较小时，移除未使用工具对降低总体消耗的作用并不明显。目前的核心创新在于构建了可观测性与自动优化相结合的闭环系统，并将相关工具集成到命令行接口中供开发者使用。

在后续规划中，优化重点将转向工作流组合层面的深度分析。团队计划寻找代码仓库内多个工作流之间重复读取的数据以及可共享的中间产物，旨在通过全局资源复用进一步降低整体智能体工作流的运行成本。这种从单次调用优化向系统级资源共享的演进，将为大规模智能体应用提供更为完善的成本控制路径。