热门Harness项目OpenSquilla：拯救烧token烧到绝望的Agent们，估值1亿

54 0 0

文章摘要

当前AI应用公司面临严峻的算力账单挑战，对于Agent产品而言，token毛利通常需要达到30%以上才能使商业模式进入可循环状态。在模型厂商下调单价的背景下，控制单次任务的实际消耗量成为企业生存的核心。为此，在应用和底层模型之间增加一层运行中枢变得至关重要。由基元律动开发的开源框架OpenSquilla，正是致力于降低运行过程中的浪费率，并凭借该技术理念完成了高估值融资。

该框架通过四个核心环节实现成本与能力的优化。首先是智能路由机制，系统在任务进入模型前判断复杂度，并将其匹配到最合适的模型。这种将成本从事后结算转变为调用前决策的方式，有效避免了所有步骤均调用昂贵模型带来的浪费，在保证精度的同时大幅降低了整体调用开销。其次是上下文管理，系统通过按需加载技能说明、精准检索记忆片段以及裁剪无关的工具返回内容，确保模型仅处理与当前任务紧密相关的信息，进一步压缩了因上下文冗余造成的无效消耗。

在任务编排方面，框架引入了MetaSkill机制。面对庞大的技能库，系统能够根据用户目标自动拆解执行步骤、选择最优技能组合并安排依赖关系。这一设计使得Agent的核心竞争力从单一模型的推理能力，升级为多种系统能力的自动化组织，极大隐藏了底层复杂度并降低了普通用户的使用门槛。此外，系统构建了可进化机制，能够持续学习用户的上下文与修改反馈。当用户对结果进行纠正并认可后，系统会将交互经验沉淀至工作流中，使得后续处理类似任务时无需重复试错，从根源上减少了多轮对话带来的额外开销。

作为离用户上下文最近的架构层，运行中枢不仅能够深度学习上下文，更是决定Agent能力发挥上限和成本压缩下限的关键所在。随着人工智能技术步入商业化阶段，这层中间架构将帮助应用端实现对账单的精准控制与自我进化，最终在底层模型能力与前端场景之间构建出全新的商业动态平衡。