热门Harness项目OpenSquilla:拯救烧token烧到绝望的Agent们,估值1亿

AI-Agent2小时前发布 Si-Planet
54 0 0
热门Harness项目OpenSquilla:拯救烧token烧到绝望的Agent们,估值1亿

 

文章摘要


【关 键 词】 智能体模型成本智能路由降本增效运行中枢

当前AI应用公司面临严峻的算力账单挑战,对于Agent产品而言,token毛利通常需要达到30%以上才能使商业模式进入可循环状态。在模型厂商下调单价的背景下,控制单次任务的实际消耗量成为企业生存的核心。为此,在应用和底层模型之间增加一层运行中枢变得至关重要。由基元律动开发的开源框架OpenSquilla,正是致力于降低运行过程中的浪费率,并凭借该技术理念完成了高估值融资。

该框架通过四个核心环节实现成本与能力的优化。首先是智能路由机制,系统在任务进入模型前判断复杂度,并将其匹配到最合适的模型。这种将成本从事后结算转变为调用前决策的方式,有效避免了所有步骤均调用昂贵模型带来的浪费,在保证精度的同时大幅降低了整体调用开销。其次是上下文管理,系统通过按需加载技能说明、精准检索记忆片段以及裁剪无关的工具返回内容,确保模型仅处理与当前任务紧密相关的信息,进一步压缩了因上下文冗余造成的无效消耗。

在任务编排方面,框架引入了MetaSkill机制。面对庞大的技能库,系统能够根据用户目标自动拆解执行步骤、选择最优技能组合并安排依赖关系。这一设计使得Agent的核心竞争力从单一模型的推理能力,升级为多种系统能力的自动化组织,极大隐藏了底层复杂度并降低了普通用户的使用门槛。此外,系统构建了可进化机制,能够持续学习用户的上下文与修改反馈。当用户对结果进行纠正并认可后,系统会将交互经验沉淀至工作流中,使得后续处理类似任务时无需重复试错,从根源上减少了多轮对话带来的额外开销。

作为离用户上下文最近的架构层,运行中枢不仅能够深度学习上下文,更是决定Agent能力发挥上限和成本压缩下限的关键所在。随着人工智能技术步入商业化阶段,这层中间架构将帮助应用端实现对账单的精准控制与自我进化,最终在底层模型能力与前端场景之间构建出全新的商业动态平衡。

原文和模型


【原文链接】 阅读原文 [ 3842字 | 16分钟 ]
【原文作者】 硅星人Pro
【摘要模型】 qwen3.7-max
【摘要评分】 ★★★★★

© 版权声明
xunfeiagent

相关文章

trae

暂无评论

暂无评论...