斯坦福MIT天团出手!1美元养龙虾,图文视频全包,打工人神外挂

AI-Agent2小时前发布 AIera
58 0 0
斯坦福MIT天团出手!1美元养龙虾,图文视频全包,打工人神外挂

 

文章摘要


【关 键 词】 多模态融合高性价比模型Agent自动化自进化AIRLAF框架

Agnes平台近期在Zenmux平台上正式上线其核心模型矩阵,涵盖文本Agent与多模态生成两大方向,显著提升开发者工具链的完整性与可用性。此次发布包含四款主力模型:Agnes-1.5-Lite(35B)、Agnes-1.5-Pro(120B)两款语言模型,Agnes-Image-1.2(20B)图像编辑模型及Agnes-Video-V1.2(19B)视频生成模型,形成覆盖文本、图像、视频的全栈能力体系。

AgnesClaw作为核心入口,以低至1美元的订阅门槛提供“养龙虾”级体验,实现零学习成本部署并支持技能库扩展。 其依托自研“龙虾”基座模型,在架构上整合隐式MoE、Mamba-2与原生多模态早融合技术,有效解决超长上下文、高频调用与多智能体协作三大挑战,并打破传统“规模-延迟-记忆”三元悖论。该模型在PinchBench榜单中于准确性维度表现突出,被定位为“下一代极速多模态混合专家模型”。

Agnes-Image-1.2在开源模型中评分排名第一(4.25/5),人像任务指标全面提升——Portrait从3.98跃升至4.30,Extract与Viewpoint亦有显著增长。 这一成果得益于针对性微调策略,强化了面部细节保真度与局部编辑可控性。此外,其在目标区域分离与几何结构稳定性方面也具备可靠表现,适用于复杂编辑场景。

完整模型家族覆盖研究、办公、语音视频等多重场景。 Agnes-Search(30B)实现在内部测试中推理成本下降78.6%、生成速度提升18.6%;Agnes-DeepResearch(30B)在基准测试中准确率平均提升14.3%,引用准确率达100%;Agnes-Slides(30B)可1分钟内将网页或文档自动转化为15–20页PPT,单页生成成本仅数美分;东南亚小语种模型Agnes-SeaLLM则成为当地SOTA解决方案。

技术底层创新体现在持续训练路径与自进化能力构建上。 Agnes采用从CPT到PT再到RL的演进路径,并引入RLAF(Reinforcement Learning with Agentic Feedback)框架,通过DSPO与UV两大自研组件减少人工依赖。其中DSPO相较DeepSeek Search-R1(7B)取得34.1%性能增益,而UV以多AI Agent协同评估替代人工标注,实现“AI训练AI”的闭环迭代模式。

模型上线首周即超越多家头部公司同类产品调用量,展现出强劲市场接受度与开发者活跃度。 业界正从单纯追求参数规模转向关注成本效率与真实使用体验,Agnes通过工具集成化、部署轻量化与任务自动化三大特性,正在重塑开发者对AI生产力的认知边界,标志着其由理论研究向产业落地的关键跨越。

原文和模型


【原文链接】 阅读原文 [ 2231字 | 9分钟 ]
【原文作者】 新智元
【摘要模型】 qwen3-vl-flash-2026-01-22
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...