神秘模型「大象」：仅100B拿下SOTA，Token效率超高！

511 0 0

文章摘要

神秘模型 Elephant 终于揭开面纱，由蚂蚁 Inclusion AI 团队研发。该模型大小仅为 100B，具备 256K 上下文窗口及 32 输出能力，主打敏捷属性。在实际体验中，该模型展现出国产版 Grok 4 Fast 的特质，被誉为天生干活圣体。 实测环节涵盖代码修复、文档整理及 Agent 任务。在代码修复测试中，模型能精准定位错误并以极简方式解决，避免多余废话从而节省 Token 消耗。会议内容整理测试显示，模型能剔除无用信息并严格按照格式输出，相比竞品更节省 Token。Agent 任务模拟中，模型仅用 10 秒思考及 2 秒输出即可完成数据分析与自检。权威榜单 AI BENCHY 评测显示，大象模型输出 Token 维持在 2500 左右，平均时延压制在 1 秒左右，一致性分数高达 9.6 分。

尽管性能优异，模型也存在局限性。对于复杂长链规划任务，因缺乏特定工具支持，模型直言无法执行，建议采用大模型规划配合其执行的模式。面对非常新的知识或最新 SDK 代码，模型可能产生幻觉，需在 Prompt 中注入最新文档。此外，过于模糊的 Prompt 也会影响输出质量，因此使用时需确保指令细致且具有约束力。

当前行业趋势正从比拼模型规模转向关注智效比。过去几年时间里，AI 圈似乎都在比拼谁的模型更大、谁的训练成本更贵，但行业走到今天，需要有人站出来做减法。全球企业级 AI 应用中约有 50% 的 Token 正在被浪费，每一块钱都要花出响动成为工程落地铁律。 随着 OpenAI 和谷歌纷纷推出小型模型，轻量化模型成为中小企业追求极致投入产出比的选择。无需为冗余 Token 支付高额算力成本，无需采购昂贵硬件部署大模型，轻量化的大象就能无缝承接代码开发、文档处理、数据复盘及轻量 Agent 执行等高频刚需工作。在动辄消耗几十万 Token 的长文本办公场景中，响应压制在 1 秒内、少说废话的高效模型，正在成为 AI 从玩具跨越到生产力工具的坚实底座。 快、准、省正在成为 AI 高效上岗的标准。