Inflection-2.5：性能可与GPT-4和Gemini相媲美的大模型

AIGC动态2年前 (2024)发布 damoxingLab

3,207 0 0

模型信息

【模型公司】 月之暗面
【模型名称】 moonshot-v1-32k
【摘要评分】 ★★★☆☆

文章摘要

【关键词】 Inflection AI、LLM进展、融资成功、AI集群、性能突破

近期，Inflection AI 在大型语言模型（LLM）领域取得了显著进展，其推出的Inflection-2.5模型在性能上与 OpenAI 的 GPT-4 和 Google 的 Gemini 等顶尖 LLM 相媲美。这一成就得益于公司最近完成的一轮 13 亿美元融资，由微软、英伟达以及知名投资者如 Reid Hoffman、Bill Gates 和 Eric Schmidt 领投，使得 Inflection AI 累计筹集的资金达到了 15.25 亿美元。

Inflection AI 正在与 CoreWeave 和英伟达合作，构建全球最大的 AI集群，该集群由 22000 张 NVIDIA H100 Tensor Core显卡构成，这在历史上是前所未有的。这一强大的计算能力将助力公司培训和部署新一代大规模 AI模型，并在个人AI 领域取得突破。Inflection AI 的集群在开源基准 MLPerf 上展现了先进性能，仅用 11 分钟就完成了 LLM 的训练任务，成为该基准上最快的集群。

Inflection AI 之前发布的 Inflection-1模型在多项基准测试中超越了包括 GPT-3.5、LLaMA、Chinchilla 和 PaLM-540B 在内的行业巨头。用户可以通过自然的方式与 Inflection AI 的个人 AI —— Pi 互动，获得快速、相关、有价值的信息和建议。Inflection AI 对透明度和可重复性的承诺体现在其发布的技术备忘录上，详细介绍了 Inflection-1 在多个基准测试中的评估和表现。

Inflection-2.5模型现已面向所有使用 Pi 的用户开放，支持 Web端、iOS、Android 以及全新的桌面应用等多个平台。这一整合是 Inflection AI 实现其“为每个人打造个人 AI”使命的重要里程碑。在性能方面，Inflection-2.5 在各类智力导向任务中的表现达到了 GPT-4 的 72%，而在 STEM领域，Inflection-2.5 的平均性能达到了 GPT-4 的 94%，尤其在编程和数学领域表现出色。

Inflection-2.5 在行业基准测试中也展现出色表现，尤其是在 MMLU基准和 GPQA Diamond基准上，与 Inflection-1 相比有明显提升。在匈牙利数学考试和物理GRE 中，Inflection-2.5 展现了出众的表现。Inflection-2.5 不仅保持了 Pi 的个性化特点和安全标准，还提升了其作为多功能且极具价值的个人 AI 的地位。

Inflection AI 提供了 Inflection-2.5 在各行业基准测试中的全面技术结果和细节，履行了其对透明度和可重复性的承诺。尽管这些评估代表了 Pi动力模型的性能，但用户的实际体验可能会因网络检索、少样本提示的结构和其他生产端差异等因素略有不同。

总结来说，Inflection-2.5 代表了在 LLM领域的一次重大飞跃，其性能可与行业标杆相媲美，同时只使用了一小部分计算资源。Inflection-2.5 集成到 Pi 中，将原始功能与同理心个性和安全标准相结合，提供了丰富的用户体验。Inflection AI 的前瞻性不仅体现在模型开发上，还在于公司意识到了预训练和微调对于创造高质量、安全、有用的 AI 体验的重要性。作为一个垂直整合的 AI 工作室，Inflection AI 自行处理了从数据摄入、模型设计到高性能基础设施的整个过程，不断突破 LLM 的极限，引领 AI 社区期待其接下来的新突破。