Cursor自研新模型反超Opus 4.6，价格还“打一折”！网友实测：只有它写完应用能一次跑通

45 0 0

文章摘要

Cursor 发布第二代编程大模型 Composer 2.0，并已集成至 IDE 中。在 Terminal-Bench 2.0 测试中，Composer 2.0 反超 Claude Opus 4.6；在 SWE-bench Multilingual 测试中，其得分达 73.7%，接近 Opus 4.6 的 77.83%。为验证实际能力，一名开发者实测显示，三者规划阶段耗时相近（约5分钟），但执行阶段差异显著：Composer 2.0 生成应用可直接运行，而 Opus 与 GPT-5.4 均受 CORS 问题阻滞，需人工调试。实际耗时上，Composer 2.0 仅用5分钟，而另两者分别为19分钟和22分钟；成本方面，前者花费6.04美元，后者分别为10.43美元与14.15美元。

Cursor 当前正面临结构性挑战——传统以 IDE 为核心入口的开发模式正在被“智能体自主完成任务”新范式替代。开发者越来越多选择直接调用 CLI 智能体（如 Claude Code、Codex）独立完成任务，导致代码编辑器重要性下降，甚至被视为冗余。这使 Cursor 的核心竞争力从“整合顶级AI模型”转向“提供不可替代的操作环境”，而当前自身缺乏底层模型能力，难以阻挡上游厂商向下渗透、下游用户向外迁移的双重挤压。

为应对危机，Cursor 实施三大战略调整：第一，自研模型弥补短板；第二，转向多智能体协作架构，将 IDE 从“文件中心”升级为“任务中心”，提升并行处理能力；第三，强化企业市场布局，利用客户迁移周期长、合规要求高等特点稳住阵地。此外，公司积极引入 DeepSeek、Kimi、Qwen 等开源模型，通过二次训练与强化学习打造定制化编码模型，实现更高效率与更低开销。

在技术演进与市场变革交织的临界点上，Cursor 的转型不仅关乎单次版本迭代，更是一场对存在逻辑的重新定义——它必须证明自己不仅是优秀工具容器，而是具备模型能力、系统集成力与新型交互路径的综合 AI 编程平台。