标签:能力加速

专家预测年底才到,Claude Mythos今天就跑出3小时6分!

Anthropic的Claude Mythos模型在METR基准测试中,以80%的成功率完成了长达3小时6分钟的自主任务,成功打破了世界纪录。这一突破提前兑现了专家对2026年底的预...