标签:前沿模型

Anthropic 那个“强到不敢发”的模型,终于来了!

内部测评数据显示新版 Claude Mythos Preview 在多项编码逻辑与安全推理基准上超越了现有竞争对手。其不仅解决了更多极端复杂的开发难题,且在 token 消耗效...

OpenAI研究大模型对GDP贡献,三大行业已能代替人类,并自曝不敌Claude

AI 发展迅速,其颠覆近在眼前,OpenAI 推出名为 GDPval 的新评估方法,用于跟踪模型在具有经济价值的现实世界任务上的表现。GDPval 以国内生产总值 (GDP) 为...