标签:推理模型

o3曝智商高达157,比肩爱因斯坦碾压99%人类!陶哲轩水平AI或出现

OpenAI的o3模型因其高达157的智商而受到广泛关注,这一智商水平超过了99%的人类,引发了关于人工智能发展速度和潜力的讨论。o3模型的智商是基于Codeforces编...

OpenAI o3震撼觉醒,AGI今夜降临?血洗o1,破解陶哲轩最难数学题

OpenAI最近推出了其下一代推理模型o3,这是一个在多个领域刷新了现有最佳性能(SOTA)的模型。o3在数学、编程和软件工程等领域的表现超越了前代o1,特别是在A...

OpenAI发布o3,更强也更贵了,仨月更新一代只为证明AGI还有戏

OpenAI在“12 Days of OpenAI”活动的最后一天宣布了其推理模型系列的最新旗舰成员:o3和o3 mini。这两款模型在性能上取得了重大突破,特别是在编程和数学领域...

PK OpenAI o1,国产模型在高难度数学和算法竞赛的能力几何?

在人工智能领域,推理模型的竞争日益激烈,尤其是OpenAI的o1系列模型在科学领域应用中取得了显著成就。国产模型如上海人工智能实验室的InternThinker-Alpha、...

阿里发布推理模型QwQ-32B-Preview,性能超OpenAI o1-preview

阿里巴巴的Qwen团队最近发布了QwQ-32B-Preview,这是一个拥有325亿参数的推理模型,能够处理高达32,000个Token的提示词,并且是首个在宽松许可下可供下载使用...

推理性能直逼o1,DeepSeek再次出手,重点:即将开源

DeepSeek最近推出了一款新的推理模型DeepSeek-R1-Lite-Preview,这款模型在多个权威评测中超越了包括GPT-4o在内的顶尖模型,甚至在某些方面领先于OpenAI o1-p...

国产模型炸裂登场,国外赞不绝口!OpenAI-o1级性能,免费使用

国产大模型平台DeepSeek最近发布了其全新推理模型DeepSeek-R1-Lite预览版,该模型以深度思维链推理为特色,在数学、代码和复杂推理任务上表现出色,能够生成...

Meta版o1来了!田渊栋团队整合快慢思考,能走迷宫推箱子

Meta FAIR的研究团队最近推出了一款名为Dualformer的新型人工智能模型,该模型能够将快速和慢速思考无缝结合,以提升性能并降低成本。Dualformer在推理轨迹和...

耗资1.3万,ASU团队揭秘o1推理王者!碾压所有LLM成本超高,关键还会PUA

ASU团队的最新研究对OpenAI的新型大推理模型o1-preview进行了全面评估,发现其在推理规划能力方面表现卓越,但成本高昂。研究使用了PlanBench测试基准,结果...

姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致性

清华大学交叉信息研究院的姚期智院士及其团队提出了一种新的大模型推理框架——思维图(DoT),旨在使大型语言模型(LLM)的思考过程更接近人类的推理方式。该...
1 2 3 4 5