标签:推理模型

新“SOTA”推理模型避战Qwen和R1?欧版OpenAI被喷麻了

Mistral AI发布了其首款推理模型Magistral,该模型旨在提升多语言推理能力和可解释性。Magistral分为两个版本:Magistral Small,一个24B参数的开源权重版本...

苹果炮轰推理模型全是假思考!4个游戏戳破神话,o3/DeepSeek高难度全崩溃

苹果最新发布的大模型研究论文在AI领域引发广泛讨论,其核心观点直指当前推理模型的根本局限性。研究团队通过精心设计的四类可控谜题环境(汉诺塔、跳棋交换...

首次解释LLM如何推理反思!西北大学谷歌新框架:引入贝叶斯自适应强化学习,数学推理全面提升

西北大学与Google、谷歌DeepMind团队提出了一种新的强化学习方法——贝叶斯自适应强化学习(BARL),旨在解决传统强化学习(RL)在反思探索方面的局限性。传统R...

o3崛起,但推理模型离「撞墙」只剩一年?

OpenAI的o3推理模型算力暴增10倍,能力显著提升,但专家警告其可能在一年内撞上算力资源极限。Epoch AI团队认为,推理模型虽有进步空间,但顶尖AI公司难以实...

OpenAI震撼发布o3/o4-mini,直逼视觉推理巅峰!首用图像思考,十倍算力爆表

OpenAI最新发布的满血版o3和o4-mini模型在多个领域展现了卓越的性能,尤其是在视觉推理和工具调用方面实现了重大突破。o3模型首次将图像推理融入思维链,能够...

更长思维并不等于更强推理性能,强化学习可以很简洁

著名研究者和技术作家 Sebastian Raschka 解读了一篇来自 Wand AI 的强化学习研究,该研究分析了推理模型生成较长响应的原因。研究发现,推理模型生成较长响...

推理AI「脑补」成瘾,废话拉满!马里兰华人学霸揭开内幕

推理模型在解决复杂问题时表现出色,但在面对「缺失前提」(MiP)问题时,往往陷入「过度思考」的困境,导致回答长度激增和计算资源浪费。这种现象被称为「缺...

思维链不可靠:Anthropic曝出大模型「诚信」问题,说一套做一套

Anthropic 的最新研究揭示了大型语言模型在思维链推理中的不可靠性,尤其是在其忠诚度方面。尽管这些模型在表面上展示出复杂的推理过程,但研究结果表明,它...

实测豆包刚刚上线的新版深度思考,他们也向DeepSearch迈出了一步。

豆包最新推出的深度思考功能,与传统的推理模型和AI联网搜索有所不同,它将思考与搜索融合在一起,形成了一种更为高效的解决方案。与DeepSeek等平台将深度思...

全球首款音乐推理模型Mureka O1首秀!爆改周杰伦,AI音乐进入DeepSeek时刻

昆仑万维发布了全球首款音乐推理大模型Mureka O1,标志着AI音乐进入了“会思考”的时代。该模型基于Mureka V6基座模型,并引入了CoT(Chain of Thought)技术,...
1 2 3 5