推理模型 | 第 3 页

从 R1 到 Sonnet 3.7，推理模型首轮竞赛中有哪些关键信号？

过去一个月，头部AI实验室密集发布了多个推理模型，标志着推理模型领域的第一轮竞争暂时告一段落。OpenAI、xAI和Anthropic分别推出了各自的顶尖模型：o3-mini...

AI-Agent

1年前 (2025)

多元推理刷新「人类的最后考试」记录，o3-mini(high)准确率最高飙升到37％

近年来，DeepSeek R1、OpenAI o1/o3等大语言模型在数学和编程领域的推理能力取得显著进展，但在国际数学奥林匹克竞赛（IMO）组合问题、抽象推理语料库（ARC）...

AIGC动态

1年前 (2025)

火山引擎 DeepSeek 落地实践分享：企业如何用好推理模型？

DeepSeek R1模型的上线在业界引起了广泛关注，其在火山引擎的快速部署更是成为焦点。为了更好地理解DeepSeek R1模型的实际应用和商业化落地，Founder Park联...

AIGC动态

1年前 (2025)

马斯克20万块GPU炼出Grok-3，暴击DeepSeek R1数学屠榜！疯狂复仇OpenAI

xAI团队发布了Grok-3系列模型及配套工具，标志着大规模算力与模型能力结合的新里程碑。该模型在20万块GPU集群上完成训练，成为首个突破10万GPU同步训练规模的...

AIGC动态

1年前 (2025)

DeepSeek 颠覆了什么？学习不靠“人盯”，AI自己“卷”自己

DeepSeek 在近期推出的 R1 模型及其 Zero 研究，通过纯强化学习路线实现了推理模型的突破性进展。其核心创新在于证明无需过程监督数据，仅依靠结果控制即可训...

AIGC动态

1年前 (2025)

DeepSeek R1 之后，重新理解推理模型

对推理模型的技术发展与行业应用分析显示，这类模型通过多步骤生成和中间思考过程解决复杂任务，其核心优势体现在解谜、数学证明与编码挑战等场景。“推理”被...

AI-Agent

1年前 (2025)

Sebastian Raschka：关于DeepSeek R1和推理模型，我有几点看法

著名AI研究者Sebastian Raschka基于DeepSeek技术报告，系统阐述了增强大语言模型推理能力的四大核心方法。_推理模型被定义为擅长处理需要多步骤中间推导的复...

AIGC动态

1年前 (2025)

成本不到150元！李飞飞等26分钟训出个推理模型，媲美o1和R1，秘诀：用蒸馏

通过蒸馏技术，研究团队成功训练出一个性能可媲美DeepSeek-R1和OpenAI o1的推理模型s1，其成本不到150元人民币。这一成果由李飞飞、斯坦福大学、华盛顿大学及...

AIGC动态

1年前 (2025)

o3-mini 碾压DeepSeek R1？一条python程序引发近400万围观

OpenAI最近推出了新的推理模型系列o3-mini，这是其推理模型系列中最新、最具成本效益的模型，相比之前的o1系列，成本降低了15倍。o3-mini的推出引起了广泛关...

AIGC动态

1年前 (2025)

首个OpenAI免费推理模型o3-mini发布！DeepSeek让奥特曼反思：不开源我们错了

OpenAI最近发布了o3-mini系列推理模型，旨在推动低成本推理的边界。该系列包含三个版本：low、medium和high，其中o3-mini和o3-mini-high已上线。o3系列模型针...

AIGC动态

1年前 (2025)

标签：推理模型

从 R1 到 Sonnet 3.7，推理模型首轮竞赛中有哪些关键信号？

多元推理刷新「人类的最后考试」记录，o3-mini(high)准确率最高飙升到37％

火山引擎 DeepSeek 落地实践分享：企业如何用好推理模型？

马斯克20万块GPU炼出Grok-3，暴击DeepSeek R1数学屠榜！疯狂复仇OpenAI

DeepSeek 颠覆了什么？学习不靠“人盯”，AI自己“卷”自己

DeepSeek R1 之后，重新理解推理模型

Sebastian Raschka：关于DeepSeek R1和推理模型，我有几点看法

成本不到150元！李飞飞等26分钟训出个推理模型，媲美o1和R1，秘诀：用蒸馏

o3-mini 碾压DeepSeek R1？一条python程序引发近400万围观

首个OpenAI免费推理模型o3-mini发布！DeepSeek让奥特曼反思：不开源我们错了

热门网址

标签：推理模型

Trae-AI IDE

讯飞星辰

讯飞文书-办公助手

有言AI-视频创作

热门网址