标签:推理模型
阿里开源QwQ-32B,性能比肩R1。这是一次压倒性的创新。
阿里巴巴最新发布的推理模型QwQ-32B,以其320亿参数的规模,展现了与6710亿参数的DeepSeek-R1相媲美的性能。这一突破意味着,在更小的设备上运行更强大的推理...
阿里深夜开源推理模型QwQ-32B,性能比肩R1满血版。
阿里在凌晨发布了全新的推理模型QwQ-32B,这一模型在多个数据集上的表现令人震惊,尤其是在数学和代码领域,其性能甚至能与DeepSeek R1(671B)相媲美。QwQ-3...
从 R1 到 Sonnet 3.7,推理模型首轮竞赛中有哪些关键信号?
过去一个月,头部AI实验室密集发布了多个推理模型,标志着推理模型领域的第一轮竞争暂时告一段落。OpenAI、xAI和Anthropic分别推出了各自的顶尖模型:o3-mini...
多元推理刷新「人类的最后考试」记录,o3-mini(high)准确率最高飙升到37%
近年来,DeepSeek R1、OpenAI o1/o3等大语言模型在数学和编程领域的推理能力取得显著进展,但在国际数学奥林匹克竞赛(IMO)组合问题、抽象推理语料库(ARC)...
火山引擎 DeepSeek 落地实践分享:企业如何用好推理模型?
DeepSeek R1模型的上线在业界引起了广泛关注,其在火山引擎的快速部署更是成为焦点。为了更好地理解DeepSeek R1模型的实际应用和商业化落地,Founder Park联...
马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI
xAI团队发布了Grok-3系列模型及配套工具,标志着大规模算力与模型能力结合的新里程碑。该模型在20万块GPU集群上完成训练,成为首个突破10万GPU同步训练规模的...
DeepSeek 颠覆了什么?学习不靠“人盯”,AI自己“卷”自己
DeepSeek 在近期推出的 R1 模型及其 Zero 研究,通过纯强化学习路线实现了推理模型的突破性进展。其核心创新在于证明无需过程监督数据,仅依靠结果控制即可训...
DeepSeek R1 之后,重新理解推理模型
对推理模型的技术发展与行业应用分析显示,这类模型通过多步骤生成和中间思考过程解决复杂任务,其核心优势体现在解谜、数学证明与编码挑战等场景。“推理”被...
Sebastian Raschka:关于DeepSeek R1和推理模型,我有几点看法
著名AI研究者Sebastian Raschka基于DeepSeek技术报告,系统阐述了增强大语言模型推理能力的四大核心方法。_推理模型被定义为擅长处理需要多步骤中间推导的复...
成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏
通过蒸馏技术,研究团队成功训练出一个性能可媲美DeepSeek-R1和OpenAI o1的推理模型s1,其成本不到150元人民币。这一成果由李飞飞、斯坦福大学、华盛顿大学及...