标签:推理能力

吴恩达关注的Ling-1T背后,蚂蚁Ling 2.0技术报告解密万亿模型开源配方

蚂蚁集团最新开源模型Ling-1T因其卓越性能引发业界关注,其技术核心在于通过创新的架构设计和训练方法,模糊了推理与非推理模型的界限。该模型在预训练阶段强...

万亿级思考模型,蚂蚁首次开源!20万亿token搅局开源AI

蚂蚁集团正式发布万亿参数思考模型Ring-1T,标志着开源AI迈入万亿参数时代。该模型在数学竞赛、逻辑推理和医疗问答等多项基准测试中刷新开源SOTA(State-of-t...

蚂蚁Ring-1T正式登场,万亿参数思考模型,数学能力对标IMO银牌

蚂蚁集团近期密集开源多款大模型,其中万亿级思考模型Ring-1T的发布尤为引人注目。该模型在多项高难度基准测试中展现出与闭源巨头正面对话的实力,成为开源体...

更高智商更快思考!蚂蚁开源最新万亿语言模型,多项复杂推理SOTA

蚂蚁集团正式发布其百灵大模型系列的首款旗舰产品——拥有万亿参数的通用语言模型Ling-1T。该模型在多项复杂推理基准测试中超越主流开源与闭源模型,包括DeepSe...

首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能

谷歌DeepMind发布新一代通用机器人基座模型Gemini Robotics 1.5系列,这是全球首个具备模拟推理能力的具身模型,是将通用AI推向现实世界的重要里程碑。该系列...

5款大模型考「山东卷」,Gemini、豆包分别获文理第一名

近期,5款主流大模型参与了2025年山东高考全科闭卷测评,结果显示AI的应试能力已实现质的飞跃。字节跳动Seed团队组织的测评采用750分制,未进行任何提示工程...

Mistral的首个强推理模型:拥抱开源,推理速度快10倍

欧洲人工智能公司Mistral AI近期发布了全新的大语言模型系列Magistral,该系列展现了强大的推理能力,能够通过不断反思解决更复杂的任务。Magistral系列包含...

质疑DeepSeek-R1、Claude Thinking根本不会推理!苹果争议论文翻车了?

当前人工智能领域普遍认为以DeepSeek-R1、Claude 3.7 Sonnet为代表的推理大模型已具备类人思考能力,但苹果团队的最新研究对此提出根本性质疑。通过设计可控...

全球最强编码模型 Claude 4 震撼发布:自主编码7小时、给出一句指令30秒内搞定任务,丝滑无Bug

Anthropic在首届开发者大会上正式发布了Claude 4系列模型,包括Claude Opus 4和Claude Sonnet 4两个型号。Claude Opus 4是该公司迄今为止最强大的AI模型,能...

强迫模型自我争论,递归思考版CoT热度飙升!网友:这不就是大多数推理模型的套路吗?

CoRT(Chain-of-Recursive-Thoughts)是一种在语言模型中引入递归思考和自我批判机制的新方法,旨在提升模型的推理能力。与传统的CoT(Chain-of-Thought)相...
1 2 3 4 9