标签:推理能力
DeepSeek V3.2 正式版发布,V4 还没来,但已经是开源模型里 Agent 能力最强了
DeepSeek近日发布了V3.2正式版模型,包括DeepSeek-V3.2和DeepSeek-V3.2-Speciale两个版本。此次更新的核心在于推理能力和Agent工具调用能力的显著提升。其中...
DeepSeek-V3.2正式版发布,将开源模型的能力推向极致
DeepSeek团队正式开源了DeepSeekV3.2的两个版本:标准版和Speciale版。标准版专注于日常任务与通用智能体场景,在推理能力与输出效率之间取得了平衡,其性能...
Gemini 3.0发布:从“工具辅助”到“主动代理”,谷歌做了这几点
谷歌发布最新AI模型Gemini 3,标志着人工智能从“工具辅助”向“主动代理”的跨越式演进。这款被称为“全能型选手”的模型在多个核心基准测试中对标甚至超越GPT-5.1...
AI秒破18世纪「天书」账本!谷歌新模型盲测刷屏全网
谷歌AI Studio上的一个神秘模型成功识别并修正了200多年前一位商人的「天书」账本,展现出接近人类专家级的手写文本识别能力和隐式推理水平。历史学家Mark Hu...
中科院联合清华等发布视觉语言行动推理模型VLA-R1,让机器人先思考再行动
中科院自动化所、清华大学与GigaAI联合发布了视觉-语言-行动(VLA)模型的R1推理版本,该模型通过引入思维链机制和强化学习策略,显著提升了机器人在复杂环境...
吴恩达关注的Ling-1T背后,蚂蚁Ling 2.0技术报告解密万亿模型开源配方
蚂蚁集团最新开源模型Ling-1T因其卓越性能引发业界关注,其技术核心在于通过创新的架构设计和训练方法,模糊了推理与非推理模型的界限。该模型在预训练阶段强...
万亿级思考模型,蚂蚁首次开源!20万亿token搅局开源AI
蚂蚁集团正式发布万亿参数思考模型Ring-1T,标志着开源AI迈入万亿参数时代。该模型在数学竞赛、逻辑推理和医疗问答等多项基准测试中刷新开源SOTA(State-of-t...
蚂蚁Ring-1T正式登场,万亿参数思考模型,数学能力对标IMO银牌
蚂蚁集团近期密集开源多款大模型,其中万亿级思考模型Ring-1T的发布尤为引人注目。该模型在多项高难度基准测试中展现出与闭源巨头正面对话的实力,成为开源体...
更高智商更快思考!蚂蚁开源最新万亿语言模型,多项复杂推理SOTA
蚂蚁集团正式发布其百灵大模型系列的首款旗舰产品——拥有万亿参数的通用语言模型Ling-1T。该模型在多项复杂推理基准测试中超越主流开源与闭源模型,包括DeepSe...
首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能
谷歌DeepMind发布新一代通用机器人基座模型Gemini Robotics 1.5系列,这是全球首个具备模拟推理能力的具身模型,是将通用AI推向现实世界的重要里程碑。该系列...




