标签:推理

超越微软,全球第一!上交AI智能体炼成「Kaggle特级大师」,登顶OpenAI MLE-bench

上海交通大学人工智能学院Agents团队提出的AI专家智能体「ML-Master」在OpenAI发布的权威基准测试MLE-bench中取得了显著成绩,以29.3%的平均奖牌率位居榜首,...

只用2700万参数,这个推理模型超越了DeepSeek和Claude

大语言模型在复杂推理任务中面临任务分解复杂、数据需求大以及高延迟等问题,当前的思维链(CoT)技术存在局限性。为了解决这些问题,Sapient Intelligence的...

文心大模型 4.5 系列正式开源,涵盖 10 余款模型

百度于6月30日正式开源了文心大模型4.5系列,涵盖10款不同参数规模的模型,包括47B、3B激活参数的混合专家(MoE)模型和0.3B参数的稠密型模型。这些模型已在...

华为盘古大模型开源,推理方案、基础代码全公开!

华为今日宣布开源盘古70亿参数的稠密模型、盘古Pro MoE 720亿参数的混合专家模型以及基于昇腾的模型推理技术。这一举措被视为华为推进昇腾生态战略的关键步骤...

媲美DeepSeek!腾讯开源新版混元模型:AI Agent强化,超30种智能体指令

腾讯最新开源的混元大模型Hunyuan-A13B,是一个拥有800亿参数的专家混合模型,其中130亿参数处于激活状态。该模型支持快速和慢速两种思考模式,分别适用于简...

Gary Marcus惊世之言:纯LLM上构建AGI彻底没了希望!MIT、芝大、哈佛论文火了

著名人工智能学者Gary Marcus转推了一篇由MIT、芝加哥大学和哈佛大学合著的论文,该论文揭示了大型语言模型(LLM)在推理和理解上存在的一种被称为“波将金式”...

AI Infra 工程师们如何应对大模型流水线里的“暗涌”?

在大模型基础设施(Infra)领域,工程师们面临着诸多挑战和需求,尤其是在训练和推理环节的稳定性、性能优化以及资源调度方面。并行策略兼容性、工程流水线管...

OpenAI底层AGI技术被曝光!前研究主管豪言:从此再无新范式

OpenAI前研究主管Bob McGrew公开表示,AGI的「技术拼图」已经齐全,关键在于如何将推理能力落地并重塑价值创造路径。他认为,实现通用人工智能(AGI)的三大...

田渊栋:连续思维链效率更高,可同时编码多个路径,“叠加态”式并行搜索

田渊栋团队的最新研究揭示了AI模型在处理复杂任务时,通过连续思维链的并行搜索机制,能够显著提升推理效率。传统的大语言模型(LLM)通常采用离散思维链进行...

统一框架下的具身多模态推理:自变量机器人让AI放下海德格尔的锤子

当前最先进的机器人在工具使用上仍面临显著挑战,无法像人类一样直觉地操作工具。它们每次使用工具时都需要重新识别和规划,这种割裂式的处理方式限制了其能...
1 2 3 4 10