
文章摘要
【关 键 词】 DeepConf、AI推理、计算开销、准确率、技术突破
在人工智能领域,Meta AI 联合加州大学圣地亚哥分校推出的“DeepConf”新技术,为解决 AI 高难度推理难题带来了新突破。该技术解决了让 AI 在高难度推理中保持高准确率且降低计算开销的问题,改变了以往“大力出奇迹”的做法。
近年来,大型语言模型虽在聊天、写作等方面表现出色,但在复杂推理任务上能力不足。为提升推理能力,研究人员采用“自洽性”方法,即“题海战术”加“人海战术”,让模型生成多种解题思路并投票选择答案。然而,这种方法存在效益递减、计算开销高昂、投票机制不合理和效率低下等问题。
DeepConf 的核心思想是让 AI 学会“察言观色”,通过模型自身的“置信度”信号筛选靠谱的推理路径。它设计了五种全新的“探针”,包括令牌置信度、组置信度等,能从全局到局部精细把控。DeepConf 可在“离线模式”和“在线模式”下指导 AI。离线模式是考后复盘,给答卷打置信度分并选择高分或加权投票;在线模式是随堂监考,实时监控,发现置信度低时及时喊停,节省算力。
在一系列高难度推理基准测试中,DeepConf 与 GPT – OSS – 120B 模型组合在 AIME 2025 数学竞赛中取得了 99.9%的准确率,同时生成的总令牌数减少了 84.7%,在多个模型和数据集上也稳定碾压传统方法,提升准确率的同时节省了大量计算资源。
此外,DeepConf 集成简单,只需修改约 50 行代码就能集成到现有推理框架中,可与多种语言模型无缝衔接。它能降低 AI 应用的运营成本,提升用户体验,为开源 AI 生态注入活力,还展示了学术界和工业界结合的巨大威力。DeepConf 的发布或标志着 AI 推理“堆料时代”的终结和“效率为王”新纪元的开启。
原文和模型
【原文链接】 阅读原文 [ 2728字 | 11分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 doubao-1-5-pro-32k-250115
【摘要评分】 ★★★★★