ICML 2026|拒绝大力出奇迹,PRISM框架让dLLM也能高效Test-Time Scaling

ICML 2026|拒绝大力出奇迹,PRISM框架让dLLM也能高效Test-Time Scaling

 

文章摘要


【关 键 词】 大模型离散扩散推理扩展层次搜索自我验证

当前语言模型的发展重心正加速向测试期计算倾斜,但主流扩展策略多基于自回归架构设计,难以直接兼容采用并行去噪生成机制的离散扩散语言模型。为突破这一局限,PRISM框架针对离散扩散特性重新定义了推理搜索流程,通过层次化轨迹搜索、动态局部分支与内部验证回路,在严格约束的计算预算内实现了推理质量的大幅跃升。该方法将完整的去噪周期划分为随机探索、渐进裁剪与定向精修三个相位,在潜在答案逻辑骨架成型后迅速过滤低质量序列,并将剩余算力集中分配给高价值候选路径。该策略有效打破了传统全局遍历带来的算力瓶颈,将算法复杂度压缩至近似常数级别。针对生成中期的结构演化,系统采取保留高置信标记、仅对薄弱区域执行局部重掩码的策略,既维持了核心逻辑的稳定性,又拓宽了局部推理细节的探索空间。

框架创新性地将验证功能内嵌于同一基础模型之中,通过极简的是非二分类判断完成路径排序与筛选,彻底免除额外部署独立校验网络的硬件与延迟成本。广泛的基准测评全面印证了该策略的工程价值,其在数学逻辑推导与自动化编程任务上均展现出卓越的性能成本比,利用极少的去噪迭代次数便达成或超越了传统多路径采样方法的最优阈值。数据追踪清晰地反映出算力开销与最终准确率的解耦趋势。多维度的横向对比结果充分确认,离散扩散范式完全能够通过动态测试期计算有效强化复杂决策与自我修正能力,为突破非自回归架构的应用天花板并部署轻量化推理引擎确立了明确的技术坐标。

原文和模型


【原文链接】 阅读原文 [ 2217字 | 9分钟 ]
【原文作者】 机器之心
【摘要模型】 qwen3.6-plus
【摘要评分】 ★★★☆☆

© 版权声明
xunfeiagent

相关文章

trae

暂无评论

暂无评论...