北大林宙辰团队论文:从数据中自适应学习时序预测损失丨ICLR 2026
文章摘要
【关 键 词】 时间序列、预测模型、损失函数、元学习、泛化性能
多步时间序列预测任务中,预测性能随步长增加而退化是普遍现象。气象、金融和电力负荷预测等领域均存在短期预测准确但中长期误差显著放大的问题。误差积累、趋势漂移和结构失真往往被视为模型表达能力不足的结果,但训练阶段固定损失函数的设计缺陷长期被忽视。传统均方误差(MSE)隐含两个不合理假设:未来时间点预测相互独立,且所有预测步重要性相同。研究表明,这两个假设在多步预测场景中均不成立——偏相关分析揭示未来时间点存在显著相关性,条件方差分析显示不同预测步误差差异明显。
针对这一问题,林宙辰团队提出QDF(Quadratic Direct Forecast)方法,将损失函数重构为可学习的对象,通过元学习机制自适应捕捉数据特性。该方法基于多元高斯分布的负对数似然构建二次型损失函数,权重矩阵的非对角元素建模时间点间相关性,对角元素反映预测步不确定性差异。通过双层优化框架,模型参数与权重矩阵交替更新:内层优化训练集上的预测性能,外层依据验证集泛化误差调整权重。这种设计使损失函数能动态适应不同时间区间的误差模式,形成结构感知的优化目标。
实验验证表明,QDF在多个基准数据集上显著优于传统MSE及部分改进方法。消融研究证实,同时建模时间相关性和预测步权重差异能带来最大性能提升。可视化分析显示,QDF有效缓解了MSE模型常见的振幅压缩、相位偏移等问题,周期结构和长期趋势保持更完整。与仅处理部分相关性的方法相比,QDF通过端到端学习完整权重矩阵,实现了更稳定的预测性能。
这项研究对时间序列预测领域具有多重启示:系统性挑战了多步预测作为独立回归任务的默认假设,提出了基于统计建模反推损失函数的新范式,并为元学习与领域知识的结合提供了范例。方法论上,权重矩阵的学习机制可扩展至其他存在结构化误差的场景,而双层优化框架为训练目标的动态调整开辟了新思路。研究结果证明,在不改变模型架构的情况下,仅通过优化目标的重设计即可显著提升跨时间步的泛化能力。
原文和模型
【原文链接】 阅读原文 [ 2785字 | 12分钟 ]
【原文作者】 AI科技评论
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★☆



