小红书RecSys 2025最佳论文提名背后:破解视频时长预测难题

小红书RecSys 2025最佳论文提名背后:破解视频时长预测难题

 

文章摘要


【关 键 词】 小红书推荐系统机器学习算法优化用户行为

小红书推荐算法团队在推荐系统顶会RecSys 2025上凭借论文《Multi-Granularity Distribution Modeling for Video Watch Time Prediction via Exponential-Gaussian Mixture Network》获得“最佳论文提名”,引发学术界和工业界的广泛关注。该论文聚焦视频观看时长预测这一核心行业难题,提出了一种创新的指数-高斯混合网络(EGMN)模型,通过结合指数分布和高斯混合分布,精准捕捉用户观看行为的复杂模式。

小红书作为中国领先的生活兴趣社区,其推荐系统的优化对用户体验和平台增长至关重要。观看时长是衡量内容质量和用户满意度的关键指标,与日活跃用户数(DAU)高度相关。EGMN模型通过预测观看时长的完整概率分布,而非单一数值,显著提升了预测精度。离线实验显示,该模型在平均绝对误差(MAE)和排序一致性指标(XAUC)上分别相对降低14.11%和提升7.76%。线上A/B测试进一步验证了其业务价值,KL散度指标下降19.94%,表明模型对真实分布的拟合能力显著增强。

EGMN模型的成功在于其回归问题本质的务实思路。团队并未盲目追随技术热点,而是基于经典的概率分布方法(如高斯混合模型)进行创新,解决了用户行为中“粗粒度的偏态性”和“细粒度的多样性”两大挑战。一位审稿人评价该论文“已经非常出色”,并给予“Strong Accept”的最高评价。

会议期间,小红书的展台成为焦点,许多参会者对其推荐系统的精准性表示惊叹。一位用户分享称,小红书不仅能推送本地内容,还能识别参会者身份并推荐相关帖子,展现了强大的场景捕捉能力。这种用户认可进一步激发了研究者对背后技术的兴趣,EGMN模型的演讲现场座无虚席,会后讨论持续升温。

EGMN模型的通用性为其他业务场景提供了借鉴。其核心思路可拓展至电商成交价格预估、广告GMV预估等领域,为解决多模态复杂分布回归问题提供了新方向。小红书推荐算法团队强调,务实分析真实问题并设计技术路径是其成功的关键。此次顶会成果标志着团队在推荐算法领域的领先地位,同时也为其未来的技术探索奠定了基础。

原文和模型


【原文链接】 阅读原文 [ 3306字 | 14分钟 ]
【原文作者】 机器之心
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...