标签:多模态学习

谷歌创新框架:从非结构化数据,实现多模态学习

在数据爆炸时代,大模型学习非结构化数据如视频、音频和图片面临重大挑战。多模态学习,特别是处理多种输入和异构数据时,深度神经网络易出现过拟合和泛化不...

ICLR 2024 Oral:长视频中噪声关联学习,单卡训练仅需1天

在2024年世界经济论坛上,图灵奖得主Yann LeCun提出了视频模型应该在抽象表征空间中进行预测的观点。本文研究者基于最优传输理论,提出了一种鲁棒的长视频学...
1 2