标签：多模态嵌入

让龙虾看懂屏幕！谷歌多模态新成果，文本图像视频音频进同一空间

谷歌发布了首款原生多模态嵌入模型 Gemini Embedding 2。该模型的核心突破在于将文本、图像、视频、音频及文档等多种数据类型映射至同一个统一的嵌入空间。不...

AIGC动态

4小时前

AI视频搜索这个方向不错，英伟达一口气投了5000万美元

Twelve Labs，一家专注于AI视频搜索的初创公司，在英伟达领投下完成了5000万美元融资。此举反映了英伟达自2023年以来对新兴AI企业的投资趋势，Twelve Labs的...

AIGC动态

2年前 (2024)