标签:多模态嵌入

让龙虾看懂屏幕!谷歌多模态新成果,文本图像视频音频进同一空间

谷歌发布了首款原生多模态嵌入模型 Gemini Embedding 2。该模型的核心突破在于将文本、图像、视频、音频及文档等多种数据类型映射至同一个统一的嵌入空间。不...

AI视频搜索这个方向不错,英伟达一口气投了5000万美元

Twelve Labs,一家专注于AI视频搜索的初创公司,在英伟达领投下完成了5000万美元融资。此举反映了英伟达自2023年以来对新兴AI企业的投资趋势,Twelve Labs的...