标签:语义对齐
北大、字节、中科院自动化研究所等提出图像并行生成新范式
当前多模态AI领域存在一个反直觉现象:让模型在生成图像前进行文本推理,反而会降低生成结果的语义保真度。这一发现源于主流自回归架构的固有缺陷——上游推理...
中英双语、29项第一、像素级理解:360 FG-CLIP2登顶全球最强图文跨模态模型
当前AI生成的视觉内容虽然炫酷,但在细节理解和空间关系处理上仍存在明显缺陷。例如,要求生成「穿红外套的猫站在蓝色跑车左边」或搜索「引擎盖有鸟粪的特斯...





