标签：语义对齐

北大、字节、中科院自动化研究所等提出图像并行生成新范式

当前多模态AI领域存在一个反直觉现象：让模型在生成图像前进行文本推理，反而会降低生成结果的语义保真度。这一发现源于主流自回归架构的固有缺陷——上游推理...

AIGC动态

5个月前

中英双语、29项第一、像素级理解：360 FG-CLIP2登顶全球最强图文跨模态模型

当前AI生成的视觉内容虽然炫酷，但在细节理解和空间关系处理上仍存在明显缺陷。例如，要求生成「穿红外套的猫站在蓝色跑车左边」或搜索「引擎盖有鸟粪的特斯...

AIGC动态

5个月前