标签:图文生成

开源SOTA!商汤原生多模态一个大脑完成看图、推理、作画

商汤正式开源新一代视觉多模态模型SenseNova U1,其核心突破在于全面摒弃传统的视觉编码器与变分自编码器拼接方案,转而采用自研的NEO-unify原生统一架构。该...