图像生成

图像,绘画

OpenAI投的机器人公司,发世界模型,靠“想象”干活儿

1X公司近日发布了名为1X World Model(1XWM)的世界模型,旨在提升其人形机器人Neo的通识行为能力和物理世界理解力。这一模型通过文字指令和初始画面生成未来...

上科大何旭明团队新作:克服简单样本偏置,让多模态模型学会「难题优先」

多模态模型在感知、理解与生成等方面的能力持续提升,但其输出中仍普遍存在与客观事实不一致的内容,即多模态幻觉现象。当模型面对信息缺失、语义含混或视觉...

王小川手里还握着冰冷的30亿

2026年1月13日,百川智能召开媒体沟通会,创始人王小川首次公开回应公司战略转型与医疗大模型的技术进展。他认为行业已到“爆发”节点,百川需要“重新建立连接”...

边看边创造,在 PixVerse R1 的实时世界模型里,你真是上帝

爱诗科技发布的PixVerse R1被定位为'全球首个通用实时世界模型',其核心突破在于彻底改变了视频生成的交互范式。传统视频生成是单向的指令-等待-输出流程,而...

首个实时世界模型发布:视频媒介的「交互」时代开始了

PixVerse R1的发布标志着AI视频生成技术进入实时交互时代。这一由爱诗科技研发的世界模型首次实现1080P分辨率下的即时响应级生成,彻底改变了传统AI视频创作...

对话王小川:“语言才是中轴,多模态不是主战场”

百川智能于1月13日正式开源新一代医疗大模型Baichuan-M3,该模型在全球权威医疗AI评测HealthBench中以65.1分的综合成绩位列第一,并在复杂决策能力测试Health...

浙大彭思达团队 × 理想最新研究:直面高分辨率深度的细节缺失

高分辨率深度估计在实际应用中面临几何一致性不足的问题,现有方法通过插值放大固定分辨率预测结果的方式导致细节区域误差放大,影响自动驾驶和三维重建等下...

不上云、不租卡,如何优雅地在本地微调Qwen-VL-30B?

近年来,将AI引入传统行业的需求日益增长,尤其是在处理复杂机械图纸、设备维护手册或金融研报图表等任务时,多模态助手的开发显得尤为重要。这类助手不仅需...

顶尖AI竟输给三岁宝宝,BabyVision测试暴露多模态模型硬伤

大模型在纯视觉任务上的表现远低于人类儿童水平。UniPat AI与红杉中国xbench团队联合发布的BabyVision评测集揭示,当前最先进的多模态大模型在基础视觉能力上...

围观AI对赌直播之后,我见证了一场人类画师对AI的突围。

故事围绕AI绘画引发的争议展开,聚焦绘圈内一场特殊的“对赌直播”现象。一位小红书用户质疑某画师使用AI创作,并列出大量证据,最终双方约定通过直播自证画技...
1 2 3 161