图像生成
图像,绘画
ICLR 2026惊现SAM 3,分割一切的下一步:让模型理解「概念」
Meta的研究团队可能推出了「Segment Anything」系列的最新版本SAM 3,相关匿名论文已提交至ICLR 2026。该论文提出了「可提示概念分割」(PCS)任务,通过文本...
今天,好像见证了属于SD时代的消亡。
国内著名模型开源社区liblib宣布升级至2.0版本,标志着以Stable Diffusion为代表的开源AI绘画时代迎来重大转折。公告中提及'开源生态遇冷'与'新用户找不到方...
告别「解码器饥饿」!中国科学院NeurIPS推SpaceServe,高并发克星
中国科学院计算技术研究所的研究团队在NeurIPS 2025发表论文《SpaceServe: Spatial Multiplexing of Complementary Encoders and Decoders for Multimodal LL...
首家AIOS落地来自vivo:个人化智能复刻人类思维,手机还能这样用
vivo在2025年开发者大会上展示了其端侧AI技术的重大突破,标志着AI手机从概念走向实用化。通过推出蓝心3B端侧多模态推理大模型,vivo构建了一套轻量化且高效...
当Sora2遇上国产 Vidu Q2,国产参考生真的更香了!一手亲测
近期AI视频生成领域迎来重要进展,Vidu Q2参考生视频功能与Sora 2展开多维度技术对比。测试聚焦三大核心维度:一致性保持、物理规律遵循和运镜能力。在一致性...
Sora 和 AI 视频的爆炸性红利
团队在一次长达两个半小时的周会上重点讨论了OpenAI最新发布的社交类AI视频应用Sora及其第二代模型Sora 2。会议气氛异常兴奋,与会者深入探讨了这项技术带来...
vivo 的 AI 破局之道:给每个用户发一个「专属」大模型
2025年vivo开发者大会的核心焦点是「2025蓝心智能战略」的全面升级,这一战略旨在通过AI技术的深度整合与创新,打造更贴近用户需求的个人化智能体验。OriginO...
知名机器人专家喊话:投人形机器人初创公司的数十亿美元,正在打水漂
知名机器人专家罗德尼・布鲁克斯对当前人形机器人技术路线提出尖锐质疑。他认为,通过观看人类视频教会机器人灵活操作的方法属于'纯粹的空想',核心问题在于...
Sora2之后,又来了个全新的影视级AI视频模型,它的名字,叫GAGA。
Sand.ai团队正式发布了全新的音画同步视频模型GAGA-1,该模型在人物表演领域展现出显著的技术突破。经过六个月的开发周期,这款国产模型目前已开放免费使用,...
OpenAI年度发布会:ChatGPT里能直接用App、Sora 2 API开放、推出Agent开发工具包
OpenAI DevDay 2025年度发布会聚焦于“如何让人更好地用AI创造”,推出多项技术升级与开发者工具。核心发布包括App inside ChatGPT、Agent Kit、Codex正式版、...







