图像生成
图像,绘画
12月,我们推荐这 7 款 AI 新品
在极客公园创新大会上,7款前沿AI产品通过线下发布会形式亮相,展现了AI技术在不同领域的创新应用。这些产品均诞生于近一个月内,涵盖硬件、笔记工具、营销服...
硬刚Sora2,万相2.6轻松定制角色、控制分镜,普通人也能当导演
2025年标志着视频生成技术进入全新范式,以阿里万相2.6为代表的模型实现了从单点突破到系统级创新的跨越。该模型首次在国内实现声画一致性角色定制,通过多模...
GPT Image 1.5发布,网友:低配版Nano Banana Pro
OpenAI于12月16日正式推出ChatGPT Images的重大更新,核心变化包括全新的图像生成与编辑体验,以及面向开发者的API模型GPT Image 1.5。此次升级聚焦三大能力...
实测GPT Image 1.5,拼尽全力还是没能打败Banana。
OpenAI近期发布了GPT Image 1.5图像生成模型,与Google的Banana Pro展开直接竞争。通过对多组测试案例的对比分析,发现两者在信息准确性、真实质感、精准编辑...
西湖大学修宇亮:数字人重建,慢慢都会变成基础模型的微调任务 | GAIR 2025
在第八届GAIR全球人工智能与机器人大会上,西湖大学助理教授修宇亮分享了远兮实验室在高精度数字人重建领域的三项突破性进展。UP2You技术将传统数字人建模时...
QQ音乐你变了,竟能免费在AI PC上原创一首《大东北》
QQ音乐近期推出了一项创新的AI作曲功能,用户可以通过简单的操作在本地生成原创歌曲。该功能目前仅在配备AI PC的设备上免费提供,利用本地大模型进行推理,显...
港中文 MMlab×美团新研究:仅用一个模型,应对多种视觉推理任务
香港中文大学多媒体实验室与美团联合研究团队提出了一种名为OneThinker的统一多模态推理模型,旨在解决当前单一任务或单一模态方法面临的瓶颈问题。现实世界...
阿里妈妈发布MUSE:用多模态搞定十万级超长行为序列,并开源Taobao-MM数据集
推荐系统长期以来面临'短期健忘症'的困境,受限于算力和存储,用户多年前的行为数据往往被截断或遗忘。阿里妈妈与武汉大学团队提出的MUSE框架,通过多模态搜...
浙江大学研究员彭思达:底层空间感知技术对训练机器人有何作用?丨GAIR 2025
浙江大学研究员彭思达在GAIR 2025论坛上提出,人类行为数据可作为训练人形机器人的重要资源,通过采集人类日常活动记录,结合空间感知技术解决具身智能领域的...
图像分层生成:新加坡国立大学和Lowart AI实现了图像可编辑的PSD文件输出
OmniPSD通过Diffusion Transformer架构实现了分层图像生成与拆解,标志着AI从生成图片向生成可编辑资产的跨越。该系统由新加坡国立大学和Lowart AI联合开发,...




