图像生成

中山大学王广润：大模型的微调只是对空间建模的微调 | GAIR 2025

王广润博士在GAIR 2025大会的演讲聚焦于基础模型与物理世界建模的前沿探索。他指出，真实世界的动态性和复杂性要求AI不仅具备感知能力，还需理解物理规律并预...

AIGC动态

2个月前

火山引擎作为字节跳动在AI时代的重要技术输出平台，其核心战略定位已明确为「AI云原生」，通过内外双循环验证技术价值。过去两年，云服务行业普遍转向以AI能...

AI-Agent

2个月前

谷歌发布了其迄今为止最快的AI模型Gemini 3 Flash，该模型专为速度设计，旨在帮助用户更快地学习、构建和规划。Gemini 3 Flash在博士级别的推理和知识基准测...

AIGC动态

2个月前

在极客公园创新大会上，7款前沿AI产品通过线下发布会形式亮相，展现了AI技术在不同领域的创新应用。这些产品均诞生于近一个月内，涵盖硬件、笔记工具、营销服...

AI-Agent

2个月前

2025年标志着视频生成技术进入全新范式，以阿里万相2.6为代表的模型实现了从单点突破到系统级创新的跨越。该模型首次在国内实现声画一致性角色定制，通过多模...

AIGC动态

2个月前

OpenAI于12月16日正式推出ChatGPT Images的重大更新，核心变化包括全新的图像生成与编辑体验，以及面向开发者的API模型GPT Image 1.5。此次升级聚焦三大能力...

AIGC动态

2个月前

OpenAI近期发布了GPT Image 1.5图像生成模型，与Google的Banana Pro展开直接竞争。通过对多组测试案例的对比分析，发现两者在信息准确性、真实质感、精准编辑...

AIGC动态

2个月前

在第八届GAIR全球人工智能与机器人大会上，西湖大学助理教授修宇亮分享了远兮实验室在高精度数字人重建领域的三项突破性进展。UP2You技术将传统数字人建模时...

AIGC动态

2个月前

QQ音乐近期推出了一项创新的AI作曲功能，用户可以通过简单的操作在本地生成原创歌曲。该功能目前仅在配备AI PC的设备上免费提供，利用本地大模型进行推理，显...

AIGC动态

2个月前

香港中文大学多媒体实验室与美团联合研究团队提出了一种名为OneThinker的统一多模态推理模型，旨在解决当前单一任务或单一模态方法面临的瓶颈问题。现实世界...

AIGC动态

2个月前