图像生成

图像,绘画

谷歌重回铁王座!Gemini 3吊打GPT-5,奥特曼发信承认技不如人

谷歌近期在人工智能领域的突破性进展标志着其从追赶者到领导者的转变。Gemini 3.0 Pro和Nano Banana Pro的发布不仅展示了生成式AI技术的重大飞跃,更在20项基...

Meta再推WorldGen,简单一句话,竟「盖」出50×50米一座城

Meta最新发布的WorldGen技术标志着生成式AI在3D内容创作领域的重大突破。该系统仅需文本提示即可生成可导航、可交互的完整3D世界,支持如'卡通风格中世纪村庄...

何恺明团队重磅新作:去掉VAE,无需Tokenizer,纯Transformer预测数据比预测噪声更高效

麻省理工学院何恺明团队发布了一项颠覆性研究,直指当前扩散生成模型的核心痛点。研究指出主流模型实际上并没有在做去噪工作,回归最原始的洁净数据预测才是...

Gemini 3 登场后,哈萨比斯要「改造」Google 全系产品

Google DeepMind CEO 德米斯·哈萨比斯在访谈中系统阐述了Gemini 3的技术突破与战略布局。作为Google未来架构的关键节点,这一代模型在推理能力、多模态处理、...

一文读懂:为什么Nano Banana Pro重新定义了AI图像生成标准

在Gemini 3的技术支持下,谷歌正式推出图像生成工具Nano Banana Pro,标志着AI图像生成领域的技术突破。该工具基于Gemini 3 Pro构建,通过增强的推理能力和实...

Nano Banana Pro最全解析,设计师和开发者都用得上,附官方提示指南

Nano Banana Pro作为新一代图像生成与编辑模型,标志着AI技术在视觉创作领域的重大突破。其核心突破在于将逻辑推理能力和真实世界知识注入像素生成过程,使模...

太炸裂了!全网实测Nano Banana Pro,网友:这模型里到底装了什么鬼东西!

谷歌最新发布的Nano Banana Pro(又名Gemini 3 Pro Image)文生图模型引发广泛关注。该模型整合了Gemini 3 Pro的多模态理解能力和谷歌搜索知识库,在图像生成...

网友疯玩Gemini 3!AI造物门槛真是0了

Gemini 3 Pro的发布迅速引发用户创意爆发,仅一天内便涌现大量基于其能力的创新应用。用户通过简单对话或单次指令即可生成功能完整的交互式内容,例如数字拍...

北大、字节、中科院自动化研究所等提出图像并行生成新范式

当前多模态AI领域存在一个反直觉现象:让模型在生成图像前进行文本推理,反而会降低生成结果的语义保真度。这一发现源于主流自回归架构的固有缺陷——上游推理...

分割一切并不够,还要3D重建一切,SAM 3D来了

Meta近期发布了SAM 3D和SAM 3两项重大技术更新,标志着计算机视觉领域的新突破。其中,SAM 3D包含两个子模型:SAM 3D Objects专注于物体与场景的3D重建,SAM ...
1 6 7 8 9 10 159