图像生成

图像,绘画

网友疯玩Gemini 3!AI造物门槛真是0了

Gemini 3 Pro的发布迅速引发用户创意爆发,仅一天内便涌现大量基于其能力的创新应用。用户通过简单对话或单次指令即可生成功能完整的交互式内容,例如数字拍...

北大、字节、中科院自动化研究所等提出图像并行生成新范式

当前多模态AI领域存在一个反直觉现象:让模型在生成图像前进行文本推理,反而会降低生成结果的语义保真度。这一发现源于主流自回归架构的固有缺陷——上游推理...

分割一切并不够,还要3D重建一切,SAM 3D来了

Meta近期发布了SAM 3D和SAM 3两项重大技术更新,标志着计算机视觉领域的新突破。其中,SAM 3D包含两个子模型:SAM 3D Objects专注于物体与场景的3D重建,SAM ...

昆仑万维发布Skywork R1V4-Lite:30B多模态模型胜Gemini 2.5 Pro,速度还快19倍

2025年被普遍视为AI Agent技术落地的关键年份,行业期待从“对话生成”转向“任务执行”的范式突破。然而早期硬件化尝试如Rabbit R1的失败案例表明,将Agent能力...

如视发布空间大模型Argus1.0,支持全景图等多元输入,行业首创!

近来,世界模型(World Model)成为AI领域的热点,多个实验室展示了仅凭图片或文字生成可交互3D世界的炫酷Demo。然而,这些虚拟生成的内容大多基于模型想象,...

昆仑万维发布Skywork R1V4-Lite:用30B多模态模型打平Gemini 2.5 Pro,速度还快19倍

2025年被普遍视为AI Agent技术爆发的关键节点,行业期待AI从被动响应转向主动执行。然而早期硬件化尝试如Rabbit R1的失败案例表明,将Agent能力封装为独立设...

Gemini 3正式发布成最强模型!OpenAI更新GPT-5.1,马斯克发布Grok 4.1,大模型争宠让世界沸腾

大语言模型领域近期迎来密集更新,OpenAI、xAI和谷歌相继推出突破性产品。OpenAI的GPT-5.1通过高情商交互和精准指令遵从引发关注,而xAI的Grok 4.1在LMArena...

实测Gemini 3 Pro – 此即未来。

Gemini 3 Pro的发布标志着人工智能领域的一次重大突破。经过长达238天的等待,这款备受期待的模型终于正式上线,其表现远超预期,甚至让长期关注AI进展的观察...

Qwen用开源逆袭GPT的故事,千问APP要再干一遍

阿里巴巴的Qwen系列模型通过开源策略实现了技术逆袭,成为全球开发者和企业广泛采用的开源模型之一。通过开源,阿里千问成为大家心里真正的OpenAI,其模型下...

千问APP悄悄上线,阿里的AI超级入口也终于来了。

阿里最新推出的千问APP在应用商店悄然上线,标志着其AI战略进入新阶段。这款应用采用极简的单色设计,与之前的通义APP形成鲜明对比,同时整合了Qwen全系列最...
1 2 3 152