图像生成

网友疯玩Gemini 3！AI造物门槛真是0了

Gemini 3 Pro的发布迅速引发用户创意爆发，仅一天内便涌现大量基于其能力的创新应用。用户通过简单对话或单次指令即可生成功能完整的交互式内容，例如数字拍...

AIGC动态

3个月前

当前多模态AI领域存在一个反直觉现象：让模型在生成图像前进行文本推理，反而会降低生成结果的语义保真度。这一发现源于主流自回归架构的固有缺陷——上游推理...

AIGC动态

3个月前

Meta近期发布了SAM 3D和SAM 3两项重大技术更新，标志着计算机视觉领域的新突破。其中，SAM 3D包含两个子模型：SAM 3D Objects专注于物体与场景的3D重建，SAM ...

AIGC动态

3个月前

2025年被普遍视为AI Agent技术落地的关键年份，行业期待从“对话生成”转向“任务执行”的范式突破。然而早期硬件化尝试如Rabbit R1的失败案例表明，将Agent能力...

AI-Agent

3个月前

近来，世界模型（World Model）成为AI领域的热点，多个实验室展示了仅凭图片或文字生成可交互3D世界的炫酷Demo。然而，这些虚拟生成的内容大多基于模型想象，...

AIGC动态

3个月前

2025年被普遍视为AI Agent技术爆发的关键节点，行业期待AI从被动响应转向主动执行。然而早期硬件化尝试如Rabbit R1的失败案例表明，将Agent能力封装为独立设...

AI-Agent

3个月前

大语言模型领域近期迎来密集更新，OpenAI、xAI和谷歌相继推出突破性产品。OpenAI的GPT-5.1通过高情商交互和精准指令遵从引发关注，而xAI的Grok 4.1在LMArena...

AIGC动态

3个月前

Gemini 3 Pro的发布标志着人工智能领域的一次重大突破。经过长达238天的等待，这款备受期待的模型终于正式上线，其表现远超预期，甚至让长期关注AI进展的观察...

AIGC动态

3个月前

阿里巴巴的Qwen系列模型通过开源策略实现了技术逆袭，成为全球开发者和企业广泛采用的开源模型之一。通过开源，阿里千问成为大家心里真正的OpenAI，其模型下...

AI-Agent

3个月前

阿里最新推出的千问APP在应用商店悄然上线，标志着其AI战略进入新阶段。这款应用采用极简的单色设计，与之前的通义APP形成鲜明对比，同时整合了Qwen全系列最...

AIGC动态

3个月前