图像生成
图像,绘画
分割一切并不够,还要3D重建一切,SAM 3D来了
Meta近期发布了SAM 3D和SAM 3两项重大技术更新,标志着计算机视觉领域的新突破。其中,SAM 3D包含两个子模型:SAM 3D Objects专注于物体与场景的3D重建,SAM ...
昆仑万维发布Skywork R1V4-Lite:30B多模态模型胜Gemini 2.5 Pro,速度还快19倍
2025年被普遍视为AI Agent技术落地的关键年份,行业期待从“对话生成”转向“任务执行”的范式突破。然而早期硬件化尝试如Rabbit R1的失败案例表明,将Agent能力...
如视发布空间大模型Argus1.0,支持全景图等多元输入,行业首创!
近来,世界模型(World Model)成为AI领域的热点,多个实验室展示了仅凭图片或文字生成可交互3D世界的炫酷Demo。然而,这些虚拟生成的内容大多基于模型想象,...
昆仑万维发布Skywork R1V4-Lite:用30B多模态模型打平Gemini 2.5 Pro,速度还快19倍
2025年被普遍视为AI Agent技术爆发的关键节点,行业期待AI从被动响应转向主动执行。然而早期硬件化尝试如Rabbit R1的失败案例表明,将Agent能力封装为独立设...
Gemini 3正式发布成最强模型!OpenAI更新GPT-5.1,马斯克发布Grok 4.1,大模型争宠让世界沸腾
大语言模型领域近期迎来密集更新,OpenAI、xAI和谷歌相继推出突破性产品。OpenAI的GPT-5.1通过高情商交互和精准指令遵从引发关注,而xAI的Grok 4.1在LMArena...
实测Gemini 3 Pro – 此即未来。
Gemini 3 Pro的发布标志着人工智能领域的一次重大突破。经过长达238天的等待,这款备受期待的模型终于正式上线,其表现远超预期,甚至让长期关注AI进展的观察...
Qwen用开源逆袭GPT的故事,千问APP要再干一遍
阿里巴巴的Qwen系列模型通过开源策略实现了技术逆袭,成为全球开发者和企业广泛采用的开源模型之一。通过开源,阿里千问成为大家心里真正的OpenAI,其模型下...
千问APP悄悄上线,阿里的AI超级入口也终于来了。
阿里最新推出的千问APP在应用商店悄然上线,标志着其AI战略进入新阶段。这款应用采用极简的单色设计,与之前的通义APP形成鲜明对比,同时整合了Qwen全系列最...
AI Native 的影像公司们,颠覆赛道的机会来了!
影像设备行业正经历由计算能力驱动的深刻变革,光学与计算在价值交付中的配比变化成为重塑产业链的核心逻辑。过去五十年间,从胶片时代光学硬件的绝对主导,...
图像编辑新神器:英伟达用拍电影思维解决图像编辑与世界模拟一致性难题
AI图像编辑领域长期面临物理一致性难题,特别是在物体移动或环境转换等复杂编辑任务中,传统方法容易产生违反物理规律的失真结果。 NVIDIA与多伦多大学联合提...





