图像生成
图像,绘画
昆仑万维发布Skywork R1V4-Lite:用30B多模态模型打平Gemini 2.5 Pro,速度还快19倍
2025年被普遍视为AI Agent技术爆发的关键节点,行业期待AI从被动响应转向主动执行。然而早期硬件化尝试如Rabbit R1的失败案例表明,将Agent能力封装为独立设...
Gemini 3正式发布成最强模型!OpenAI更新GPT-5.1,马斯克发布Grok 4.1,大模型争宠让世界沸腾
大语言模型领域近期迎来密集更新,OpenAI、xAI和谷歌相继推出突破性产品。OpenAI的GPT-5.1通过高情商交互和精准指令遵从引发关注,而xAI的Grok 4.1在LMArena...
实测Gemini 3 Pro – 此即未来。
Gemini 3 Pro的发布标志着人工智能领域的一次重大突破。经过长达238天的等待,这款备受期待的模型终于正式上线,其表现远超预期,甚至让长期关注AI进展的观察...
Qwen用开源逆袭GPT的故事,千问APP要再干一遍
阿里巴巴的Qwen系列模型通过开源策略实现了技术逆袭,成为全球开发者和企业广泛采用的开源模型之一。通过开源,阿里千问成为大家心里真正的OpenAI,其模型下...
千问APP悄悄上线,阿里的AI超级入口也终于来了。
阿里最新推出的千问APP在应用商店悄然上线,标志着其AI战略进入新阶段。这款应用采用极简的单色设计,与之前的通义APP形成鲜明对比,同时整合了Qwen全系列最...
AI Native 的影像公司们,颠覆赛道的机会来了!
影像设备行业正经历由计算能力驱动的深刻变革,光学与计算在价值交付中的配比变化成为重塑产业链的核心逻辑。过去五十年间,从胶片时代光学硬件的绝对主导,...
图像编辑新神器:英伟达用拍电影思维解决图像编辑与世界模拟一致性难题
AI图像编辑领域长期面临物理一致性难题,特别是在物体移动或环境转换等复杂编辑任务中,传统方法容易产生违反物理规律的失真结果。 NVIDIA与多伦多大学联合提...
TRAE SOLO正式版上线,我用30分钟写了一个想做了半年的网站。
字节跳动旗下编程工具TRAE SOLO结束内测阶段,正式推出全量版本并限时免费开放。该产品最初定位为类似Cursor的IDE工具,但随着Agent技术热潮的兴起,逐渐转型...
你以为在点「红绿灯」验证身份,其实是在给AI免费打工
最近一篇调侃「我不是机器人」验证流程的帖子引发广泛关注,视频中用户需用鼠标将灰色「猫屎团」拖到垃圾桶,最后勾选「我不是猫」才能通过验证。该帖浏览量...
打破显存墙:谢赛宁团队提出CLM,单卡RTX 4090「撬动」1亿高斯点
3D Gaussian Splatting (3DGS)是一种基于各向异性3D高斯体构建场景表示的新视角合成技术,能够通过带位姿的图像训练快速渲染未见视角,在渲染速度和图像质量...





