图像生成
图像,绘画
特斯拉世界模拟器亮相ICCV!VP亲自解密端到端自动驾驶技术路线
特斯拉自动驾驶副总裁Ashok Elluswamy在计算机视觉顶会ICCV上展示了其世界模拟器技术,该技术能够生成高度真实的驾驶场景视频,用于自动驾驶模型的训练和评估...
美团视频生成模型来了!一出手就是开源SOTA
美团最新开源视频生成模型LongCat-Video在多项核心指标上达到开源领域顶尖水平。这款参数规模达13.6B的模型支持文生视频、图生视频及视频延长三大功能,能够...
东方晶源:三大创新点工具破解先进制程良率瓶颈
随着芯片工艺向先进节点快速演进,制程技术逼近物理极限,设计与制造环节的协同难度显著加大。图形化(Patterning)相关的系统性良率损失已成为制约晶圆厂研...
超越谷歌Banana,字节联合香港中文大学等高校开源最强图像编辑生成系统DreamOmni2
香港中文大学、香港科技大学、香港大学与字节跳动联合研发的DreamOmni2系统,标志着AI图像编辑与生成领域的重要突破。该系统通过创新的三阶段数据生成流程和...
盲人复明!马斯克Neuralink联创实现人工视觉里程碑
70岁的She拉·欧文在失明15年后,通过一项名为PRIMA的人工视觉技术重获光明。这项突破性研究由Science Corporation团队主导,其创始人Max Hodak曾是马斯克Neur...
打造图像编辑领域的ImageNet?苹果用Nano Banana开源了一个超大数据集
苹果公司在开放研究领域取得突破性进展,发布了Pico-Banana-400K数据集,这是视觉编辑领域首个基于真实图像的大规模开放数据集。该数据集包含40万张图像,通...
清华联手快手可灵,撞车谢赛宁团队RAE,用SVG再证明VAE已过时
AI图像生成技术正在经历一场范式转变,传统的VAE(变分自编码器)技术逐渐被更先进的方案取代。长期以来,扩散模型依赖VAE压缩图像以降低算力成本,但VAE构建...
爆火的AI三宫格图片,比我们的生活更像电影。
最近在社交媒体上,一种由AI生成的三宫格图片迅速走红,成为抖音、小红书等平台的热门内容。这种图片通常由三张具有电影感的画面组成,搭配文艺风格的台词,...
我拿AI给神曲《八方来财》做了个MV,真的好魔性!
中国电信推出的AI创作平台TeleStudio,展示了用人工智能生成高质量视频的突破性能力。该平台基于自研的星辰大模型,支持2K分辨率、20秒时长的视频生成,并处...
Karpathy盛赞DeepSeek-OCR“淘汰”tokenizer!实测如何用Claude Code 让新模型跑在N卡上
DeepSeek团队最新发布的DeepSeek-OCR模型在OCR领域实现了多项技术突破。该6.6GB大小的专用模型首次量化了'视觉-文本token压缩比',验证了10倍近无损压缩和20...




