图像生成

图像,绘画

DeepSeek首次有了视觉能力,技术论文却被它连夜删掉了

近期,深度求索在开启视觉能力灰度测试后,迅速发布并随后撤回了相关技术论述,其核心在于提出了视觉基元推理框架。传统大模型常依赖自然语言处理图像信息,...

实测纳逗 Pro:能做专业影视级内容的智能平台长啥样

当前人工智能视频技术已跨越早期功能验证阶段,全面进入追求画面质感、叙事逻辑与商业可用性深度融合的专业化发展新周期。行业竞争焦点逐步转向能否将生成式...

CVPR 2026 动态视觉智能观察梳理:Benchmark 之外的新考题已经出现

计算机视觉领域的研究重心正从单一基准测试的高精度优化,转向复杂开放环境下的持续理解与自适应。传统视觉系统长期依赖输入充分、目标预设及模型参数冻结的...

全网热议的GPT image 2平替?不止是信息图,它让连续的图文创作一步到位

商汤发布的SenseNova U1多模态模型通过底层架构重构,有效解决了传统AI生图工具在文字渲染、版式控制与视觉一致性上的核心痛点。该系列采用NEO-Unify基础架构...

美国暂停对华虹半导体部分供货?中方回应;东方甄选奖励300名员工市值4亿股份,人均超140万元;DeepSeek正在灰度测试「识图模式」

近期科技与产业领域动态密集,算力突破与芯片供应链博弈成为核心焦点。DeepSeek正式开启图像识别模式内测,标志着国内大语言模型向多模态理解能力迈出关键一...

开源SOTA!商汤原生多模态一个大脑完成看图、推理、作画

商汤正式开源新一代视觉多模态模型SenseNova U1,其核心突破在于全面摒弃传统的视觉编码器与变分自编码器拼接方案,转而采用自研的NEO-unify原生统一架构。该...

一个小众模型突然火了,可能代表新的范式。

近年大模型密集发布,虽在性能参数上持续优化,但底层架构的范式演进仍是技术发展的核心。行业已历经三大关键里程碑:通过内部思维链实现深度计算的推理范式...

CVPR 2026 生成式 AI 观察梳理:视觉模型开始重写默认设定

视觉人工智能领域的技术发展正经历从既定范式内性能堆叠向底层建模范式重构的关键转折。过去依赖的模型扩容与采样微调策略虽能短暂推升基准指标,但当前前沿...

最近刷屏的Flipbook,想把互联网彻底变成实时生成的无限世界

Flipbook突破了传统基于HTML结构与超链接跳转的信息组织模式,不再将屏幕划分为一页页可点击的静态网页,而是将整个互联网重构为可无限延展的视觉生成空间。...

无需训练,如何提升黑箱VLM?CARPRT用「类别感知」给出答案

视觉语言模型在零样本分类任务中展现巨大潜力,但预测精度高度依赖描述模板的构建方式。现有集成方案多采用全局共享参数配置,忽略了指针对特定分类对象的语...
1 4 5 6 7 8 180