图像生成
图像,绘画
三年连下三癌,阿里AI跑通了多癌筛查
阿里达摩院联合医疗机构研发的肠癌人工智能筛查系统已正式刊载于国际肿瘤学权威期刊。该算法聚焦于从常规平扫CT图像中识别临床极易漏诊的微弱肿瘤迹象。模型...
不卷参数卷架构,这个开源模型把图像理解和生成统一了
商汤最新推出的SenseNova-U1模型在视觉理解与图像生成领域实现了底层架构的实质性突破。该方案以NEO-unify为核心设计,摒弃了传统多模态系统中视觉编码器与变...
阿里神秘模型HappyHorse:质感一流,接下来挑战是进入阿里真实业务
阿里推出的AI视频模型已稳居赛道第一梯队,并在核心评测榜单中表现优异。该工具集成首帧生成与多图参考功能,覆盖主流画面比例,最高支持1080p输出,单次多路...
清华段岳圻团队论文:从调参数到做控制,文生图迎来一次方法论升级丨CVPR 2026
实验验证环节构建于多尺度模型集群与分层评价体系之上,同步覆盖数据分布匹配度、跨模态语义一致性以及多维人类视觉偏好。测试数据表明,重构后的控制逻辑在...
断层领先!OpenAI最强绘图模型ChatGPT Images 2.0来了
ChatGPT Images 2.0 的发布标志着绘图工具正式向视觉系统进化,不再局限于渲染工具定位,而是成为参与战略设计的伙伴。模型大幅提升了遵循复杂指令的精确度,...
接入拓竹只是开始,AI 3D 赛道第一个盈利样本长什么样
2026 年 3 月,拓竹科技将 Meshy 6 接入 MakerWorld,用户上传照片两分钟即可获得兼容 AMS 的 3D 打印文件。这条链路第一次做到了足够顺,照片直接变成一个可...
谷歌全新深度研究智能体再进化:企业级工作流的坚实底座
新工具突破了公共网络限制,实现公开信息与企业内部私密数据的无缝融合。智能体能够检索网页、远程 MCP、用户上传文件及连接的文件存储库,化身为能够在专业...
大厂AI抢人大战,从实习生开始
全球人工智能人才争夺日趋激烈,头部科技企业虽提供高薪,但实习生往往面临岗位边缘化、重复劳动及算力资源匮乏的困境。即便是国内头部大厂,实习生通常只能...
压榨系统性能:视频审核中台从 280ms 降低至 90ms 的架构演进与深度优化
视频审核服务中台初期采用串行检测架构,旨在快速失败以节约算力,但在合法图片占多数的实际场景中,串行累加耗时导致链路延迟不可接受。系统底层潜伏着三大...
GPT-Image-2 :随意做出可作为“证据”的图片,强到让人恐慌
4 月 21 日,OpenAI 正式发布 GPT-Image-2,其在 Image Arena 排行榜上以显著优势位居第一,实现了全榜领先的清洁横扫。该模型面向所有 ChatGPT 用户,核心参...





