图像生成

图像,绘画

深夜更新,国行 Apple 智能这次真的来了(附上手实测

本次更新标志着苹果Apple Intelligence服务正式登陆中国内地市场,历经两年等待后终于落地。自3月31日凌晨起,部分国行设备用户已收到iOS 26.4系统更新,原Si...

全球OCR新王来自中国开源!GitHub狂揽73300+Star

在AI大模型时代,百度文心大模型衍生的PaddleOCR项目正式超越谷歌Tesseract OCR,以73300+ Star登顶GitHub全球OCR项目榜首,实现中国开源在该基础赛道上首次...

快门思维之上,vivo 想让手机学会“看懂”这个世界

在博鳌亚洲论坛前夕,vivo 总裁胡柏山提出关键论断:“没有感知能力,AI 就像是困在黑屋子里的大师,算力再强,也看不见咫尺之外的世界。” 这一观点成为其后续...

让AI看懂科研图表:深势科技开源150万高质量科研图文数据集

OmniScience数据集的发布标志着AI在科研文献深度理解与自动解析能力上的重要突破。该数据集由深势科技开源,包含150,000个高质量图文对,覆盖生物学、材料科...

中山大学梁小丹团队论文:让视频生成从「看起来真实」到「物理上正确」丨CVPR 2026

ProPhy 方法致力于提升视频生成模型在物理一致性方面的表现,使其不仅在视觉上逼真,更在物理逻辑上可信。当前视频生成模型虽已大幅提高图像质量,但在动态交...

融资千万的 Violoop ,要做中国版的「硬件龙虾」

Violoop 是由连续创业者何佳霖创立的 AI 科技公司,其核心产品被称作“中国版硬件龙虾”,是一款手掌大小的桌面硬件设备,通过物理接入电脑实现本地视觉感知与...

好看不等于会交互!阿里发布基于交互的世界模型基准

在当前AIGC发展背景下,视频生成技术虽已实现视觉效果的高度精致化,但在物理规律与交互逻辑层面仍存在显著缺陷。针对这一问题,阿里、中科院、北航及北邮联...

Claude版龙虾VS OpenClaw,Anthropic又站在了OpenAI的反面

Anthropic于3月24日发布Claude Pro与Claude Max订阅用户专属的电脑原生操控功能,标志着其在AI智能体领域从框架嫁接转向深度体系化整合。与OpenClaw广泛传播...

代号“峨眉”!安谋科技自研VPU IP攀上新巅峰

安谋科技(中国)有限公司近期在上海举办技术发布会《玲珑·视界》,正式推出面向AI应用的新一代VPU IP产品“玲珑”V560/V760,代号“峨眉”,并已实现首批客户授...

开源音视频同步SOTA基座:极简的单流架构,2秒出片

daVinci-MagiHuman是由上海创智学院(SII)生成式人工智能研究实验室(GAIR)与Sand.ai联合发布的开源音视频生成基础模型,旨在解决当前开源生态中生成质量、...
1 2 3 4 5 6 173