图像生成

图像,绘画

刚刚,OpenAI发布新文生图模型,免费、逼真到难以分辨

OpenAI在技术直播中发布了GPT-4和Sora的重大更新,重点介绍了全新的文生图模型。该模型不仅支持文本生成图像,还具备自定义操作、连续发问、风格转换、图像PP...

突破14nm工艺检测壁垒:天准科技TB2000明场纳米图形晶圆缺陷检测装备开启国产缺陷检测新纪元

苏州天准科技股份有限公司旗下矽行半导体公司研发的明场纳米图形晶圆缺陷检测装备TB2000已正式通过厂内验证,并计划在SEMICON 2025展会天准展台正式发布。这...

试了试 ChatGPT的图片生成功能,我佩服的无话可说

今天凌晨,ChatGPT正式发布了基于GPT-4o模型的原生图像生成功能,标志着其在图片处理能力方面的一次重要升级。这一功能的推出,不仅展示了OpenAI在多模态推理...

AI-Native游戏应该如何落地?看看这12款游戏是怎么做的

近年来,AI技术在游戏领域的应用逐渐增多,涵盖了派对游戏、恋爱模拟、剧情互动等多个品类,为传统玩法注入了新的活力。通过对11款AI驱动游戏的体验,发现开...

推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1

在基于物理世界的真实场景中进行视觉问答时,现有的AI模型往往无法识别出参考选项中没有最佳答案的情况。例如,当问题要求预测车辆接下来的行动时,预设选项...

32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强

阿里通义千问Qwen发布了最新视觉语言模型Qwen2.5-VL-32B-Instruct,进一步扩展了其开源家族的产品线。该模型在尺寸和性能之间取得了平衡,能够在本地运行,并...

爆火Block Diffusion引发LLM架构变革?自回归+扩散模型完美结合 | ICLR 2025

块离散去噪扩散语言模型(BD3-LMs)结合了自回归模型和扩散模型的优势,解决了现有扩散模型在生成长度受限、推理效率低和生成质量低等方面的问题。通过块状扩...

AI就是所有人疯狂竞争,最后Google赢得比赛的游戏?

2016年,Google CEO桑达尔·皮查伊宣布公司将转向“AI优先”的战略,标志着Google对人工智能领域的深度押注。2017年,Google研究人员发表了开创性论文《Attentio...

ElevenLabs举办了一场全球黑客松,这些AI Voice产品得奖了

ElevenLabs举办的全球Hackathon活动吸引了来自世界各地的数百名开发者,共同打造了超过300个AI Agent。活动展示了语音AI技术的广泛应用,涵盖了从通信协议到...

Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强

澳大利亚国立大学的研究团队提出了一种全新的图像生成模型ARINAR,该模型在生成质量和速度上均取得了显著提升。ARINAR全称为双层自回归逐特征生成模型,其核...
1 51 52 53 54 55 165