图像生成

图像,绘画

o1驾驶无人机后空翻,OpenAI开发者日惊掉下巴!2分钟爆改代码写App

在OpenAI伦敦开发者日上,o1模型展示了其五大核心能力:函数调用、开发者message、流式传输、结构化输出和图像理解。o1 mini与Cursor的联动在不到2分钟内搭建...

实时音视频领域拓荒者的十年

实时对话式AI的机遇正在被业界广泛讨论和探索。RTE(实时互联网)大会自2015年引入中国以来,已发展成为全球规模最大的音视频行业峰会,吸引了众多行业专家和...

人工智能投资热潮,芯片战争前沿

微软近期宣布重启三里岛核电站一号反应堆,以支持其数据中心的电力需求,成为继亚马逊之后第二家依赖传统核能的美国科技巨头。这一举措突显了人工智能系统对...

统一图像生成,无需繁杂插件!智源发布扩散模型框架OmniGen

智源研究院最近推出了一款名为OmniGen的新型扩散模型框架,该框架在图像生成领域具有多项创新特性。OmniGen能够天然支持多种图像生成任务,包括文生图、图像...

o1之后,GitHub又接入Claude、Gemini,网友:也杀不死Cursor

GitHub Copilot 近期引入了多个新的AI模型,以增强其代码生成和辅助功能。这些新模型包括Anthropic的Claude 3.5 Sonnet、Google的Gemini 1.5 Pro以及OpenAI的...

古早费曼论文手写公式也能转LaTeX,还能看懂梗图,马斯克Grok新功能上线就火了

xAI公司开发的Grok大模型在最新更新后获得了图像理解能力,这标志着科学文献数字化和标准化工作的重大进展。Grok能够将手写公式转换成LaTeX格式,准确率极高...

一个模型走天下!智源提出全新扩散架构OmniGen,AI生图进入「一键生成」时代

智源最近推出了一款名为OmniGen的新型扩散模型架构,旨在实现图像生成任务的统一。OmniGen模型以其统一性、简单性和知识迁移能力为特点,能够处理包括文生图...

神秘模型“小熊猫”一夜刷屏:排名超Flux、Midjourney,网友:一看就中国的

一个名为“red_panda”的神秘文生图模型近期在图像生成领域迅速走红,其ELO得分超过Flux 1.1 Pro高达100多分,胜率高达79%,且能在7秒内生成一张图像。这一表现...

Apple Intelligence 终于实装 iOS 18.1,用上的第一批用户已经开骂了?

Apple Intelligence 随着 iOS 18.1、iPadOS 18.1 和 macOS Sequoia 15.1 的更新正式推出,带来了多项重大更新,包括 AI 写作工具、照片记忆和 Siri 的升级。...

新扩散模型OmniGen一统图像生成,架构还高度简化、易用

智源近日推出了OmniGen,这是一种新的扩散模型架构,旨在统一图像生成的多模态模型。OmniGen以其统一性、简单性和知识迁移能力为特点,支持多种图像生成任务...
1 55 56 57 58 59 138