图像生成
图像,绘画
OpenAI一夜改写历史,GPT-4o干翻所有语音助手!丝滑如真人引爆全网科幻成真
OpenAI在一次备受瞩目的发布会上宣布了其最新的人工智能模型GPT-4o,这一事件被认为具有改变历史的意义。GPT-4o的发布标志着人机交互迈入了一个全新的时代,...
GPT-4o深夜炸场!AI实时视频通话丝滑如人类,Plus功能免费可用,奥特曼:《她》来了
OpenAI 最新旗舰大模型 GPT-4o 已经发布,它不仅免费可用,而且能力横跨听、看、说,丝滑流畅毫无延迟,就像在打一个视频电话。GPT-4o 的 'o' 是 Omni 的缩写...
重磅!OpenAI发布GPT-4o,非常惊艳语音版ChatGPT!
OpenAI最近发布了其新旗舰模型GPT-4o,这是一个具有里程碑意义的事件,因为它标志着全球生成式人工智能领域的一个重大进步。GPT-4o不仅能够处理文本,还能跨...
Hello GPT-4o
OpenAI最近推出了其最新的旗舰模型GPT-4o,这是一个跨音频、视觉和文本的全能模型,代表了自然人机交互的重大进步。GPT-4o能够接收和输出文本、音频和图像的...
除了一键启动Copilot,什么是AI PC本来该有的样子?
在过去一年多的时间里,人工智能(AI)技术的快速发展已经开始深刻地影响着我们的生活和工作方式。特别是在个人电脑(PC)领域,AI技术的应用正在推动一场新...
美国教授用2岁女儿训AI模型登Science!人类幼崽头戴相机训练全新AI
这篇文章报道了纽约州立大学心理学家Brenden Lake教授的一项研究,他通过让女儿Luna头戴相机收集数据,来探索如何更有效地训练人工智能(AI)模型,特别是大...
一线创业者圆桌讨论:多模态 AI 的创业机会在于「有用」
产品人的AI观点:1. 用户在使用AI图像/视频生成产品时,更关注可控性和成本。专业用户倾向于使用SD WebUI/ComfyUI工作流,而普通用户则更多使用MidJourney等...
DiT架构大一统:一个框架集成图像、视频、音频和3D生成,可编辑、能试玩
本文报道了基于Diffusion Transformer(DiT)的新模型Flag-DiT,该模型由上海AI Lab、港中文和英伟达的研究者联合推出,旨在通过流(Flow-based)的大型扩散T...
中山大学与联想团队发布 ConsistentID,单张照片即可成为百变超人
图像生成技术的最新进展,特别是基于扩散的文本到图像模型,已经极大地推动了个性化和定制化肖像生成的发展。这些技术在电子商务广告、个性化礼物定制和虚拟...
国产大模型:今天起,我们100万tokens只需1元!
智谱AI,一家国内的大模型开发商,近期在顶级会议ICLR上作为特邀演讲嘉宾后,紧接着宣布了其大模型开放平台的价格调整:1元人民币可兑换1000000 tokens,这一...