图像生成
图像,绘画
商汤全球首创「日日新SenseNova 4.0」惊天大模型!彻底颠覆你的AI体验
近日,中国人工智能企业商汤宣布推出全球首个多模态大型模型“日日新SenseNova 4.0”。该模型能同时处理文本、图像、音频等不同形式的数据,并在多项任务上超越...
字节跳动正秘密研发多个AI产品
摘要:界面新闻报道称,字节跳动正在AI大模型领域秘密研发多个产品,包括多模态数字人产品以及AI生图、AI生视频产品等。据悉,字节跳动旗下剪映已组建封闭团...
Text Inversion: 比 Lora 更简单地训练人脸【Stable Diffusion 炼丹教程】
本文详细介绍了如何使用Text Inversion方法训练Stable Diffusion模型,使其能够生成特定的人物图像。文章首先解释了Text Inversion的基本概念和优势,然后逐...
文生视频模型“卷”出新天际;多家手机厂商AlI in Al,终端AI时代来临?| 大模型一周大事
在过去一周,大模型行业迎来了多项重要进展。OpenAI发布的视频生成产品Sora成为焦点,预示着AI在视频制作领域的重大突破。Sora的发布不仅降低了视频制作的门...
3000万美金,又一家视频生成初创公司获得融资
根据The Information的报道,一家名为Genmo的AI驱动视频生成初创公司即将从硅谷老牌风投机构NEA处筹集至少3000万美元的资金。Genmo旨在为电影制作人、制片人...
外媒抢先实测Sora,视频大翻车惨不忍睹?不懂物理/动物变形/速度巨慢,但初创公司已经创死一片
新智元报道:Sora,OpenAI的新型AI视频生成工具,尽管在技术上取得了显著进步,但目前仍存在一些问题。Bloomberg记者的体验显示,Sora在处理视频请求时速度缓...
“谷歌版Sora”被嘲画质好糊,但在世界模拟器上又前进了一步
谷歌DeepMind团队推出了一个名为Genie的交互式虚拟世界生成模型,它拥有110亿参数。Genie的特点是能够从单张图像出发,生成可交互的2D虚拟世界,而且这个虚拟...
从 Sora 出发,视频生成模型会如何改变电子游戏开发范式,以及泛娱乐内容形态?
这篇文章由AutoGame创始人张昊阳撰写,探讨了OpenAI最新推出的文生视频模型Sora如何改变电子游戏的开发和制作流程。文章首先介绍了Sora模型的能力,它能够从...
字节等待一鸣惊人
近日,字节跳动正式发布了文生图模型SDXL-Lightning,采用了新的渐进式对抗蒸馏技术,显著提高了图像生成的速度和质量,将计算时间和成本降至十分之一。此外...
与Sora一样能生成视频、图像,还能一次解读100万数据!
本文介绍了加州大学伯克利分校研究人员开源的大世界模型(LWM),这是一种多模态自回归模型,具备文本、音频、图像和视频的生成与理解能力。LWM能够一次性精...