图像生成

图像,绘画

Gemini翻车,谷歌决策十字路口:该解雇CEO还是该进行“结构化变革”?

摘要:谷歌的Gemini Pro 1.5发布后,因无法生成“白人形象”而引发争议,被指责存在价值观上的歧视。谷歌CEO Sundar Pichai 发表声明,承诺进行结构性改变。此...

ICLR 2024 Spotlight|厦门大学、Intel、大疆联合出品,从网络视频中学习零样本图像匹配大模型

摘要:图像匹配是计算机视觉中的关键任务,对于三维重建、视觉定位等应用至关重要。传统算法如SIFT在复杂场景下表现有限,而基于深度学习的模型受限于特定场...

想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速

摘要总结:Sora的创新:2024年,Sora的出现为文生视频研究者设立了新目标。其核心技术之一是将视觉数据转化为统一表征形式,结合Transformer和扩散模型,展现...

让Sora东京女郎唱歌、高启强变声罗翔,阿里人物口型视频生成绝了

摘要:机器之心报道了阿里巴巴智能计算研究院的EMO(Emote Portrait Alive)框架,这是一个音频-视频合成方法,用于生成表现力强、真实度高的说话人头部视频...

AI视频又炸了!照片+声音变视频,阿里让Sora女主唱歌小李子说rap

摘要总结:阿里推出了一款名为EMO的基于音频驱动的肖像视频生成框架,引起了广泛关注。用户只需提供一张参考图像和一段音频,即可生成表情生动的AI视频。这项...

吐槽完 Sora,Google自己做的“基础世界模型”来了

Google DeepMind推出了名为「Genie」的人工智能模型,这是一个能够根据用户提示生成交互式视频游戏的AI。Genie可以将合成图像、真实照片、手绘草图或想法转换...

Llama 3被爆7月解禁剑指GPT-4,最大参数超1400亿!2名核心团队成员却离职

新智元报道:据外媒报道,Meta计划在7月发布Llama 3,这是一个开源大模型,预计将具有超过1400亿参数,性能将远超Llama 2。Llama 3将解除一些限制,能更好地...

中国如何复刻Sora,华人团队长文解构!996 OpenAI研究员:Sora是视频GPT-2时刻

摘要:OpenAI研究员Jason Wei将Sora视频生成模型比作视频领域的GPT-2,预示着视频生成技术的新时代。Sora能够创作出具有艺术感和逼真度的短视频,尽管还不能...

谷歌CEO承认其人工智能完全搞砸了

谷歌近期遭遇了一起由Gemini AI引擎生成的多元化纳粹图片引发的公关危机。这一事件引发了公众的关注和不满,因为这种做法不仅缺乏审美品位,还历史事实不准确...

速递 | 刚刚敲定!AI图像Photoroom估值5亿美金,融资4300万美金,专注自研大模型

Photoroom,一家总部位于巴黎的人工智能照片编辑应用公司,以其惊人的增长速度吸引了大量在线商务和休闲用户。近日,该公司成功完成了最新一轮融资,估值达到...
1 107 108 109 110 111 122