图像生成

快手版Sora「可灵」开放测试：生成超120s视频，更懂物理，复杂运动也能精准建模

本文介绍了一款名为可灵的全新国产视频生成大模型，它是快手公司推出的产品级应用。可灵采用了类似Sora的技术路线，融合了多项自研技术创新，生成的视频不仅...

AIGC动态

2年前 (2024)

在人工智能技术飞速发展的今天，大模型技术的突破为智能创作带来无限可能。潞晨科技以其自研的Colossal-AI技术，引领了一场降低成本、提高效率的深刻变革。该...

AIGC动态

2年前 (2024)

在互联网发展的历程中，成人内容一直是一个敏感而普遍存在的议题。X平台，这个曾经的推特，也面临着同样的挑战。新政策宣布，用户可以分享自愿制作和分发的成...

AIGC动态

2年前 (2024)

视频超分辨率技术致力于将低分辨率视频转化为高分辨率，面临两大挑战：一是保持视频帧的时间连贯性，避免闪烁或抖动；二是放大视频帧时重建高频细节，以呈现...

AIGC动态

2年前 (2024)

根据文章内容，以下是详细的摘要总结：1. 字节跳动的AI产品豆包在推出后迅速积累了大量用户，其月活跃用户达到2600万，下载量超过1亿，表明豆包已超过竞品Kim...

AIGC动态

2年前 (2024)

字节跳动在AI领域展现了其坚定的行动力，并通过全面布局寻找下一个杀手级应用。具体而言，字节跳动的AI产品线涵盖了多个领域，包括聊天、社交、图像视频、教...

AIGC动态

2年前 (2024)

在数据爆炸时代，大模型学习非结构化数据如视频、音频和图片面临重大挑战。多模态学习，特别是处理多种输入和异构数据时，深度神经网络易出现过拟合和泛化不...

AIGC动态

2年前 (2024)

近期研究表明，通过训练纯解码器生成模型，可以成功地生成包括音频、图像和状态-动作序列在内的多种模态的新序列。这些模型通常采用词汇扩展方法实现多模态表...

AIGC动态

2年前 (2024)

量子位报道，ControlNet作者Lvmin Zhang推出了新项目Omost，旨在通过人工智能技术解决AI绘画中的提示词写作难题。用户只需提供一句简单的提示词，Omost即可自...

AIGC动态

2年前 (2024)

在当前的计算机视觉领域，Vision Transformer（ViT）与传统的卷积神经网络（CNN）之争正日益激烈。近期，图灵奖得主、Meta首席科学家Yann LeCun对这场争论发...

AIGC动态

2年前 (2024)