更美图像生成、直出分钟级视频，国产自研DiT架构的越级之旅

AIGC动态2年前 (2024)发布 almosthuman2014

4,546 0 0

文章摘要

2024年，AIGC领域特别是文生视频赛道呈现出显著的发展趋势，其中智象未来（HiDream.ai）作为国内专注于构建视觉多模态基础模型及应用的生成式AI初创公司，以其自主研发的模型和一站式AI图像及视频生成平台「Pixeling 千象」，引起了广泛关注。

智象大模型2.0的升级，基于中文原生的Diffusion Transformer（DiT）架构，不仅优化了底层架构、训练数据和策略，还在图像和视频生成上实现了质的飞跃。

升级后的模型在图像生成上更具美感和艺术性，同时在图像中文字嵌入和分钟级视频生成方面也展现了强大的能力。

智象大模型2.0在文生图技能上进行了显著的改进，生成的图像不仅美感和艺术性得到提升，相关性也更强，能够更好地满足用户需求。

在视频生成方面，智象大模型2.0支持的视频时长从15秒提升至分钟级，实现了业界较高水平。

此外，模型还支持可变时长和尺寸的视频生成，以及4K超清画质，使得生成的视频在动作流畅性、细节渲染上都有显著提升。

智象未来在多模态视觉生成领域的技术积累和创新，为其在AIGC赛道上奠定了坚实的基础。

公司不仅在C端获得了超过百万的单月访问量和千万的AI图像及视频生成总量，而且在B端与多家企业达成战略合作，将模型能力应用到多个行业中，发挥出模型的商业潜能。

智象大模型的持续迭代和实际体验的提升，展示了公司在视觉多模态生成方向上的快速发展和行业领导地位。

随着7月中旬文生视频功能的上线，智象未来有望进一步巩固其在AIGC领域的领先地位，并为用户带来更加丰富和高质量的视觉体验。

原文和模型

【原文链接】 阅读原文 [ 4628字 | 19分钟 ]
【原文作者】 机器之心
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

Moonshot AI

月之暗面是一家 AI 初创大模...

# AIGC动态 # AI大模型 # 图像生成 # 视频生成 # AIGC趋势 # 智象未来 # 视觉多模态

文章版权归作者所有，未经允许请勿转载。

对话智象未来CTO姚霆：当Sora退场后，世界模型的终局是“轮回”

钛媒体AGI

785

大模型预测，下一个token何必是文字？

量子位

3,908

HiDream-O1-Image-1.5 刷新国产图像生成模型纪录：砍掉 VAE，是图像模型的未来吗？

AI科技评论

310

新年大礼！阿里刚开源视觉 AI Agent模型—Qwen2.5-VL

AIGC开放社区

3,142

HiDream CTO 姚霆：Sora 出圈，中国 AI 创业公司的机会在哪里？

Founder Park

3,074

全面突围，谷歌昨晚更新了一大波大模型产品

机器之心

3,721

暂无评论

暂无评论...

更美图像生成、直出分钟级视频，国产自研DiT架构的越级之旅

文章摘要

原文和模型

WAIC上，高通这一波生成式AI创新，让我们看到了未来

马斯克豪掷40亿训Grok-3！红杉高盛大泼冷水，AI收支鸿沟或已达5000亿美元

相关文章

暂无评论

热门网址

热门文章

更美图像生成、直出分钟级视频，国产自研DiT架构的越级之旅

文章摘要

原文和模型

WAIC上，高通这一波生成式AI创新，让我们看到了未来

马斯克豪掷40亿训Grok-3！红杉高盛大泼冷水，AI收支鸿沟或已达5000亿美元

相关文章

暂无评论

AstronClaw-安全养虾

LibTV-AI视频创作

讯飞AI大学堂

热门网址

热门文章