腾讯研发了快一年的混元文生图模型，说开源就开源了？

AIGC动态2年前 (2024)发布 admin

3,653 0 0

文章摘要

本文主要介绍了腾讯公司开源的混元文生图大模型。该模型是国内首个中文原生的DiT架构模型，具备中英文双语理解及生成能力，特别擅长生成具有中国元素的内容，如古诗词、俚语、传统建筑、中华美食等。

混元文生图大模型解决了现有文生图工具对中文理解不足和不通用的问题。模型支持最多256个字符的输入，大大降低了用户的使用门槛。在长文本输入的基础上，模型还支持用户文本改写以及多轮绘画，确保生成结果的可用性。

该模型采用了DiT架构，具有强大的视觉生成能力。腾讯混元团队通过改进和优化模型算法、数据处理和工程化流程，提升了模型的生成效果。根据腾讯技术报告，混元文生图模型的效果远超开源的Stable Diffusion模型，是目前效果最好的开源文生图模型。

腾讯混元文生图大模型的开源行为被认为是一个积极的信号，有助于推动技术发展和应用。开源后，该模型已在Hugging Face平台及Github上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。

此次开源被视为腾讯加入开源阵营的一个重要步骤。在大模型行业关于开源与闭源的争议中，腾讯选择了开放的模式。开源策略有助于抢占市场先机、优化模型和加速产品创新。未来，腾讯是否会推动大模型的进一步开源还有待观察。然而，混元文生图大模型的开源至少表明了腾讯在技术实力和开放合作方面的意愿。

原文和模型

【原文链接】 阅读原文 [ 3479字 | 14分钟 ]
【原文作者】 硅星GenAI
【摘要模型】 glm-4
【摘要评分】 ★★★★☆

智谱AI

智谱AI是一家国内的AI大模型...

# AIGC动态 # AI大模型 # 图像生成 # 中文生成 # 市场策略 # 技术进步 # 混元模型 # 腾讯开源

文章版权归作者所有，未经允许请勿转载。

ChatGPT「秘方」竟在拖LLM后腿？Karpathy、LeCun联手开怼RLHF！

新智元

3,498

智能驾驶的「GPT 时刻」，怎么就被特斯拉搞出来了？

极客公园

3,851

苹果“廉价版”MacBook 曝光：A18 Pro 芯片登场，入门价或低于 5000 元

硅星人Pro

958

大模型预测，下一个token何必是文字？

量子位

3,821

抱歉，今年我劝各位真的别轻易离职

AI大模型实验室

4,087

对话潞晨科技尤洋：如何把大模型价格“打”下来？

硅星人Pro

3,835

暂无评论

暂无评论...

腾讯研发了快一年的混元文生图模型，说开源就开源了？

文章摘要

原文和模型

阿里向左，腾讯向右？

联发科牵手英伟达，AI PC变天了？！

相关文章

暂无评论

热门网址

热门文章

腾讯研发了快一年的混元文生图模型，说开源就开源了？

文章摘要

原文和模型

阿里向左，腾讯向右？

联发科牵手英伟达，AI PC变天了？！

相关文章

暂无评论

AstronClaw-安全养虾

LibTV-AI视频创作

讯飞AI大学堂

热门网址

热门文章