文章摘要
【关 键 词】 扩散模型、端侧推理、图像生成、轻量架构、开源模型
字节技术团队近期开源的DreamLite模型是一款参数量仅0.39B的统一设备端扩散架构。该核心设计首次在单一轻量化模型中同时承载文本到图像生成与文本引导的图像编辑任务,有效规避了部署多套独立系统的算力损耗。依托端侧推理特性,该方案完全摆脱了对云端服务器或高性能电脑显卡的依赖,使常规智能手机具备了处理高分辨率视觉内容的实时计算潜力。
针对小规模参数训练中的稳定性难题,研发侧构建了专用网络骨架与递进式优化路径。模型底层基于经剪枝处理的移动端U-Net结构,并通过上下文空间连接机制在潜在向量域内完成多源条件的深度融合。训练过程遵循任务渐进式预训练方案,按照文本生成、独立编辑到混合联合的序列分阶段收敛。结合Qwen3-VL文本嵌入组件、监督微调与强化学习环节,并借助步数蒸馏技术将完整推理流程压缩至四步,显著降低了移动端运行的内存与时间开销。
基准测评数据证实,DreamLite在主流视觉质量与对齐度测试中已与Flux及LongCat-Image等头部开源方案处于同一梯队,且在典型移动平台耗时约三秒即可输出一千零二十四分辨率的完整图像。为覆盖差异化的硬件算力环境,技术方同步释出两类参数配置版本,便于使用者在渲染保真度与端侧延迟之间获取精确权衡。鉴于模型分发的合规要求,当前权重正接受安全审查,试用权限需通过官方邮箱递交机构背景与具体应用规划进行审批。
在技术开放与风险管控层面,运营主体确立了清晰的合规边界。模型使用协议明确限定禁止利用该工具制作或散播任何涉黄、暴恐、偏见及违反法律法规的视觉素材,彻底封禁商业欺诈或恶意攻击等不当用途。该端侧多任务统一管线为高频移动端创作提供了零门槛、快响应的基础支撑,相关体验名额正依序对接具备合规使用预期的开发者群体。
原文和模型
【原文链接】 阅读原文 [ 688字 | 3分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 qwen3.6-plus-2026-04-02
【摘要评分】 ★☆☆☆☆



