刚刚，龙虾学会画画了！阿里甩出Wan2.7生图王牌，捏脸精确到骨相

74 0 0

文章摘要

Wan2.7-Image是阿里最新推出的多功能图像生成模型，旨在解决AI绘图中长期存在的“千人一面”“色彩盲盒”“文本崩溃”“编辑失准”及“多图失形”五大痛点。该模型以“生成+编辑一体化”为核心设计，实现从底层架构到应用体验的深度革新。

在人物生成层面，Wan2.7-Image首次将建模粒度下探至“骨相”与“皮相”层级，支持按脸型（鹅蛋、圆、方等）、眼型（杏仁、丹凤、眯缝）等微观特征进行精准控制，使同一提示词下生成的多人像在主体特征上高度一致，彻底告别“塑料脸”。“千人千面，尽在一语之间”，其本质在于不完美却真实的“活人感”塑造。

色彩控制上，模型首创“调色盘”功能，允许用户通过HEX色号或上传参考图提取颜色比例，实现对配色方案的绝对掌控。用户能将梵高《星月夜》的蓝黄撞色、莫奈《日出·印象》的蓝灰暖橙精准迁移至现代城市景观或江南水乡场景中，确保视觉风格高度一致。 该能力显著提升了设计师和品牌方在合规性要求下的效率。

超长文本渲染是另一项关键突破。模型支持3K tokens输入量，可完整呈现A4纸排版的高等数学试卷、古文诗词卡片乃至含公式图表的学术论文页面，字符识别与排版精度达到印刷级标准。面对包含ε-δ语言、积分符号、中英文混排的复杂段落，系统无一错漏、无一行断裂，彻底终结AI图像生成的“文盲”时代。

交互式编辑模块采用“精准框”技术，可在指定区域执行移动、替换、消除等操作，同时保持其余画面内容不变，避免了传统工具中常见的“牵连修改”问题。例如框选大雁并指示其迁至屋檐位置，模型自动调整尺寸与透视，姿态由飞翔切换为栖息，过渡自然流畅，实现了真正的“指哪打哪”。

在多主体一致性方面，支持最多9张参考图同步注入，保证多个角色或物体在风格、光影、姿态上高度统一，有效支撑电商场景中单模特多环境复用；更可输出最多12张逻辑连贯的图像序列，形成故事化分镜流程。八帧连续电影分镜案例验证了其在时序结构稳定性上的优异表现。

技术底座则建立于三重演进之上：超大规模异构数据增强理解力，统一生成与理解架构实现文字—画面无缝映射，结合多模态指令训练与精细标注体系推动语义认知跃升。同时提供Pro版本强化构图与语义准确性。

此外，Wan2.7-Image已作为Skills接入OpenClaw平台，用户仅需三步即可完成接入：安装插件、配置API密钥、启用对话生图模式，使生成过程深度嵌入既有工作流，扮演“随叫随到的设计师”角色。这意味着创作的控制权真正回归创作者手中——从随机抽卡转向精准操控，从批量同质走向个性表达。目前用户可通过万相网页端、wan.video官网及阿里云百炼平台试用该模型，相关能力亦即将在千问App落地。