刚刚,龙虾学会画画了!阿里甩出Wan2.7生图王牌,捏脸精确到骨相

AIGC动态2小时前发布 AIera
74 0 0
刚刚,龙虾学会画画了!阿里甩出Wan2.7生图王牌,捏脸精确到骨相

 

文章摘要


【关 键 词】 捏脸骨相调色精准长文渲染交互编辑多图统一

Wan2.7-Image是阿里最新推出的多功能图像生成模型,旨在解决AI绘图中长期存在的“千人一面”“色彩盲盒”“文本崩溃”“编辑失准”及“多图失形”五大痛点。该模型以“生成+编辑一体化”为核心设计,实现从底层架构到应用体验的深度革新。

在人物生成层面,Wan2.7-Image首次将建模粒度下探至“骨相”与“皮相”层级,支持按脸型(鹅蛋、圆、方等)、眼型(杏仁、丹凤、眯缝)等微观特征进行精准控制,使同一提示词下生成的多人像在主体特征上高度一致,彻底告别“塑料脸”。“千人千面,尽在一语之间”,其本质在于不完美却真实的“活人感”塑造。

色彩控制上,模型首创“调色盘”功能,允许用户通过HEX色号或上传参考图提取颜色比例,实现对配色方案的绝对掌控。用户能将梵高《星月夜》的蓝黄撞色、莫奈《日出·印象》的蓝灰暖橙精准迁移至现代城市景观或江南水乡场景中,确保视觉风格高度一致。 该能力显著提升了设计师和品牌方在合规性要求下的效率。

超长文本渲染是另一项关键突破。模型支持3K tokens输入量,可完整呈现A4纸排版的高等数学试卷、古文诗词卡片乃至含公式图表的学术论文页面,字符识别与排版精度达到印刷级标准。面对包含ε-δ语言、积分符号、中英文混排的复杂段落,系统无一错漏、无一行断裂,彻底终结AI图像生成的“文盲”时代。

交互式编辑模块采用“精准框”技术,可在指定区域执行移动、替换、消除等操作,同时保持其余画面内容不变,避免了传统工具中常见的“牵连修改”问题。例如框选大雁并指示其迁至屋檐位置,模型自动调整尺寸与透视,姿态由飞翔切换为栖息,过渡自然流畅,实现了真正的“指哪打哪”。

在多主体一致性方面,支持最多9张参考图同步注入,保证多个角色或物体在风格、光影、姿态上高度统一,有效支撑电商场景中单模特多环境复用;更可输出最多12张逻辑连贯的图像序列,形成故事化分镜流程。八帧连续电影分镜案例验证了其在时序结构稳定性上的优异表现。

技术底座则建立于三重演进之上:超大规模异构数据增强理解力,统一生成与理解架构实现文字—画面无缝映射,结合多模态指令训练与精细标注体系推动语义认知跃升。同时提供Pro版本强化构图与语义准确性。

此外,Wan2.7-Image已作为Skills接入OpenClaw平台,用户仅需三步即可完成接入:安装插件、配置API密钥、启用对话生图模式,使生成过程深度嵌入既有工作流,扮演“随叫随到的设计师”角色。这意味着创作的控制权真正回归创作者手中——从随机抽卡转向精准操控,从批量同质走向个性表达。 目前用户可通过万相网页端、wan.video官网及阿里云百炼平台试用该模型,相关能力亦即将在千问App落地。

原文和模型


【原文链接】 阅读原文 [ 5170字 | 21分钟 ]
【原文作者】 新智元
【摘要模型】 qwen3-vl-flash-2026-01-22
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...