实测千问 App 生图、生视频功能：国产实用主义的突围

591 0 0

文章摘要

阿里近期在千问APP中接入了国内领先的AI生视频模型Wan 2.5和开源生图模型Qwen-Image 2511，并开放免费不限次使用，大幅降低了用户的使用门槛。Wan 2.5专注于10秒内音画同步和细节还原，实现了与国际主流视频模型如Sora、Veo3的差距缩小。通过多项测试发现，该模型在复杂场景中能精准实现人物对话的口型同步、动作匹配，并保持环境元素的一致性。在电影级写实测试中，视频不仅呈现细腻的逆光效果和自然的人物动态，还自动生成了与画面匹配的环境音效，展现出超越常规AI视频的质感。

Qwen-Image 2511则解决了AI生图领域的两大核心痛点：在多轮生成中保持人物/动物特征稳定性，以及精准呈现中文文字和复杂商用场景。测试显示，模型能根据同一只猫的照片连续生成穿裙子、推花瓶等不同动作的图片，且面部特征完全一致；在电商海报生成中，不仅正确渲染了”无谷狗粮”等中文标题，还还原了宠物毛发、食品颗粒等细节，可直接用于商业场景。其支持的局部修改、比例调整等功能，进一步提升了生产级应用的效率。

此次升级标志着阿里将B端多模态技术向C端落地的重要尝试。不同于国际模型追求技术参数极限，Wan 2.5通过RLHF强化学习优化用户关注的画面质感和指令匹配度；Qwen-Image 2511则针对中文用户和中小商家的实际需求，在文字渲染、商用适配等方面建立差异化优势。免费策略的推行，不仅降低了创作门槛，更可能重塑AI工具生态——当专业级技术成为人人可用的基础服务时，国产模型正通过实用主义路径实现从实验室到日常生活的跨越。这种”技术下沉”模式，或将为AI普惠提供新的范本。