实测千问 App 生图、生视频功能:国产实用主义的突围

AIGC动态48分钟前发布 geekpark
42 0 0
实测千问 App 生图、生视频功能:国产实用主义的突围

 

文章摘要


【关 键 词】 AI视频生图工具多模态AI技术测评免费功能

阿里近期在千问APP中接入了国内领先的AI生视频模型Wan 2.5和开源生图模型Qwen-Image 2511,并开放免费不限次使用,大幅降低了用户的使用门槛。Wan 2.5专注于10秒内音画同步和细节还原,实现了与国际主流视频模型如Sora、Veo3的差距缩小。通过多项测试发现,该模型在复杂场景中能精准实现人物对话的口型同步、动作匹配,并保持环境元素的一致性。在电影级写实测试中,视频不仅呈现细腻的逆光效果和自然的人物动态,还自动生成了与画面匹配的环境音效,展现出超越常规AI视频的质感。

Qwen-Image 2511则解决了AI生图领域的两大核心痛点:在多轮生成中保持人物/动物特征稳定性,以及精准呈现中文文字和复杂商用场景。测试显示,模型能根据同一只猫的照片连续生成穿裙子、推花瓶等不同动作的图片,且面部特征完全一致;在电商海报生成中,不仅正确渲染了”无谷狗粮”等中文标题,还还原了宠物毛发、食品颗粒等细节,可直接用于商业场景。其支持的局部修改、比例调整等功能,进一步提升了生产级应用的效率。

此次升级标志着阿里将B端多模态技术向C端落地的重要尝试。不同于国际模型追求技术参数极限,Wan 2.5通过RLHF强化学习优化用户关注的画面质感和指令匹配度;Qwen-Image 2511则针对中文用户和中小商家的实际需求,在文字渲染、商用适配等方面建立差异化优势。免费策略的推行,不仅降低了创作门槛,更可能重塑AI工具生态——当专业级技术成为人人可用的基础服务时,国产模型正通过实用主义路径实现从实验室到日常生活的跨越。这种”技术下沉”模式,或将为AI普惠提供新的范本。

原文和模型


【原文链接】 阅读原文 [ 4016字 | 17分钟 ]
【原文作者】 极客公园
【摘要模型】 deepseek/deepseek-v3-0324
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

“讯飞星辰”

暂无评论

暂无评论...