阿里最强“PS模子”开源!一手体验,0元P出氛围感合影
智东西
智东西12月24日报说念,当天,阿里Qwen团队认真开源图像剪辑模子Qwen-Image-Edit-2511,这是继9月23日发布Qwen-Image-Edit-2509后的最新增强版块。

在此前的多个公开基准测试中,Qwen-Image系列已展现出较强的图像剪辑性能,共获取12项SOTA(最好弘扬)。在汉文翰墨生成评测ChineseWord与LongText-Bench等分歧最初GPT Image 1、Seedream 3.0等主流模子。
新版块则聚焦图像生成过程中的东说念主物一致性问题,在单东说念主连拍、多东说念主物交融等任务中显赫普及面部特征与派头的纷乱性,同期集成了多个LoRA子模子,增强了图像剪辑中的几何构造、光照收敛、材质替换等才气。

智东西也在第一时分进行了实测。合座来看,Qwen-Image-Edit-2511在东说念主像交融、LoRA光照收敛、派头一致性方面弘扬出色,生成收尾当然。但在镜头旋转、空间构图与几何推理类操作上仍存在较着流弊。
Hugging Face:https://huggingface.co/Qwen/Qwen-Image-Edit-2511
魔搭社区:https://www.modelscope.cn/models/Qwen/Qwen-Image-Edit-2511
时代阐明:https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen-Image/Qwen_Image.pdf
一、新版块聚焦东说念主物一致性与派头移动,拓展多场景图像剪辑才气在此前版块的Qwen-Image中,Qwen团队初次构建了齐全的图像生成与剪辑框架,通过Qwen2.5-VL+VAE双编码机制配合MMDiT扩散架构,其中“MM”代表的是模子生成图像、文本等多模态内容的才气,“DiT”则代表了这是一个扩散Transformer。
Qwen团队在多个公开基准上对Qwen-Image进行了评估,比较对象为众人头部的开源、闭源图像生成模子。在通用图像生成测试GenEval、DPG和OneIG-Bench,以及图像剪辑测试GEdit、ImgEdit和GSO上,Qwen-lmage卓越了Flux.1、BAGEL等开源模子、字节越过的SeedDream 3.0和OpenAI的GPT Image 1(High)。
在用于文本渲染的LongText-Bench、ChineseWord和TextCraft基准测试上的收尾标明,Qwen-Image在文本渲染方面弘扬尤为出色,相配是在汉文文本渲染上,大幅最初现存的开始进模子,包括SeedDream 3.0和GPT Image 1(High)。
这次发布的Qwen-Image-Edit-2511版块,则在图像剪辑阶段进一步增强了东说念主物一致性抒发才气,并引入LoRA模块普及光照、材质与视角收敛弘扬。
Qwen-Image-Edit-2511在保握东说念主物一致性方面作念出了要点升级。针对输入东说念主像生成的多张变体图像,模子在看法、发型、配饰等细节上的保留愈加纷乱,适用于多心绪、多姿态、多派头等需要变装连贯输出的场景。

除了单东说念主任务,Qwen-Image-Edit-2511还显赫优化了多东说念主图像交融弘扬。比较此前版块,它不错更当然地将两张不同东说念主像合成为并吞张合影图像,保留东说念主物原貌的同期,自动拯救姿态与构图,生成收尾在合座派头与变安设合性上更为连贯。这为AI情侣照、群像图等掌握提供了更高质料的基础。

▲Qwen官有狡计例
同期,Qwen-Image-Edit-2511初次在基础模子中内置了部分高频使用的LoRA子模子。用户无需加载外部权重,即可径直启用如光照增强、新视角生成、材质替换等功能。
举例,用户可通过LoRA收敛当然光辉地方变化,重现柔光照明恶果,也不错在工业设想场景中完成木料纹理或布料派头的替换操作。
在结构认知方面,该版块还加入了几何构造提拔才气,支握在输入图像的基础上添加提拔线、延伸线等几何元素,适用于训诲、工程图生成或图像标注任务。
二、实测:东说念主物交融纷乱、派头收敛可用,但细密收敛仍有界限在实质体验中,咱们围绕东说念主物一致性、LoRA光照、材质替换、翰墨渲染以及几何推理等才气,对Qwen-Image-Edit-2511进行了多组测试。
合座来看,模子在东说念主物类合成与派头抒发方面弘扬纷乱,输出收尾具备较高可用性,但在镜头级收敛与几何逻辑践诺上仍存在一定局限。
案例1:情侣写照合影(东说念主物一致性与互动姿态测试)
4:3,韩系情侣写照派头,配景为纯色暖调低富余暗绿色磨砂质感墙面,正面柔光打光,东说念主物面部酿成祥和暗影过渡。一双年青东亚情侣,女性东说念主脸参考第一张图,长头发妆容风雅带项链耳饰,米白色露肩上衣;男性东说念主脸参考第二张图,发型不变,玄色短袖。东说念主物姿态互动感强(脸贴脸),心绪灵动俏皮含笑,男生搞怪屈身,女生搞怪可儿笑眯眯,合座甜酷亲昵,胶片派头带颗粒感柔光暖调,郑重互动细节与衣饰质感。原比例。

▲参考图
生成收尾中,两位东说念主物的面部特征与细节保握风雅一致性,互动姿态当然,光影恰当写照派头,合座恶果纷乱且可用。

▲Qwen-Image-Edit-2511生成恶果图
案例2:双东说念主俯拍自拍(高角度合成与东说念主物一致性测试)
请将图1和图2交融成一张双东说念主俯拍自拍照,画面构图紧凑,两位主体靠得很近,头部稍许上仰,看法直视镜头,营造出激烈的视觉冲击力。左侧东说念主物站得略靠前,参考我图1的主体形象特征造型保握不变,需要保握东说念主脸相同度;右侧东说念主物参考图2的主体形象特征保握造型不变,需要保握东说念主脸相同度,稍许内扣体魄,拍摄角度为高角度俯拍,使头部比例被夸张放大,恰当典型的日韩视觉自拍派头。配景为纯白色,毁坏干净,进一步突显东说念主物主体。画面派头偏向日系视觉系,合座画面显豁度高,用iphone前置自拍,最终呈现出风雅、前锋、略带的合影恶果。条目东说念主物结束无缝融进画面,视觉过渡当然,合座画面光辉亮堂且均匀。
合成收尾中,两位东说念主物在高角度俯拍构图下保握了较高的东说念主脸相同度,自拍派头配置,配景干净,合座恶果弘扬风雅。

▲Qwen-Image-Edit-2511生成恶果图
案例3:软光LoRA与镜头收敛(光照重构与视角操作测试)
对上传的室内家居图进行再行打光,加入祥和光辉、侧面光照恶果,杰出空间质感,合座光辉要当然不外曝。

▲参考图
在该任务中,该模子顺利完成柔光再行照明,侧光端倪当然,合座光辉收敛纷乱。

▲Qwen-Image-Edit-2511生成恶果图
将镜头移至桌面特写
生成收尾中,镜头确乎发生变化,但桌面羊毫数目与书册掀开现象与原图存在偏差,结构并不够严格。

▲Qwen-Image-Edit-2511生成恶果图
将镜头向左旋转60度
该辅导未能被有用践诺,画面视角未出现较着旋转变化,该模子在精准镜头收敛方面仍有功令。

▲Qwen-Image-Edit-2511生成恶果图
案例4:材质替换(工业设想场景测试)
将产物图片中桌面与椅子的木质纹理替换为另一张图中的淡色松木料质,保握结构不变,仅替换材质贴图。

▲参考图
生成收尾中,桌椅合座结构保握纷乱,木质纹理替换当然贴合,不雅感长入。

▲Qwen-Image-Edit-2511生成恶果图
案例5:翰墨渲染与派头交融(中英文翰墨测试)
生成竖版3:4画面比例的“真东说念主与其对应卡通壁画合影”场景图像:将上传的竟然东说念主物相片以原样保留服装、发型、妆容置于画面左侧/前哨,拯救东说念主物的动作和拍摄视角,以确保画面协调。在真东说念主背后墙面绘图1:1对应卡通壁画,厚涂质感且选拔动漫派头大眼、祥和轮廓五官,齐全复刻发型、服装及配饰细节如耳饰、项链等,颜色富余度高并带有涂鸦式笔触恶果。墙面添加彩色涂鸦爱心、笑容图案元素,大地点缀飞溅心绪装潢细节,壁画区域融入如“2026新年稳固”的中翰墨元素,字体派头契合涂鸦好意思学。确保真东说念主与壁画比例、角度当然衔尾,光照地方长入恰当场景逻辑,保握合座颜色派头一致呈现无邪、连贯且视觉协调恶果。

▲参考图
生成收尾中,真东说念主与卡通壁画在派头和镜头方进取衔尾当然,汉文翰墨“2026新年稳固”渲染显豁。

▲Qwen-Image-Edit-2511生成恶果图
然后,把翰墨部分换成如“Merry Christmas”的英文元素和“圣诞稳固”的中翰墨元素中英文夹杂的翰墨。
在中英文混面子景下,模子依然或者正确生成翰墨内容,派头与画面保握一致,翰墨渲染纷乱,未出现较着错字。

▲Qwen-Image-Edit-2511生成恶果图
案例6:几何推理(提拔构造才气测试)
过A作$DE$的垂线,延伸$ED$交于G。

▲参考图(左)与Qwen-Image-Edit-2511生成恶果图(右)
该任务中模子生成的几何关连存在较着作假,垂线与交点位置不恰当条目,其几何推理才气尚不及以支握严谨的数学或工程制图任务。
三、内置LoRA模子增强实用性,笼罩光照、视角与工业材质替换在Qwen-Image-Edit-2511中,官方初次将部分社区高频使用的LoRA子模子径直内置于基础模子中,用户无需加载异常权重即可调用对应才气。这一机制显赫缩小了LoRA功能的使用门槛,也普及了模子在专科掌握场景下的实用性。
举例,在图像风立场控任务中,用户可通过光照增强LoRA收敛当然光辉的角度、强度与地方,生成具有竟然光影端倪的画面恶果。面前版块已可结束“柔光—侧光”等典型照明派头的生成。

在视角调控方面,用户还可调用新视角LoRA,径直以并吞主体为基准生成不同拍摄角度下的图像,可减少重叠拍摄与东说念主工拯救角度所需本钱。

此外,在工业设想任务中,LoRA机制也可被用于批量图像生成、元素篡改与材质替换经由中。这类才气已初步具备在产品草图阶段进行测试的后劲。

详细来看,内置LoRA的集成设想普及了Qwen-Image-Edit-2511在具体任务中的可用性,尤其在光照收敛、材质替换、多视角生成等高频需求中展现出更高的商用适配性,为设想、营销、内容生成等场景提供了更低本钱的图像责罚有狡计。
结语:国产开源模子朝商用化迈进了一步详细来看,Qwen-Image-Edit-2511在东说念主物一致性、多东说念主物合成与LoRA派头收敛方面展现出纷乱弘扬,实用性比前一版块有较着进步。关于需要连贯变装形象输出、收敛局部派头移动、进行材质替换等图像生成任务的用户来说,它仍是具备一定的落地才气。
不外,在镜头变换、构图拯救、几何推理等触及空间认知与强逻辑践诺的任务中,模子仍存在纷乱性与精度上的短板,与面前顶尖的多模态生成模子比较,仍有一定差距。
算作一款面向开源社区的图像剪辑模子,Qwen-Image-Edit-2511正将模子才气朝向可控性与商用型场景聚焦,这也为国内开源阶梯提供了一个新的样本。