qwen-image-2.0 在「里外关系」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:qwen-image-2.0
- 用例名称:里外关系
- 测试类型:图像生成
- 评测维度:空间关系
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张图片:一只小猫坐在纸箱里面 要求: - 猫明确在纸箱内部 - 可以看到猫的头部露出来 - 温馨可爱的风格
任务要求
AI 模型需要满足以下要求:
- 画面中必须包含一只猫和一个纸箱,猫明确位于纸箱内部,纸箱四壁对猫的身体形成自然遮挡,空间包含关系清晰无歧义
- 猫的头部(含耳朵、五官)须从纸箱箱口清晰露出,体现"头部可见、身体在箱内"的经典姿态
- 猫与纸箱的比例关系合理,纸箱大小能够容纳猫的身体,不出现猫远大于纸箱或纸箱过大导致猫完全隐没的情况
- 整体画面呈现温馨可爱风格,色调柔和,造型圆润,氛围治愈
评测结果
综合得分
该模型在此用例的得分为:87.7 分(满分 100 分),已通过
基础难度评测结果
- 得分:87.7 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中是一幅采用水彩画风格创作的温馨作品,背景为干净的米白色。画面中心是一只拥有橘色条纹的小猫,它正从一个浅褐色的瓦楞纸箱里探出头来。小猫有着一对大而明亮的绿色眼睛,眼神显得有些好奇和无辜,粉嫩的小鼻子下方露出一丝腼腆的表情。它的胡须细长且向两侧舒展,毛发质感细腻,笔触柔和。纸箱的边缘呈现出水彩特有的晕染效果,模拟了纸板的纹理。在 AI 生成的细节方面,可以观察到一些逻辑上的小瑕疵:纸箱左侧翻开的盖子与箱体连接处透视略显生硬,且小猫右侧的胡须似乎直接从纸箱边缘延伸出来,与面部的连接不够自然。此外,纸箱内部的阴影处理较为简单,缺乏深度的空间感,但整体构图和谐,色彩温暖。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张高质量的AI生成水彩插画,完整且准确地实现了提示词的全部要求。猫明确位于纸箱内部,头部清晰露出,空间包含关系逻辑严谨;水彩风格温馨可爱,色调柔和,氛围治愈。画面细节丰富,猫的五官和毛发纹理刻画精细,纸箱质感真实。唯一轻微不足是猫头与箱口比例略显紧凑,但这不影响整体的高完成度。综合来看,该图像几乎完美地完成了提示词的所有要求,属于优秀级别的生成结果。 【GEMINI】这是一张视觉表现力极佳的插画,但在核心的「空间包含逻辑」上存在 AI 常见的穿透错误。猫的头部虽然露出了,但由于胡须的遮挡关系错误以及纸箱边缘线条的断裂,使得「在纸箱内部」这一物理事实在局部显得不够严谨。不过,作为一张强调风格的可爱作品,其艺术感染力掩盖了部分结构缺陷。 【KIMI】这是一张『看起来可爱但经不起推敲』的AI图像。它成功欺骗了第一眼观感,却在空间逻辑的严谨性上暴露问题。核心矛盾在于:提示词要求『猫坐在纸箱里面』,但图像仅呈现了『猫的头部在箱口』——身体的存在是推断而非看见。对于测试『包含关系』的任务而言,这种『暗示而非呈现』的处理方式是不合格的。风格执行优秀,但空间叙事存在偷懒嫌疑。
进阶难度评测结果
- 得分:88.0 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一个从高处俯拍的室内场景,五名穿着商务休闲装的男女围坐在一张浅色木质圆桌旁,似乎正在进行商务午餐或会议。背景是灰色的水泥地面,整体色调明亮且偏冷。画面中包含三名男性和两名女性,他们身穿蓝色衬衫、灰色上衣等职业服装,每人面前都摆放着一个白色空盘子和一杯水。 然而,这张图片存在多处明显的 AI 生成缺陷。首先,人物的手部结构严重畸形,例如右下方男性的右手手指数量异常且扭曲,左上方女性握杯子的手部线条模糊。其次,桌上的餐具分布逻辑混乱,盘子和水杯的透视关系不自然。最严重的缺陷在于人物的身体连接:左下方男性的左臂似乎直接消失在桌子边缘,而右上方男性的身体比例与座椅的衔接显得非常生硬。此外,部分人物的面部五官模糊不清,缺乏真实的纹理细节。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像较好地完成了提示词的核心要求:五人围坐圆桌、俯视角度、人物均可见、包含关系正确。五人分布基本均匀,视角选取准确,人物数量精确。主要瑕疵在于左侧两人间距略小,导致圆桌周围人物分布不完全均等,但整体仍属高质量完成。 【GEMINI】这张图片在视角和人数控制上表现出色,完全符合俯视五人围坐的设定。然而,作为核心要求的「均匀分布」完成度较差,人物在圆桌周围的物理间距疏密不一,且局部肢体细节(手部)存在明显的 AI 生成痕迹,导致空间布局的专业感打折。 【KIMI】该图像基本完成了提示词的所有核心要求:五人均匀围坐圆桌、俯视视角、全员可见。整体质量达到商业图库标准,空间布局逻辑严谨,无明显AI生成瑕疵。主要扣分项集中于构图的绝对精确性(中心偏移)和可见性的完全性(脚部遮挡),均属吹毛求疵级别的细节,不影响主体功能表达。
困难难度评测结果
- 得分:68.2 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一个精致的水晶球雪花球,球体内部是一个充满冬日气息的微缩世界。画面中心是一座由白色冰砖砌成的圆顶冰屋,屋顶覆盖着厚厚的积雪,左上方还有一个小烟囱。冰屋正门敞开,内部有一张深色木桌,桌上站着一个戴着黑色礼帽、围着红色围巾的小雪人。冰屋右侧有一扇带有蓝色边框的小窗户。整个水晶球坐落在深色的木质底座上,背景是柔和的浅蓝色虚化光影,营造出宁静、寒冷而温馨的氛围。 画面中存在明显的 AI 生成缺陷:冰屋的结构逻辑不一致,左侧烟囱的底部与屋顶结合处显得生硬且透视略有扭曲;冰屋右侧的蓝色窗户看起来像是直接贴在冰砖表面,缺乏真实的深度感和结构支撑;此外,冰屋内部的木桌比例较小,且桌腿与地面的衔接处模糊不清,缺乏重力感。这些细节揭示了图像并非真实拍摄。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】图像整体视觉质量较高,玻璃球质感和雪屋细节均属上乘。四个主体元素均已出现,但核心嵌套逻辑存在明显偏差——提示词要求「透过窗户看到桌子和雪人」,而图像将雪人/桌子置于拱门入口处,窗户则是独立的不透明装饰元素,导致第三、四层嵌套关系未能通过「窗户透视」实现。这是对提示词核心要求的理解偏差,使得俄罗斯套娃式的逐层嵌套叙事逻辑不够完整。 【GEMINI】这张图片在视觉质感上表现优秀,但在执行复杂的「空间嵌套逻辑」时出现了明显偏差。模型未能理解「透过窗户观察内部」这一关键指令,而是选择了最简单的「放在门口」的布局方式,导致四层嵌套的叙事逻辑断裂。窗户作为提示词强调的视觉通道,在图中仅作为装饰存在,严重影响了任务的完成度。 【KIMI】这是一张「看起来精致但内核失败」的AI图像。它用圣诞雪景球的常见套路替代了提示词明确要求的「俄罗斯套娃嵌套」结构,以「门洞直视」偷换「窗户透视」的核心空间逻辑。右侧窗户的无效存在暴露了模型对「透过窗户可见」这一关键指令的理解障碍——它知道要有窗户,却不知道窗户是用来看的。若将右侧窗户改为可透视,或明确将门洞定义为窗户,评分可提升15-20分;当前状态属于「用美观逃避要求」的典型AI生成缺陷。
相关链接
您可以通过以下链接查看更多相关内容: