qwen-image-2.0 在「里外关系」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：qwen-image-2.0
用例名称：里外关系
测试类型：图像生成
评测维度：空间关系

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一张图片：一只小猫坐在纸箱里面要求： - 猫明确在纸箱内部 - 可以看到猫的头部露出来 - 温馨可爱的风格

任务要求

AI 模型需要满足以下要求：

画面中必须包含一只猫和一个纸箱，猫明确位于纸箱内部，纸箱四壁对猫的身体形成自然遮挡，空间包含关系清晰无歧义
猫的头部（含耳朵、五官）须从纸箱箱口清晰露出，体现"头部可见、身体在箱内"的经典姿态
猫与纸箱的比例关系合理，纸箱大小能够容纳猫的身体，不出现猫远大于纸箱或纸箱过大导致猫完全隐没的情况
整体画面呈现温馨可爱风格，色调柔和，造型圆润，氛围治愈

评测结果

综合得分

该模型在此用例的得分为：87.7 分（满分 100 分），已通过

基础难度评测结果

得分：87.7 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中是一幅采用水彩画风格创作的温馨作品，背景为干净的米白色。画面中心是一只拥有橘色条纹的小猫，它正从一个浅褐色的瓦楞纸箱里探出头来。小猫有着一对大而明亮的绿色眼睛，眼神显得有些好奇和无辜，粉嫩的小鼻子下方露出一丝腼腆的表情。它的胡须细长且向两侧舒展，毛发质感细腻，笔触柔和。纸箱的边缘呈现出水彩特有的晕染效果，模拟了纸板的纹理。在 AI 生成的细节方面，可以观察到一些逻辑上的小瑕疵：纸箱左侧翻开的盖子与箱体连接处透视略显生硬，且小猫右侧的胡须似乎直接从纸箱边缘延伸出来，与面部的连接不够自然。此外，纸箱内部的阴影处理较为简单，缺乏深度的空间感，但整体构图和谐，色彩温暖。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这是一张高质量的AI生成水彩插画，完整且准确地实现了提示词的全部要求。猫明确位于纸箱内部，头部清晰露出，空间包含关系逻辑严谨；水彩风格温馨可爱，色调柔和，氛围治愈。画面细节丰富，猫的五官和毛发纹理刻画精细，纸箱质感真实。唯一轻微不足是猫头与箱口比例略显紧凑，但这不影响整体的高完成度。综合来看，该图像几乎完美地完成了提示词的所有要求，属于优秀级别的生成结果。【GEMINI】这是一张视觉表现力极佳的插画，但在核心的「空间包含逻辑」上存在 AI 常见的穿透错误。猫的头部虽然露出了，但由于胡须的遮挡关系错误以及纸箱边缘线条的断裂，使得「在纸箱内部」这一物理事实在局部显得不够严谨。不过，作为一张强调风格的可爱作品，其艺术感染力掩盖了部分结构缺陷。【KIMI】这是一张『看起来可爱但经不起推敲』的AI图像。它成功欺骗了第一眼观感，却在空间逻辑的严谨性上暴露问题。核心矛盾在于：提示词要求『猫坐在纸箱里面』，但图像仅呈现了『猫的头部在箱口』——身体的存在是推断而非看见。对于测试『包含关系』的任务而言，这种『暗示而非呈现』的处理方式是不合格的。风格执行优秀，但空间叙事存在偷懒嫌疑。

进阶难度评测结果

得分：88.0 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一个从高处俯拍的室内场景，五名穿着商务休闲装的男女围坐在一张浅色木质圆桌旁，似乎正在进行商务午餐或会议。背景是灰色的水泥地面，整体色调明亮且偏冷。画面中包含三名男性和两名女性，他们身穿蓝色衬衫、灰色上衣等职业服装，每人面前都摆放着一个白色空盘子和一杯水。然而，这张图片存在多处明显的 AI 生成缺陷。首先，人物的手部结构严重畸形，例如右下方男性的右手手指数量异常且扭曲，左上方女性握杯子的手部线条模糊。其次，桌上的餐具分布逻辑混乱，盘子和水杯的透视关系不自然。最严重的缺陷在于人物的身体连接：左下方男性的左臂似乎直接消失在桌子边缘，而右上方男性的身体比例与座椅的衔接显得非常生硬。此外，部分人物的面部五官模糊不清，缺乏真实的纹理细节。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像较好地完成了提示词的核心要求：五人围坐圆桌、俯视角度、人物均可见、包含关系正确。五人分布基本均匀，视角选取准确，人物数量精确。主要瑕疵在于左侧两人间距略小，导致圆桌周围人物分布不完全均等，但整体仍属高质量完成。【GEMINI】这张图片在视角和人数控制上表现出色，完全符合俯视五人围坐的设定。然而，作为核心要求的「均匀分布」完成度较差，人物在圆桌周围的物理间距疏密不一，且局部肢体细节（手部）存在明显的 AI 生成痕迹，导致空间布局的专业感打折。【KIMI】该图像基本完成了提示词的所有核心要求：五人均匀围坐圆桌、俯视视角、全员可见。整体质量达到商业图库标准，空间布局逻辑严谨，无明显AI生成瑕疵。主要扣分项集中于构图的绝对精确性（中心偏移）和可见性的完全性（脚部遮挡），均属吹毛求疵级别的细节，不影响主体功能表达。

困难难度评测结果

得分：68.2 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一个精致的水晶球雪花球，球体内部是一个充满冬日气息的微缩世界。画面中心是一座由白色冰砖砌成的圆顶冰屋，屋顶覆盖着厚厚的积雪，左上方还有一个小烟囱。冰屋正门敞开，内部有一张深色木桌，桌上站着一个戴着黑色礼帽、围着红色围巾的小雪人。冰屋右侧有一扇带有蓝色边框的小窗户。整个水晶球坐落在深色的木质底座上，背景是柔和的浅蓝色虚化光影，营造出宁静、寒冷而温馨的氛围。画面中存在明显的 AI 生成缺陷：冰屋的结构逻辑不一致，左侧烟囱的底部与屋顶结合处显得生硬且透视略有扭曲；冰屋右侧的蓝色窗户看起来像是直接贴在冰砖表面，缺乏真实的深度感和结构支撑；此外，冰屋内部的木桌比例较小，且桌腿与地面的衔接处模糊不清，缺乏重力感。这些细节揭示了图像并非真实拍摄。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】图像整体视觉质量较高，玻璃球质感和雪屋细节均属上乘。四个主体元素均已出现，但核心嵌套逻辑存在明显偏差——提示词要求「透过窗户看到桌子和雪人」，而图像将雪人/桌子置于拱门入口处，窗户则是独立的不透明装饰元素，导致第三、四层嵌套关系未能通过「窗户透视」实现。这是对提示词核心要求的理解偏差，使得俄罗斯套娃式的逐层嵌套叙事逻辑不够完整。【GEMINI】这张图片在视觉质感上表现优秀，但在执行复杂的「空间嵌套逻辑」时出现了明显偏差。模型未能理解「透过窗户观察内部」这一关键指令，而是选择了最简单的「放在门口」的布局方式，导致四层嵌套的叙事逻辑断裂。窗户作为提示词强调的视觉通道，在图中仅作为装饰存在，严重影响了任务的完成度。【KIMI】这是一张「看起来精致但内核失败」的AI图像。它用圣诞雪景球的常见套路替代了提示词明确要求的「俄罗斯套娃嵌套」结构，以「门洞直视」偷换「窗户透视」的核心空间逻辑。右侧窗户的无效存在暴露了模型对「透过窗户可见」这一关键指令的理解障碍——它知道要有窗户，却不知道窗户是用来看的。若将右侧窗户改为可透视，或明确将门洞定义为窗户，评分可提升15-20分；当前状态属于「用美观逃避要求」的典型AI生成缺陷。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

进阶难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

困难难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

相关链接

反馈评测问题