混元生图 3.0 在「简单位置关系」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:混元生图 3.0
- 用例名称:简单位置关系
- 测试类型:图像生成
- 评测维度:空间关系
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张图片:一只红色的苹果放在蓝色盘子的上方(不是在盘子里面) 要求: - 苹果明确在盘子上方悬浮 - 颜色准确(红色苹果、蓝色盘子) - 背景简洁(白色或浅色)
任务要求
AI 模型需要满足以下要求:
- 苹果必须位于盘子正上方,且两者之间存在明显垂直间距(以观众视角为准,苹果底部与盘子上沿不接触),明确呈现"悬浮于上方"而非"放置于盘子内部"的视觉效果
- 苹果颜色为红色(允许自然高光,但主色调须为红色系),盘子颜色为蓝色(主色调须为蓝色系),两者颜色须具备足够饱和度以便清晰辨认
- 苹果与盘子的物体轮廓清晰可辨,形态符合常识(苹果呈圆润果实状,盘子呈圆形餐具状)
- 背景须为白色或浅色(浅灰、米白等),不得包含复杂场景元素,确保主体物体的颜色与空间关系不受背景干扰
评测结果
综合得分
该模型在此用例的得分为:92.7 分(满分 100 分),已通过
基础难度评测结果
- 得分:92.7 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一个极简主义风格的静物场景。画面的中心是一个鲜红色的成熟苹果,它正神奇地悬浮在一个明亮的蓝色陶瓷圆盘上方。背景是纯净的浅灰色或白色,光线柔和且均匀,从左上方照射过来,使苹果表面呈现出细腻的高光和零星的水滴感。构图简洁,色彩对比鲜明,红色的苹果与蓝色的盘子形成了强烈的视觉冲击。 然而,作为一张 AI 生成的图片,画面中存在明显的物理逻辑缺陷。最显著的问题是苹果在没有任何支撑物的情况下完全悬浮在空中,且盘子表面并没有映照出苹果应有的倒影或阴影,这违背了真实的物理透视规律。此外,盘子下方的阴影边缘略显生硬,与盘子边缘的衔接不够自然,苹果顶部的果柄细节也显得有些模糊。这些特征共同指向了这是一张由人工智能合成的超现实图像。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像高质量地完成了提示词的全部核心要求:苹果明确悬浮于蓝色盘子正上方且有清晰间距、颜色准确、背景简洁。空间位置关系的表达尤为出色,是对「上方悬浮」这一空间概念的精准视觉化。唯一微小瑕疵是苹果顶部黄绿色区域略大,但不影响整体评价。综合表现优秀,接近满分水准。 【GEMINI】这是一张高质量的 AI 生成图像,精准地执行了提示词中的空间位置要求。苹果悬浮在盘子上方,没有出现常见的重叠或穿模错误。色彩还原度高,构图简洁明快,达到了商业摄影中静物展示的专业水准。 【KIMI】该图像基本完美完成了提示词的所有核心要求:空间关系准确、颜色识别清晰、背景简洁。主要扣分点仅在于苹果表面材质表现略显理想化,缺乏真实摄影中果皮的微观纹理细节,但这属于超出提示词要求的审美层面问题。整体而言,这是一张高质量的AI生成图像,在测试「上下位置关系」这一核心任务上表现优秀。
进阶难度评测结果
- 得分:51.5 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展现了一个温馨静谧的室内角落。一张纹理清晰的棕色实木方桌靠在淡米色的墙边,桌面上整齐摆放着三组物品:中心是一个透明的竖条纹玻璃花瓶,里面插着一束盛开的深粉色雏菊,绿色的枝茎在水中清晰可见;左侧叠放着两本厚书,上方是一本黑色硬壳书,下方是一本米色旧书;右侧则是一套精致的白瓷茶杯与茶碟,杯身印有粉色玫瑰花图案。画面光线柔和,营造出一种午后休闲的氛围。 在 AI 生成的细节方面,存在一些明显的逻辑缺陷:首先,花瓶中雏菊的枝茎在水下的折射效果显得杂乱且不自然,部分茎干似乎在水中凭空消失或断裂;其次,左侧两本书的脊部纹理模糊,书页的厚度比例略显失调;最明显的异常在于茶杯,杯柄的连接处处理得不够平滑,且茶杯在茶碟上的投影方向与花瓶的阴影并不完全一致,透视感略显生硬。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】图像在已呈现的4个物体(桌子、花瓶、书、杯子)的位置关系上表现正确,但致命缺陷在于完全遗漏了「猫在桌子下面」这一核心要求。本次测试的核心考察点正是「桌子下方」这一空间关系,猫的缺失意味着模型未能理解或执行「桌下」这一空间指令,导致整体评分大幅下降。 【GEMINI】这是一次严重的指令遵循失败。尽管模型在桌面物体的渲染和透视逻辑上表现尚可,但完全忽略了提示词中关于「猫」这一关键主体的要求。作为一个视觉评审员,我必须指出,未能呈现用户明确指定的实体,即意味着任务的失败。 【KIMI】该图像在执行「花瓶-书-杯子」的水平位置关系上表现正确,但完全遗漏了提示词中明确要求的「猫在桌子下面」这一核心指令。作为测试「基本上下左右位置关系」的任务,猫的缺失不仅导致实体完整性受损,更使得「桌面以下」这一垂直空间关系无法得到验证。评分需严格体现这一重大遗漏:空间准确性因核心参照物缺失而降至40分,实体完整性因1/5关键物体缺失为60分,场景结构因层次验证不完整为75分。模型未能完成提示词的全部要求,属于部分失败案例。
困难难度评测结果
- 得分:45.5 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一个深棕色实木书架的局部,书架分为上下两层,散发着温馨的居家氛围。上层左侧整齐排列着几本厚书,中间放置着一个蓝色的地球仪,右侧则塞满了五颜六色的书籍。下层左侧堆叠着两本厚书,中间立着几本旧书,右侧最引人注目的是一只橘白相间的猫咪,它正乖巧地坐在一只放在木凳上的瓦楞纸箱里,露出圆滚滚的脑袋看向前方。画面色调温暖,光线柔和。然而,作为 AI 生成的图片,画面存在明显的逻辑与细节缺陷:书脊上的文字全是杂乱无章的乱码,无法辨认;地球仪上的陆地轮廓与现实地理完全不符;最明显的异常在于书架的结构,下层的垂直隔板在纸箱后方离奇消失,导致书架的空间透视显得非常不合理,仿佛纸箱悬浮在半空或嵌入了木板中。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在视觉质量上表现尚可,书架、地球仪、猫在纸箱内等局部细节处理较好。但在核心空间关系的完成度上存在严重缺陷:最关键的「狗」实体完全缺失,纸箱位置错误(应在书架下层内部而非椅子上),三本书颜色顺序不符合要求。7个空间关系中仅有约3-4个正确,整体完成度不足60%,属于部分失败的生成结果。 【GEMINI】该图像未能遵循大部分空间关系指令,特别是遗漏了两个核心实体(椅子和狗),导致任务完成度极低。模型在处理多重复杂空间约束时表现乏力,未能构建出完整的场景。 【KIMI】这是一张典型的AI「部分满足」失败案例:模型捕捉了「书架」「地球仪」「猫」「纸箱」等关键词,却完全丢失了空间关系的精确性与实体完整性。最致命的是「狗」的完全缺失与「椅子」的概念偷换(凳子替代),以及纸箱被错误放置于额外家具上而非书架下层内部。中层书籍的颜色与数量要求被彻底无视。整体呈现一种「元素拼凑」而非「关系构建」的AI生成特征,提示词遵循度极低。
相关链接
您可以通过以下链接查看更多相关内容: