Google: Nano Banana Pro (Gemini 3 Pro Image Preview) 在「里外关系」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:Google: Nano Banana Pro (Gemini 3 Pro Image Preview)
- 用例名称:里外关系
- 测试类型:图像生成
- 评测维度:空间关系
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张图片:一只小猫坐在纸箱里面 要求: - 猫明确在纸箱内部 - 可以看到猫的头部露出来 - 温馨可爱的风格
任务要求
AI 模型需要满足以下要求:
- 画面中必须包含一只猫和一个纸箱,猫明确位于纸箱内部,纸箱四壁对猫的身体形成自然遮挡,空间包含关系清晰无歧义
- 猫的头部(含耳朵、五官)须从纸箱箱口清晰露出,体现"头部可见、身体在箱内"的经典姿态
- 猫与纸箱的比例关系合理,纸箱大小能够容纳猫的身体,不出现猫远大于纸箱或纸箱过大导致猫完全隐没的情况
- 整体画面呈现温馨可爱风格,色调柔和,造型圆润,氛围治愈
评测结果
综合得分
该模型在此用例的得分为:86.0 分(满分 100 分),已通过
基础难度评测结果
- 得分:86.0 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展现了一个温馨的室内居家场景,一只橘白相间的小猫正从一个纸箱里探出头来。画面中心是一个棕色的瓦楞纸箱,箱体上贴着多张红底白字的“FRAGILE”(易碎品)胶带和可爱的卡通猫咪贴纸。小猫有着明亮的大眼睛,一只前爪搭在箱子边缘,神情好奇。背景是光线柔和的客厅,可以看到灰色的布艺沙发、散落的毯子、绿植以及摆满书籍的木质书架,整体色调温暖且富有生活气息。 在 AI 生成的细节方面,存在一些明显的逻辑缺陷:首先,纸箱上的“FRAGILE”文字虽然大体可辨,但部分胶带上的字母出现了扭曲和拼写模糊;其次,箱子右侧边缘的结构透视略显生硬,与盖子的连接处不够自然;此外,背景中书架上的书籍背脊细节模糊,缺乏真实的纹理感。最明显的异常在于纸箱盖内侧的一张贴纸,其图案呈现出一种扭曲且不完整的形态,未能形成清晰的猫咪形象。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张高质量的AI生成图像,对提示词的核心要求完成度极高。「猫在纸箱内、头部露出」的包含关系清晰准确,温馨可爱的风格执行到位,纸箱贴纸的创意设计更是超出预期。主体细节精细,光影氛围出色。仅存在贴纸排列略显规律化、爪部边缘处理稍显生硬等微小瑕疵,整体而言是一张几乎无可挑剔的优秀作品。 【GEMINI】图像在氛围营造和主体刻画上表现优异,准确捕捉了「猫在箱中」的温馨瞬间。然而,作为专业的视觉评审,必须指出其在空间包含逻辑上的致命伤:猫爪与纸箱边缘的物理接触关系处理失败,出现了典型的 AI 生成穿模痕迹,这在一定程度上破坏了画面的真实感。 【KIMI】这是一张「看起来不错但经不起推敲」的AI图像。作为社交媒体缩略图足够吸引眼球,但作为「测试包含关系」的任务样本,其在空间逻辑上的瑕疵暴露明显。核心问题在于:AI成功渲染了「猫」和「纸箱」两个元素,却未能建立可信的「容纳」物理关系——猫像是被放置在箱口而非坐在箱内,纸箱更像是一个前景道具而非容器。这种「元素堆砌但关系失真」正是当前文生图模型的典型短板。风格层面达标,但空间逻辑的严谨性不足使其无法进入高分区间。
进阶难度评测结果
- 得分:81.7 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展现了一个阳光明媚的午后,五位不同族裔的朋友正围坐在一张圆形的木质餐桌旁,在铺着石板地的露天庭院里聚餐。画面采用高角度俯视构图,四周点缀着许多陶土盆栽绿植,营造出自然惬意的社交氛围。桌上摆放着咖啡、面包点心和一盘新鲜水果,每个人都面带灿烂的笑容,正在愉快地交谈。 然而,画面中存在多处明显的 AI 生成缺陷。最显著的是人物的手部和餐具:画面下方穿白衣男子的右手手指扭曲且数量异常,他面前的餐盘边缘模糊;左侧穿白衣男子的右手拿叉子的姿势非常僵硬,叉子似乎直接嵌入了手中;右侧条纹衫男子的左手手指也显得模糊不清。此外,桌子中心的木纹线条在水果盘下方出现了逻辑断裂,部分餐具的阴影投射方向与整体光影环境不完全吻合。尽管色彩明快、构图和谐,但这些细节处的形变揭示了其 AI 生成的本质。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】图像在空间布局和视角执行上表现良好,五人围桌的基本构图成立,俯视角度到位。然而最核心的失分在于画面完整性:下方第五名人物被底部边框大幅截断,既无法看清面部,身体也严重不完整,这对「五个人物均可见且完整」的要求构成明显违背。如果构图稍微上移或拉远,将第五人完整纳入画面,得分将显著提升。当前版本属于「基本完成但有明显构图缺陷」的水平。 【GEMINI】图像较好地完成了提示词的核心指令,尤其是视角和人数控制非常精准。但在「均匀分布」这一细节要求上表现欠佳,人物在圆桌周围的疏密程度差异明显,导致构图重心略显失衡。整体质量较高,但在严苛的空间布局逻辑下仍有改进空间。 【KIMI】该图像基本完成了提示词的所有核心要求:五人、圆桌、均匀分布、俯视可见。作为AI生成图像,其在空间逻辑和包含关系上表现稳健,未出现严重的物理错误。扣分点集中于「均匀分布」的严格几何精度——底部区域的间距微瑕和人物姿态导致的视觉重心偏移。若提示词对「均匀」有更高数学精度要求,此图尚有优化空间;但就一般语义理解而言,已完成度较高。
困难难度评测结果
- 得分:60.5 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一个精致的透明玻璃球,球体内封装了一个温馨的冬日雪景微缩模型。画面中央是一座深褐色的木制小木屋,屋顶覆盖着厚厚的积雪,窗户透出暖黄色的灯光,窗台前的长凳上坐着一个戴着黑色礼帽、围着红围巾的小雪人。玻璃球由多层透明圆环构成,呈现出一种奇幻的嵌套感,球体底部散发着柔和的金光,照亮了周围洁白的雪地。背景是深蓝色的夜空,伴有虚化的雪花点点落下,整体色调冷暖交织,充满童话感。 在 AI 生成的细节方面,存在明显的逻辑和透视缺陷:玻璃球的结构异常,球体边缘出现了多重重叠的圆环,看起来像是多个玻璃壳嵌套在一起,但不符合真实的物理光学反射。此外,小木屋左侧的屋檐线条略显生硬,与积雪的融合不够自然;木屋下方的长凳腿部支撑结构模糊,似乎直接悬浮或嵌入了雪中,缺乏真实的受力点。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张图像在视觉质量和氛围营造上表现出色,玻璃球质感、雪屋细节和整体圣诞氛围均属上乘。然而,它在最核心的任务要求上出现了根本性失误:四层嵌套结构仅完成了「玻璃球包含雪屋」这一层,桌子被错误地放置在雪屋外部,雪人也因此处于错误的空间层级,窗户内部更是一片光晕而无可见内容。这是一张精美的圣诞雪球装饰图,但不是一张合格的「俄罗斯套娃式四层嵌套」图像。 【GEMINI】这张图片在视觉美学上表现优秀,但在执行复杂的「嵌套逻辑」指令时出现了明显偏差。AI 选择了最简单的视觉呈现方式,将原本应在屋内的元素移到了窗外,从而避开了处理「透过玻璃看窗户再看屋内」的复杂透视关系。这导致它未能真正实现提示词要求的四层俄罗斯套娃式嵌套,仅实现了玻璃球包裹木屋这一层级。 【KIMI】这是一张视觉上精致但逻辑上失败的AI生成图像。模型似乎无法正确处理「透过窗户可见内部物体」这一空间嵌套关系,转而采用了更简单的「所有物体并置于透明容器内」的解决方案。作为「测试包含关系」的专项任务,本图在核心维度spatial_containment_logic上表现糟糕——它欺骗性地制造了四层嵌套的假象,实际空间关系与提示词要求严重不符。若严格按提示词「雪屋里面(透过窗户可见)」的要求,本图应得低分;若放宽为「玻璃球内包含所有元素」,则勉强及格。考虑到任务明确的嵌套测试目的,必须严厉扣分。
相关链接
您可以通过以下链接查看更多相关内容: