Google: Nano Banana Pro (Gemini 3 Pro Image Preview) 在「前后关系」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:Google: Nano Banana Pro (Gemini 3 Pro Image Preview)
  • 用例名称:前后关系
  • 测试类型:图像生成
  • 评测维度:空间关系

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张图片:一棵大树在一座小房子的前面 要求: - 树明显遮挡住房子的一部分 - 透视关系正确 - 阳光明媚的场景

任务要求

AI 模型需要满足以下要求:

  1. 画面中必须同时出现一棵大树和一座小房子,大树位于房子的正前方(更靠近观察者),两者须有明确的前后层次区分
  2. 大树须遮挡房子至少约 20% 的可见区域(如遮挡部分墙体、屋顶或门窗),遮挡边缘自然清晰,不得出现树与房子相互穿插或融合的错误
  3. 大树与房子的大小比例须符合近大远小的透视规律,画面应呈现出清晰的空间纵深感
  4. 场景光照须呈现阳光明媚的晴天效果,光照方向统一,树木与房子均应有明确的受光面与投影,整体色调明亮温暖

评测结果

综合得分

该模型在此用例的得分为:87.8 分(满分 100 分),已通过

基础难度评测结果

  • 得分:87.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展现了一幅宁静的乡村风景画。画面右侧矗立着一棵巨大的古老橡树,粗壮的树干占据了显著位置,繁茂的枝叶像一把巨伞遮盖了半个天空,投下斑驳的树影。树下坐落着一座精致的石墙小屋,屋顶铺着红褐色的瓦片,门前点缀着盛开的粉色和白色玫瑰花丛。一条蜿蜒的泥土小径从画面左下角延伸向远方,背景是起伏的绿色丘陵和淡蓝色的天空,整体色调温暖,充满夏日午后的阳光感。 在 AI 生成的细节方面,存在一些逻辑异常:首先,画面右侧巨大的树干与小屋的比例略显失调,树木显得过于庞大。其次,仔细观察树叶与天空交界处,部分叶片的边缘显得模糊且结构混乱。最明显的缺陷在于光影逻辑,虽然阳光看似从左上方照射,但树干右侧的阴影处理不够自然,且小屋墙面上的花丛阴影与建筑结构的透视关系略显生硬,缺乏真实环境中的细腻层次感。

图中展现了一幅宁静的乡村风景画。画面右侧矗立着一棵巨大的古老橡树,粗壮的树干占据了显著位置,繁茂的枝叶像一把巨伞遮盖了半个天空,投下斑驳的树影。树下坐落着一座精致的石墙小屋,屋顶铺着红褐色的瓦片,门前点缀着盛开的粉色和白色玫瑰花丛。一条蜿蜒的泥土小径从画面左下角延伸向远方,背景是起伏的绿色丘陵和淡蓝色的天空,整体色调温暖,充满夏日午后的阳光感。

在 AI 生成的细节方面,存在一些逻辑异常:首先,画面右侧巨大的树干与小屋的比例略显失调,树木显得过于庞大。其次,仔细观察树叶与天空交界处,部分叶片的边缘显得模糊且结构混乱。最明显的缺陷在于光影逻辑,虽然阳光看似从左上方照射,但树干右侧的阴影处理不够自然,且小屋墙面上的花丛阴影与建筑结构的透视关系略显生硬,缺乏真实环境中的细腻层次感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像整体质量相当高,核心测试目标「前后遮挡关系」基本达成——大树明显位于房子前方并形成超过20%的遮挡,透视关系近乎完美,阳光明媚的氛围还原良好。主要扣分点在于大树并非严格位于房子「正前方」,而是偏右侧,使得房子正立面几乎完全暴露,遮挡集中于屋顶而非墙体主体。若提示词严格要求「正前方遮挡」,此点需改进。综合而言,这是一张执行质量优秀的AI生成图像,在遮挡关系和透视准确性两个核心维度上表现突出。 【GEMINI】这是一张视觉效果非常出色的图像,完美达成了「大树遮挡房子」和「阳光明媚」的指令要求。构图上利用前景巨木建立了强大的视觉冲击力。主要的失分点在于建筑细节(烟囱)和地面路径的微观透视逻辑上,这些AI常见的结构性瑕疵在仔细审视下依然存在。 【KIMI】该图像在核心任务——「大树遮挡房子」——上完成度较高,透视与光照均未出现硬伤。主要扣分项集中在AI生成图像的共性弱点:物体与地面的接触真实感、边缘遮挡的物理锐利度。整体属于「基本满足要求,细节有待打磨」的合格作品,未出现提示词偏离或重大空间逻辑错误。

进阶难度评测结果

  • 得分:71.1 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中呈现了一幅宁静的乡村日落美景。构图的前景是一朵巨大的向日葵,它占据了画面底部的近一半空间,金黄色的花瓣层层叠叠,花蕊细节清晰可见。中景是一条蜿蜒的泥土小路,向远方延伸,左侧矗立着一棵枝叶繁茂的古树。背景是巍峨的雪山,山顶覆盖着白雪,在夕阳的余晖下泛着柔和的光。天空呈现出淡橙色和蓝色的渐变,云朵被染成了温暖的色调。整幅画面的色彩丰富且温暖,充满了生命力。然而,作为 AI 生成的图片,画面存在明显的透视和逻辑异常:前景的向日葵体积大得不合常理,且没有花茎支撑,仿佛凭空悬浮在道路中央;同时,向日葵花瓣的边缘过于锋利且完美,与背景中自然的光影质感略显脱节,缺乏真实的景深过渡。

画面中呈现了一幅宁静的乡村日落美景。构图的前景是一朵巨大的向日葵,它占据了画面底部的近一半空间,金黄色的花瓣层层叠叠,花蕊细节清晰可见。中景是一条蜿蜒的泥土小路,向远方延伸,左侧矗立着一棵枝叶繁茂的古树。背景是巍峨的雪山,山顶覆盖着白雪,在夕阳的余晖下泛着柔和的光。天空呈现出淡橙色和蓝色的渐变,云朵被染成了温暖的色调。整幅画面的色彩丰富且温暖,充满了生命力。然而,作为 AI 生成的图片,画面存在明显的透视和逻辑异常:前景的向日葵体积大得不合常理,且没有花茎支撑,仿佛凭空悬浮在道路中央;同时,向日葵花瓣的边缘过于锋利且完美,与背景中自然的光影质感略显脱节,缺乏真实的景深过渡。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】图像整体视觉质量较高,光影氛围出色,但在核心测试目标「前后遮挡关系」上存在根本性缺陷:花与树之间的遮挡关系完全未实现,三个主体未被安排在同一纵深轴线上,导致遮挡链条断裂。空间层次和透视比例基本达标,但遮挡关系的失败使整体评分受到显著拖累。 【GEMINI】这张图片在空间构图和透视比例上表现出色,成功营造了宏大的纵深感。然而,在核心测试点「前后遮挡关系」上出现了明显的AI生成痕迹:近景主体向日葵与环境的物理衔接完全断裂,没有体现出真实的遮挡逻辑,更像是一个漂浮在镜头前的贴图,这在严苛的视觉评审中是严重的逻辑缺陷。 【KIMI】这是一张典型的AI「元素堆砌」失败案例。模型机械地理解了「远-中-近」的词汇指令,却完全未能构建合理的三维空间逻辑。花被处理为「前景装饰性贴图」而非场景中的真实物体,其比例失控到荒谬的程度——若按画面比例推算,这朵花的直径可达2-3米。提示词要求的「透视正确,近大远小」被彻底违背,花的大小更像是迎合构图美感的强行放大,而非遵循物理规律的结果。遮挡测试完全失败:近物未遮中物,中物对远物的遮挡也过于微弱。建议重新理解「透视」与「遮挡」的物理含义,而非仅作平面图层叠加。

困难难度评测结果

  • 得分:89.0 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一位留着深色短发的年轻人正站在一面巨大的全身镜前。画面采用室内自然光,色调温馨,背景是一个充满生活气息的客厅,摆放着绿植、木质家具和装饰画。此人背对镜头,穿着白色短袖 T 恤和蓝色牛仔裤,右臂布满黑色纹身,正举起右手面向镜子。镜中映射出其正面形象,神情平淡,T 恤上印有反向的“MIRROR IMAGE”字样。 然而,画面存在明显的 AI 生成逻辑错误:最显著的缺陷在于镜内外的动作不一致。画面右侧真实人物举起的是右手,但镜中的影像却同样举起了右手(相对于镜中人而言),而非物理定律下应呈现的左手镜像,这导致镜中人的纹身位置与本体完全相同,违背了反射原理。此外,镜中人物举起的手掌手指比例略显僵硬,边缘处理不够自然,呈现出一种超现实的诡异感。

图中展示了一位留着深色短发的年轻人正站在一面巨大的全身镜前。画面采用室内自然光,色调温馨,背景是一个充满生活气息的客厅,摆放着绿植、木质家具和装饰画。此人背对镜头,穿着白色短袖 T 恤和蓝色牛仔裤,右臂布满黑色纹身,正举起右手面向镜子。镜中映射出其正面形象,神情平淡,T 恤上印有反向的“MIRROR IMAGE”字样。

然而,画面存在明显的 AI 生成逻辑错误:最显著的缺陷在于镜内外的动作不一致。画面右侧真实人物举起的是右手,但镜中的影像却同样举起了右手(相对于镜中人而言),而非物理定律下应呈现的左手镜像,这导致镜中人的纹身位置与本体完全相同,违背了反射原理。此外,镜中人物举起的手掌手指比例略显僵硬,边缘处理不够自然,呈现出一种超现实的诡异感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在核心提示词要求的所有维度上均表现出色,尤其是T恤文字镜像反转和手部左右镜像关系两项最难处理的细节均近乎完美。镜面物理规律严格遵循,空间构图合理自然。整体而言,这是一张高质量的镜像主题图像,仅存在画面裁切导致的轻微构图缺憾,不影响核心要求的完成度。综合加权得分约93分。 【GEMINI】这是一张在空间构图和肢体镜像逻辑上表现优异,但在核心文字处理上出现低级逻辑错误的图像。模型理解了「镜像」的概念并应用到了人体姿态上,却在处理T恤文字时陷入了「视觉一致性」的陷阱,导致镜中文字未能发生物理翻转,直接宣告了该核心测试项的失败。 【KIMI】这是一张高质量完成提示词要求的AI生成图像。核心测试点——镜像反射的物理正确性、手部左右方位、文字镜像反转——均得到准确执行。图像在光学规律遵循上表现优异,未发现明显的AI生成瑕疵(如手指畸形、文字乱码、镜像逻辑混乱等常见问题)。构图自然,场景细节丰富且协调,可作为镜像反射类提示词的优秀范例。评分严格基于提示词要求,未对光影风格、色彩调性等未要求维度进行额外评判。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...