Google: Gemini 2.5 Flash Image (Nano Banana) 在「梦境逻辑」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:Google: Gemini 2.5 Flash Image (Nano Banana)
  • 用例名称:梦境逻辑
  • 测试类型:图像生成
  • 评测维度:创意表达

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张图片:一个人站在巨大的蘑菇上,蘑菇的伞盖是透明的水晶材质,里面有发光的星系在缓慢旋转。人物穿着睡衣,手里拿着一个会飘浮的枕头。背景是柔和的粉紫色天空,有几朵棉花糖一样的云朵漂浮着。整体氛围梦幻而宁静。

任务要求

AI 模型需要满足以下要求:

  1. 图像中必须包含一个穿着睡衣的人物,人物站立于体量明显大于人物的巨大蘑菇顶部。
  2. 蘑菇伞盖呈现透明水晶材质效果,可透过伞盖看到内部结构(具备透明度而非仅有光泽感)。
  3. 水晶伞盖内部呈现清晰的星系螺旋状发光纹理(以螺旋纹理替代动态旋转描述,适配静态图像评估)。
  4. 人物手中持有一个枕头,枕头须呈现飘浮状态(如悬空离手、周围有光晕或地面无对应阴影等视觉暗示)。
  5. 背景天空以粉紫色为主色调,整体光影柔和,营造梦幻宁静氛围。
  6. 画面中有若干形态蓬松圆润、类似棉花糖质感的云朵漂浮于背景中。
  7. 画面整体风格统一于柔和超现实梦境美学,人物肢体无明显畸变,各元素边缘清晰。

评测结果

综合得分

该模型在此用例的得分为:65.3 分(满分 100 分),已通过

基础难度评测结果

  • 得分:65.3 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展现了一个充满超现实主义色彩的梦幻场景。画面中央矗立着一只巨大的、半透明的玻璃质感蘑菇,其伞盖呈现出多面体的切割效果,内部包裹着一个璀璨的螺旋星系,散发出蓝紫色的光芒。蘑菇柄晶莹剔透,底部隐没在如云雾般的白色草地中。一名穿着深蓝色碎花睡衣的人背对着观众,站在巨型蘑菇下方,伸出一只手,似乎在托举一颗悬浮在空中的发光四角星。背景是柔和的淡粉色天空,点缀着几朵蓬松的紫色云团,整体色调温馨而治愈。 在 AI 生成的细节方面,存在一些明显的逻辑与视觉缺陷:人物伸出的左手手指轮廓模糊,呈现出不自然的融合状,缺乏清晰的指节结构;悬浮的四角星边缘略显生硬,与周围环境的光影衔接不够自然;此外,蘑菇柄与地面的接触位置缺乏真实的阴影投射,使得巨大的物体看起来像是漂浮在云雾之上,缺乏重量感。

图中展现了一个充满超现实主义色彩的梦幻场景。画面中央矗立着一只巨大的、半透明的玻璃质感蘑菇,其伞盖呈现出多面体的切割效果,内部包裹着一个璀璨的螺旋星系,散发出蓝紫色的光芒。蘑菇柄晶莹剔透,底部隐没在如云雾般的白色草地中。一名穿着深蓝色碎花睡衣的人背对着观众,站在巨型蘑菇下方,伸出一只手,似乎在托举一颗悬浮在空中的发光四角星。背景是柔和的淡粉色天空,点缀着几朵蓬松的紫色云团,整体色调温馨而治愈。

在 AI 生成的细节方面,存在一些明显的逻辑与视觉缺陷:人物伸出的左手手指轮廓模糊,呈现出不自然的融合状,缺乏清晰的指节结构;悬浮的四角星边缘略显生硬,与周围环境的光影衔接不够自然;此外,蘑菇柄与地面的接触位置缺乏真实的阴影投射,使得巨大的物体看起来像是漂浮在云雾之上,缺乏重量感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在视觉美感和材质表现上具备相当水准,水晶蘑菇与星系的结合令人印象深刻,色调氛围也高度契合梦幻主题。然而,两处核心语义错误严重拉低了整体评分:其一,人物站在蘑菇下方而非顶部,颠覆了提示词的核心叙事;其二,飘浮枕头被替换为菱形星体,形态与语义均不符。这两处失误表明模型在处理「站在……上」的空间关系和「枕头」的具体物体识别上存在明显缺陷,属于可辨识的AI生成语义理解局限。若非这两处关键偏差,本图可达80分以上。 【GEMINI】这是一张视觉表现力尚可但语义理解严重不及格的作品。模型精准捕捉了材质(水晶、星系、云朵)和色彩氛围,却在最基础的空间指令「站在...上」上出现了逻辑错误,直接破坏了提示词预设的视觉奇观感。作为一张AI生成图,它在美学上是合格的,但在指令遵循上是失败的。 【KIMI】这是一张视觉华丽但语义执行失败的典型案例。模型在材质渲染和氛围营造上展现了一定能力,却彻底误解了「站在蘑菇上」这一核心空间设定,将人物置于蘑菇下方而非顶部,导致叙事逻辑崩塌。枕头形态的偏离进一步暴露了语义理解的表面化——仅捕捉「飘浮」而忽略「枕头」的实体特征。作为梦境场景测试,其氛围达标但指令遵循度严重不足,属于「好看但跑题」的生成结果。

进阶难度评测结果

  • 得分:74.6 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中呈现了一个超现实主义的梦幻场景。视觉中心是一个年幼的孩子坐在一只巨大的白色纸船里,在平静的蓝色海面上垂钓。海面上方,一座宏伟的现代化城市倒挂在天空中,建筑群错落有致,散发出温暖的金色灯光。天空中漂浮着许多翻开的书籍和发光的白色蝴蝶,一些细小的碎片正从倒挂的城市坠落向纸船。海面清晰地倒映着倒挂的城市、纸船和飞舞的元素,构成了上下对称的视觉效果。色调以深蓝、浅灰和明亮的暖金色为主,营造出一种宁静而奇幻的氛围。 在 AI 生成的细节方面,存在一些明显的逻辑缺陷:左侧前景中最大的书籍,其页面上的文字是模糊且无意义的乱码,不符合任何真实语言;孩子手中的鱼竿线条在手部位置显得模糊且断裂,与手的连接不够自然;此外,海面上的倒影虽然精美,但部分漂浮书籍的倒影角度与实物并不完全匹配,且倒挂城市最底端的建筑细节在倒影中显得过于清晰,略违背物理透视规律。

画面中呈现了一个超现实主义的梦幻场景。视觉中心是一个年幼的孩子坐在一只巨大的白色纸船里,在平静的蓝色海面上垂钓。海面上方,一座宏伟的现代化城市倒挂在天空中,建筑群错落有致,散发出温暖的金色灯光。天空中漂浮着许多翻开的书籍和发光的白色蝴蝶,一些细小的碎片正从倒挂的城市坠落向纸船。海面清晰地倒映着倒挂的城市、纸船和飞舞的元素,构成了上下对称的视觉效果。色调以深蓝、浅灰和明亮的暖金色为主,营造出一种宁静而奇幻的氛围。

在 AI 生成的细节方面,存在一些明显的逻辑缺陷:左侧前景中最大的书籍,其页面上的文字是模糊且无意义的乱码,不符合任何真实语言;孩子手中的鱼竿线条在手部位置显得模糊且断裂,与手的连接不够自然;此外,海面上的倒影虽然精美,但部分漂浮书籍的倒影角度与实物并不完全匹配,且倒挂城市最底端的建筑细节在倒影中显得过于清晰,略违背物理透视规律。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在视觉冲击力和整体氛围营造上表现不俗,成功建立了「倒置城市+海面孤舟+梦幻光效」的超现实场景框架。然而深入对照提示词后,暴露出数个根本性缺陷:最致命的是海面倒影与上方城市形态完全不匹配,直接摧毁了「无限循环视觉效果」的核心诉求;其次是「文字化蝴蝶」这一最具诗意的物态转换叙事完全付之阙如。这两处缺失均属于提示词的核心创意点,而非细节润色,说明模型在处理「过程性转化」和「镜像一致性」这类复杂语义时存在明显短板。整体而言是一张视觉上令人愉悦但语义还原不够精准的作品。 【GEMINI】这是一张视觉冲击力较强的超现实主义作品,成功捕捉了梦境的宏大感。但在细节执行上,模型未能理解「转化」这一动态语义(文字变蝴蝶),且在物理逻辑(钓线受力)和光学逻辑(倒影完整性)上存在明显疏漏,导致其作为一张严谨的艺术创作仍有提升空间。 【KIMI】该图像完成了超现实主义场景的基础搭建,但在核心叙事机制上存在显著断裂——「钓取记忆」与「文字化蝶」两个关键动作均未形成有效的视觉因果链,导致画面沦为元素的静态堆砌而非动态叙事。倒置城市的处理采用旋转偷懒方案,削弱了重力反转的惊奇感。整体属于「氛围到位、故事缺位」的执行,在AI生成图像中属中等偏上水平,但距离精准还原提示词意图仍有明显差距。

困难难度评测结果

  • 得分:76.3 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中呈现了一个充满超现实主义色彩的巨大沙漏,构图对称且富有哲学意味。沙漏的上半部分是金色的沙漠,一支骆驼商队在夕阳下行走,背景有古老的城堡;下半部分则是一个深蓝色的海洋世界,一名半人半星空的女性躯体伫立在水中,周围环绕着发光的水母和珊瑚。沙漏的颈部正将上方的黄沙转化为下方的水滴落下。沙漏之外的空间布满了密密麻麻、大小不一的人眼,这些眼睛镶嵌在红蓝渐变的背景中,仿佛在注视着这一切。整体色调由顶部的暖橙色过渡到底部的深蓝色,视觉冲击力极强。在 AI 生成的细节方面,存在明显的逻辑缺陷:背景中的大量眼睛结构混乱,部分眼球与瞳孔形状扭曲,缺乏解剖学合理性;沙漏中间下落的物质既像沙子又像水滴,衔接处显得生硬;此外,远处的骆驼和人物剪影细节模糊,部分肢体线条相互融合,呈现出一种不自然的粘连感。

画面中呈现了一个充满超现实主义色彩的巨大沙漏,构图对称且富有哲学意味。沙漏的上半部分是金色的沙漠,一支骆驼商队在夕阳下行走,背景有古老的城堡;下半部分则是一个深蓝色的海洋世界,一名半人半星空的女性躯体伫立在水中,周围环绕着发光的水母和珊瑚。沙漏的颈部正将上方的黄沙转化为下方的水滴落下。沙漏之外的空间布满了密密麻麻、大小不一的人眼,这些眼睛镶嵌在红蓝渐变的背景中,仿佛在注视着这一切。整体色调由顶部的暖橙色过渡到底部的深蓝色,视觉冲击力极强。在 AI 生成的细节方面,存在明显的逻辑缺陷:背景中的大量眼睛结构混乱,部分眼球与瞳孔形状扭曲,缺乏解剖学合理性;沙漏中间下落的物质既像沙子又像水滴,衔接处显得生硬;此外,远处的骆驼和人物剪影细节模糊,部分肢体线条相互融合,呈现出一种不自然的粘连感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张执行度较高的AI超现实主义插画,成功还原了提示词的绝大多数核心要素,色彩渐变和眼睛群落的处理尤为出色。然而,几个关键细节拖累了整体评分:水母发光效果不达标、人物头部渲染失败、物态转换缺乏中间态。整体风格偏向当代数字幻想插画,与达利/马格利特的经典超现实主义风格有明显距离。综合而言,这是一张「完成度良好但精细度不足」的作品,在梦境氛围营造上成功,在关键细节执行上留有遗憾。 【GEMINI】这是一张视觉冲击力较强但经不起推敲的AI生成图。模型在宏观构图和色彩分布上较好地执行了指令,但在涉及「材质纹理」和「微观叙事(瞳孔梦境)」等高难度细节时选择了偷懒。人物作为画面的视觉中心,其材质表现完全不符合提示词要求,导致超现实逻辑的艺术感染力大打折扣。整体更像是一张精美的插画素材堆砌,而非具备严谨逻辑的超现实主义艺术作品。 【KIMI】该图像在概念层面呼应了提示词,但执行层面存在多处严重偏差。最核心的失败在于人物纹理的完全错位——金属与水的组合彻底瓦解了「沙漠-海洋」双重身份的隐喻根基;瞳孔内梦境场景的模糊处理则让「无数梦境」的设定流于形式。沙-水转换的简单粗暴、水母发光的不足、骆驼细节的缺失,共同暴露出模型在处理复杂材质过渡与微观叙事时的能力边界。整体呈现「元素齐全但灵魂缺失」的状态,超现实主义的梦境逻辑让位于奇幻插画的视觉堆砌。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...