Google: Gemini 2.5 Flash Image (Nano Banana) 在「黄山迎客松镂空寿字卡片生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:Google: Gemini 2.5 Flash Image (Nano Banana)
  • 用例名称:黄山迎客松镂空寿字卡片生成
  • 测试类型:图像生成
  • 评测维度:VG-FramedPerspective

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张写实风格的图像:一只手拿着一张深灰色岩石质感的卡片,卡片中心镂空刻有汉字「寿」,透过镂空部分可以看到远处的黄山迎客松与云海。背景云雾缭绕,整体氛围大气磅礴。

任务要求

AI 模型需要满足以下要求:

  1. 画面中有一只手持有深灰色岩石质感卡片
  2. 卡片中心有镂空的汉字「寿」
  3. 透过镂空部分可见黄山迎客松
  4. 背景有云海或云雾元素
  5. 整体风格为写实摄影风格

评测结果

综合得分

该模型在此用例的得分为:75.9 分(满分 100 分),已通过

基础难度评测结果

  • 得分:75.9 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只左手拿着一张深灰色磨砂质感的长方形卡片,背景是壮丽的高山云海。卡片中心有一个镂空的汉字,形似“昔”字或“黄”字的变形。透过这个镂空的汉字,可以看到远处山巅上一棵翠绿的松树,这种“框景”构图将自然美景与文字巧妙结合。背景中的山峰在浓密的白云中若隐若现,天空呈现出淡雅的灰白色,整体色调清新自然。 然而,画面中存在明显的 AI 生成缺陷:首先,镂空的汉字结构并不标准,笔画连接处显得生硬且不符合汉字书写逻辑;其次,最明显的错误在于持卡的手部,大拇指的指甲形状异常,且食指与卡片接触的位置透视错误,手指似乎直接“嵌入”了卡片边缘,缺乏真实的物理接触感;此外,卡片右侧边缘悬空,没有手指支撑却能平稳保持水平,违背了重力常识。

图中展示了一只左手拿着一张深灰色磨砂质感的长方形卡片,背景是壮丽的高山云海。卡片中心有一个镂空的汉字,形似“昔”字或“黄”字的变形。透过这个镂空的汉字,可以看到远处山巅上一棵翠绿的松树,这种“框景”构图将自然美景与文字巧妙结合。背景中的山峰在浓密的白云中若隐若现,天空呈现出淡雅的灰白色,整体色调清新自然。

然而,画面中存在明显的 AI 生成缺陷:首先,镂空的汉字结构并不标准,笔画连接处显得生硬且不符合汉字书写逻辑;其次,最明显的错误在于持卡的手部,大拇指的指甲形状异常,且食指与卡片接触的位置透视错误,手指似乎直接“嵌入”了卡片边缘,缺乏真实的物理接触感;此外,卡片右侧边缘悬空,没有手指支撑却能平稳保持水平,违背了重力常识。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在整体意境营造和镂空透视关系上表现出色,写实摄影风格到位,云海黄山的氛围令人印象深刻。然而最致命的问题是镂空汉字错误——图中呈现的是「着」字而非提示词要求的「寿」字,这是对核心提示词要求的直接违背。此外迎客松的标志性形态表现不足。综合来看,图像在视觉质量上有较高水准,但在文字准确性这一关键要求上存在明显失误,导致整体评分受到较大影响。 【GEMINI】这是一张在氛围营造上表现尚可,但在核心语义理解(汉字)和细节刻画上存在明显硬伤的图像。最严重的问题在于模型未能正确生成汉字「寿」,导致画面主题完全跑偏,这对于需要精准文字呈现的场景是致命的。手部细节和物理透视的严谨性也需要进一步优化。 【KIMI】该图像在背景意境营造上表现尚可,但犯下提示词核心要求的致命错误——将「寿」字错生成为「黄」字,直接导致任务失败。镂空透视的逻辑混乱与材质表现的平庸进一步拉低质量。模型在文字语义理解与空间关系构建上存在明显短板,需严格区分「寿」与「黄」的字形差异,并提升镂空场景的真实景深计算能力。

进阶难度评测结果

  • 得分:78.6 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只左手捏着一张深灰色磨砂质感的长方形卡片,背景是云雾缭绕的高山。卡片中心有一个巨大的镂空汉字,看起来像是“若”字或“芳”字的变体,通过镂空处可以看到远方山巅上的一棵翠绿松树。卡片下方印有数字“2026”和两匹奔马的剪影。整体色调清新,构图采用了框景摄影手法,将自然景观嵌入人造卡片中。 画面中存在明显的 AI 生成缺陷:首先,卡片中心的镂空汉字结构逻辑混乱,笔画断裂且不符合常规汉字书写,像是随机拼凑的符号。其次,左下角捏住卡片的手指比例失调,食指异常粗大且指甲形状生硬,与手掌的连接处缺乏自然的骨骼感。此外,卡片底部的马匹剪影边缘模糊,且“2026”数字的透视与卡片平面略有偏差,显得不够真实。

图中展示了一只左手捏着一张深灰色磨砂质感的长方形卡片,背景是云雾缭绕的高山。卡片中心有一个巨大的镂空汉字,看起来像是“若”字或“芳”字的变体,通过镂空处可以看到远方山巅上的一棵翠绿松树。卡片下方印有数字“2026”和两匹奔马的剪影。整体色调清新,构图采用了框景摄影手法,将自然景观嵌入人造卡片中。

画面中存在明显的 AI 生成缺陷:首先,卡片中心的镂空汉字结构逻辑混乱,笔画断裂且不符合常规汉字书写,像是随机拼凑的符号。其次,左下角捏住卡片的手指比例失调,食指异常粗大且指甲形状生硬,与手掌的连接处缺乏自然的骨骼感。此外,卡片底部的马匹剪影边缘模糊,且“2026”数字的透视与卡片平面略有偏差,显得不够真实。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张AI生成图像整体完成度较高,核心提示词要求基本得到满足。第一人称手持镂空卡片的场景构建成功,「寿」字镂空透视关系合理,石刻质感卡片材质表现出色,底部装饰元素完整。主要不足在于镂空内景的纵深感略显不足(松树偏近景),未能充分展现黄山云海的磅礴远景;持卡角度略显刻意。综合来看,这是一张质量较高的AI生成图像,在镂空透视与场景融合方面表现尤为突出。 【GEMINI】这张图像在材质表现和氛围营造上展现了不错的潜力,尤其是卡片岩石质感的处理非常到位。然而,AI 在处理复杂细节(如手部结构、微小剪影)和物理透视逻辑上暴露了明显短板。马剪影的崩坏和手部的僵硬直接拉低了作品的专业度,使其看起来更像是一张拼凑感较强的合成图,而非一张浑然天成的摄影作品。 【KIMI】该图像完成了提示词的基础框架要求,但在关键的「镂空透视」这一技术难点上暴露明显缺陷——迎客松与背景的空间关系处理失败,呈现典型的AI「贴图窗口」效应。岩石质感、石刻边缘、背景虚化等多处细节未能达到写实摄影标准。作为考察「镂空透视与场景融合」的测试图像,其在核心能力维度上表现不足,属于「概念可见、执行欠妥」的中等偏下水准。

困难难度评测结果

  • 得分:71.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中,一只手正举着一块深灰色的长方形石板,背景是壮丽的高山云海。石板中心有一个镂空的汉字,透过这个字可以看到背景中一棵苍劲的迎客松。石板下方刻有数字“2026”和一匹奔马的剪影。远景是连绵的山峦和如浪潮般的白色云雾,在柔和的晨光或余晖下显得宁静深远。构图上,石板位于画面中心,形成一种“画中画”的视觉效果。 然而,画面中存在明显的 AI 生成缺陷:首先,石板中间镂空的汉字结构异常,并非标准的汉字,看起来像是“前”字或“荷”字的错误变形,笔画断裂且逻辑不通。其次,持握石板的手部结构不自然,大拇指的比例和连接处显得僵硬,手指的边缘与石板交界处略显模糊。此外,石板右侧的边缘过于平整,与左侧略带粗糙的质感不完全统一,透视关系上也略显生硬。

画面中,一只手正举着一块深灰色的长方形石板,背景是壮丽的高山云海。石板中心有一个镂空的汉字,透过这个字可以看到背景中一棵苍劲的迎客松。石板下方刻有数字“2026”和一匹奔马的剪影。远景是连绵的山峦和如浪潮般的白色云雾,在柔和的晨光或余晖下显得宁静深远。构图上,石板位于画面中心,形成一种“画中画”的视觉效果。

然而,画面中存在明显的 AI 生成缺陷:首先,石板中间镂空的汉字结构异常,并非标准的汉字,看起来像是“前”字或“荷”字的错误变形,笔画断裂且逻辑不通。其次,持握石板的手部结构不自然,大拇指的比例和连接处显得僵硬,手指的边缘与石板交界处略显模糊。此外,石板右侧的边缘过于平整,与左侧略带粗糙的质感不完全统一,透视关系上也略显生硬。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在整体视觉质量和氛围营造上表现较好,岩石质感、手持视角、云海背景等要素均有较高完成度。然而最致命的问题是镂空汉字字形错误——生成的并非「寿」字而是另一个汉字,这直接违背了提示词的核心要求。此外镂空卡片的立体厚度感不足,以及镂空与迎客松的精准对准度有所欠缺。综合来看,图像在技术执行层面有一定水准,但核心内容错误导致整体评价大打折扣。 【GEMINI】图像在氛围营造和材质基础表现上达到了及格水平,但在物理逻辑(透视、厚度)和细节刻画(石刻工艺、手部解剖)上存在明显短板。作为一张需要体现「镂空透视」核心难点的作品,其空间融合度未能达到预期,导致真实感大打折扣。 【KIMI】这是一张在核心技术上严重失败的AI生成图像。模型完全未能理解「镂空透视」的空间逻辑,将「透过镂空看到的景物」与「背景景物」处理为两个独立图层,导致灾难性的「双松树」效果。手部姿态、石刻质感、构图精准性等关键要求均未达标。尽管云海氛围有可取之处,但技术缺陷已使图像失去作为「写实摄影」的基本可信度。评分需严格拉开差距,避免对明显错误宽容。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...