Google: Gemini 3.1 Flash Image Preview (Nano Banana 2) 在「西湖断桥残雪镂空乐字卡片」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:Google: Gemini 3.1 Flash Image Preview (Nano Banana 2)
  • 用例名称:西湖断桥残雪镂空乐字卡片
  • 测试类型:图像生成
  • 评测维度:VG-FramedPerspective

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张写实摄影风格的图像:一只手拿着一张青色宣纸质感的硬卡片,卡片中心镂空刻有汉字「乐」,透过镂空部分可以看到远处西湖断桥残雪的景色,色调清冷优雅。

任务要求

AI 模型需要满足以下要求:

  1. 画面中有一只手持青色宣纸质感硬卡片
  2. 卡片中心有镂空汉字「乐」
  3. 透过镂空部分可见西湖断桥残雪景色
  4. 整体色调清冷优雅
  5. 写实摄影风格,画面清晰

评测结果

综合得分

该模型在此用例的得分为:81.0 分(满分 100 分),已通过

基础难度评测结果

  • 得分:81.0 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一个宁静的冬日雪景。画面中心是一只左手捏着一张正方形的青绿色纤维纸,纸张中心镂空刻出了一个简体汉字「乐」。透过这个镂空的字,可以看到背景中银装素裹的园林景观。背景是一个宽阔的湖泊,湖边错落有致地分布着中式凉亭、长廊和被白雪覆盖的垂柳,远处是连绵的雪山,整体色调偏冷,呈现出一种静谧的意境。 在 AI 生成的细节方面,存在一些明显的逻辑缺陷:首先是手部结构异常,捏着纸张的手指比例不自然,且手指上莫名出现了多个纤细的金属环,看起来像是嵌入皮肤而非佩戴的戒指;其次,镂空汉字「乐」的笔画边缘带有不自然的黑色描边,且透过字孔看到的背景与周围环境在透视和光影上略有脱节;最后,背景中的人物身影非常模糊且形态扭曲,湖边的建筑线条在细看时也存在不合理的交错。

图中展示了一个宁静的冬日雪景。画面中心是一只左手捏着一张正方形的青绿色纤维纸,纸张中心镂空刻出了一个简体汉字「乐」。透过这个镂空的字,可以看到背景中银装素裹的园林景观。背景是一个宽阔的湖泊,湖边错落有致地分布着中式凉亭、长廊和被白雪覆盖的垂柳,远处是连绵的雪山,整体色调偏冷,呈现出一种静谧的意境。

在 AI 生成的细节方面,存在一些明显的逻辑缺陷:首先是手部结构异常,捏着纸张的手指比例不自然,且手指上莫名出现了多个纤细的金属环,看起来像是嵌入皮肤而非佩戴的戒指;其次,镂空汉字「乐」的笔画边缘带有不自然的黑色描边,且透过字孔看到的背景与周围环境在透视和光影上略有脱节;最后,背景中的人物身影非常模糊且形态扭曲,湖边的建筑线条在细看时也存在不合理的交错。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像高质量地完成了提示词的全部核心要求:手、青色宣纸质感卡片、镂空「乐」字、西湖雪景背景、清冷色调与写实摄影风格均得到了准确呈现。空间层次感与景深处理尤为出色,材质细节丰富真实。轻微瑕疵在于「乐」字边缘描边略显人工感,以及背景地标的断桥特征不够明确,但整体而言是一张高完成度的AI生成图像,充分体现了对提示词意图的深度理解与执行能力。 【GEMINI】这张图像在氛围营造和色彩把控上表现良好,成功传达了清冷优雅的意境。然而,在细节处理上存在明显短板,尤其是手部结构的崩坏和空间透视关系的生硬处理,极大地削弱了写实摄影的真实感。这更像是一张精美的合成海报,而非一张真实的摄影作品。 【KIMI】该图像在概念呈现上接近提示词要求,但执行层面存在明显的 AI 生成痕迹:镂空字体的「描边填充」处理暴露了模型对物理镂空工艺的理解缺失,景深与透视的多处矛盾显示空间推理能力不足,材质表现上宣纸的塑料感与雪景的平淡影调共同削弱了「写实摄影」的质感承诺。作为西湖断桥这一具体文化意象的呈现,标志性元素的模糊处理构成实质性偏离。

进阶难度评测结果

  • 得分:82.7 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只左手拿着一张青蓝色手工纸,背景是银装素裹的冬日湖景。这张纸的中心被镂空剪出了一个简体汉字「乐」,透过镂空处可以看到远方雪地中的石桥和行人。纸张的右下角印有红色的数字「2026」以及一匹奔跑的红马剪影。背景的湖面和远山笼罩在淡蓝色的冷调中,构图采用了前景聚焦、背景虚化的手法。 画面中存在明显的 AI 生成缺陷:首先,手持纸张的左手大拇指比例异常,指甲形状模糊,且手指的关节褶皱显得不够自然。其次,纸上镂空的「乐」字笔画边缘过于平滑,缺乏手工剪纸应有的物理质感,且字体结构略显僵硬。最显著的逻辑错误在于,2026年按照中国农历应为马年,虽然画面中出现了马的元素,但这种跨时空的预设通常是 AI 逻辑生成的产物。此外,纸张边缘与背景的衔接处过于锐利,缺乏真实的光影遮挡关系。

图中展示了一只左手拿着一张青蓝色手工纸,背景是银装素裹的冬日湖景。这张纸的中心被镂空剪出了一个简体汉字「乐」,透过镂空处可以看到远方雪地中的石桥和行人。纸张的右下角印有红色的数字「2026」以及一匹奔跑的红马剪影。背景的湖面和远山笼罩在淡蓝色的冷调中,构图采用了前景聚焦、背景虚化的手法。

画面中存在明显的 AI 生成缺陷:首先,手持纸张的左手大拇指比例异常,指甲形状模糊,且手指的关节褶皱显得不够自然。其次,纸上镂空的「乐」字笔画边缘过于平滑,缺乏手工剪纸应有的物理质感,且字体结构略显僵硬。最显著的逻辑错误在于,2026年按照中国农历应为马年,虽然画面中出现了马的元素,但这种跨时空的预设通常是 AI 逻辑生成的产物。此外,纸张边缘与背景的衔接处过于锐利,缺乏真实的光影遮挡关系。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像对提示词的完成度极高,几乎所有关键要求均得到满足:手持青色宣纸质感卡片、镂空「乐」字透视雪景、红色「2026」与马剪影、清冷雅致的整体色调,以及写实摄影风格均表现出色。宣纸纹理的细腻程度和三层空间层次的处理是本图最突出的亮点。主要不足在于断桥的标志性特征辨识度略低,以及镂空边缘的物理光学细节稍显不足,但这些均属于细节层面的瑕疵,不影响整体高完成度的判断。综合评分处于优秀区间。 【GEMINI】这是一张在材质表现和氛围营造上非常出色的作品,但在核心文字生成和人体解剖结构上暴露了目前AI模型的典型弱点。如果能修正汉字结构和手部细节,这将是一张高质量的商业摄影级作品。 【KIMI】该图像在概念执行上接近提示词要求,但在空间逻辑与材质真实性上暴露明显的AI生成痕迹。最核心的失败在于「镂空透视」这一关键创意点的技术实现——模型未能理解「透过镂空看到的景物应与背景形成连续空间」这一物理规则,导致画面呈现拼贴感而非真实摄影的景深关系。色调把控尚可,但细节纹理的机械化问题显著。整体属于「概念及格、执行瑕疵」的中等偏下水准。

困难难度评测结果

  • 得分:77.7 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只左手拿着一张青蓝色手工纸,背景是银装素裹的西湖雪景。这张纸的中心被镂空剪出了一个简体汉字「乐」,通过镂空的部分,可以清晰地看到远方横跨在湖面上的断桥残雪景观。纸张下方印有一个红色的方形印章,里面包含数字「2026」和一匹奔马的图案。背景中的湖水呈现淡灰色,远处有模糊的古建筑和游船,整体色调清冷而宁静。 在 AI 生成的细节方面,存在明显的逻辑错误:首先,2026 年在农历中应为马年,但画面中的红色印章图案虽然是马,却与当前的年份背景不符。其次,手部细节略显生硬,大拇指的指甲形状和边缘处理不够自然。最显著的缺陷在于镂空的「乐」字,其笔画边缘有不自然的撕裂感,且镂空透出的背景桥梁与周围环境的透视关系略有错位,看起来更像是贴上去的图层而非真实的视觉穿透。

图中展示了一只左手拿着一张青蓝色手工纸,背景是银装素裹的西湖雪景。这张纸的中心被镂空剪出了一个简体汉字「乐」,通过镂空的部分,可以清晰地看到远方横跨在湖面上的断桥残雪景观。纸张下方印有一个红色的方形印章,里面包含数字「2026」和一匹奔马的图案。背景中的湖水呈现淡灰色,远处有模糊的古建筑和游船,整体色调清冷而宁静。

在 AI 生成的细节方面,存在明显的逻辑错误:首先,2026 年在农历中应为马年,但画面中的红色印章图案虽然是马,却与当前的年份背景不符。其次,手部细节略显生硬,大拇指的指甲形状和边缘处理不够自然。最显著的缺陷在于镂空的「乐」字,其笔画边缘有不自然的撕裂感,且镂空透出的背景桥梁与周围环境的透视关系略有错位,看起来更像是贴上去的图层而非真实的视觉穿透。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张AI生成图像整体完成度较高,成功呈现了第一人称手持青色宣纸卡片、背景西湖雪景的核心构图意图,色调清冷优雅,整体视觉质感接近写实摄影风格。主要短板集中在两个核心技术细节:其一是镂空「乐」字边缘缺乏提示词明确要求的宣纸刻切断面质感,这是最显著的未达标项;其二是镂空内透视到的断桥以银色金属装饰感呈现,与「透过镂空看到真实雪景」的物理逻辑存在偏差。卡片表面光泽反射也略显不足。综合来看,图像在构图、色调、整体氛围上表现优秀,但在提示词最核心考察的「镂空质感」与「透视物理合理性」两个技术难点上未能完全达到要求,属于基本完成但有明显瑕疵的水准。 【GEMINI】该图像在氛围营造和色彩控制上表现出色,成功传达了预期的视觉意境。但在物理光学逻辑和材质细节表现上存在明显短板,尤其是镂空区域的景深处理和卡片材质的真实感未能达到写实摄影的标准,导致整体的‘真实感’大打折扣。 【KIMI】该图像完成了提示词的核心构图意图,但在材质细节与物理光学层面存在显著缺陷。最致命的问题在于「乐」字镂空边缘完全缺乏宣纸刻切的断面质感,这是提示词明确要求的「精细刻切」效果,目前呈现仅为普通镂空蒙版。卡片表面的光泽反射、镂空与背景的亮度差异等光学细节均未达标。整体属于「概念可见、执行粗糙」的AI生成典型特征,材质真实性与光学合理性是主要扣分项。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...