Google: Gemini 2.5 Flash Image (Nano Banana) 在「热带海岛日落镂空旺字卡片生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:Google: Gemini 2.5 Flash Image (Nano Banana)
  • 用例名称:热带海岛日落镂空旺字卡片生成
  • 测试类型:图像生成
  • 评测维度:VG-FramedPerspective

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张写实摄影风格的图像:第一人称视角,一只手拿着一张半透明磨砂亚克力卡片,卡片中心镂空刻有汉字「旺」。透过镂空部分可以看到远处的椰林、沙滩和紫色日落海景。整体色彩高饱和度。

任务要求

AI 模型需要满足以下要求:

  1. 画面呈现第一人称视角,有手持卡片的构图
  2. 卡片材质体现半透明磨砂亚克力质感
  3. 卡片中心有清晰可辨的镂空汉字「旺」
  4. 透过镂空部分可见椰林、沙滩与日落海景
  5. 整体色彩饱和度高,画面清晰

评测结果

综合得分

该模型在此用例的得分为:70.8 分(满分 100 分),已通过

基础难度评测结果

  • 得分:70.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一幅在热带海滩日落时分拍摄的特写画面。一只手正拿着一张半透明的磨砂质感方卡片,卡片中心镂空刻有一个复杂的汉字,夕阳的光芒正好透过这个文字中心射出。背景是深紫红色和橙色交织的晚霞,远处有模糊的椰子树剪影和宁静的海面,整体色调温馨而梦幻。 画面中存在明显的 AI 生成缺陷:首先,卡片上的汉字并非标准汉字,而是由类似“贝”字旁和“者”字组成的臆造字,笔画结构扭曲且不符合书写逻辑。其次,左下角持卡片的手部结构异常,大拇指的指甲形状不自然,且食指与卡片的接触位置缺乏合理的物理支撑感,手指的关节褶皱也显得较为模糊和生硬。此外,透过卡片看到的夕阳光晕与背景的自然光衔接略显突兀。

图中展示了一幅在热带海滩日落时分拍摄的特写画面。一只手正拿着一张半透明的磨砂质感方卡片,卡片中心镂空刻有一个复杂的汉字,夕阳的光芒正好透过这个文字中心射出。背景是深紫红色和橙色交织的晚霞,远处有模糊的椰子树剪影和宁静的海面,整体色调温馨而梦幻。

画面中存在明显的 AI 生成缺陷:首先,卡片上的汉字并非标准汉字,而是由类似“贝”字旁和“者”字组成的臆造字,笔画结构扭曲且不符合书写逻辑。其次,左下角持卡片的手部结构异常,大拇指的指甲形状不自然,且食指与卡片的接触位置缺乏合理的物理支撑感,手指的关节褶皱也显得较为模糊和生硬。此外,透过卡片看到的夕阳光晕与背景的自然光衔接略显突兀。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】图像在构图、色彩和整体氛围上表现良好,手持磨砂卡片的场景基本成立。然而最致命的缺陷是镂空汉字生成错误——「旺」字被替换为结构完全不同的字形(类似「赌」),这是对提示词核心要求的直接违背。镂空透视效果虽有日落光晕透出,但椰林沙滩景物细节不足。综合来看,场景氛围分较高,但文字准确性的失败严重拉低了整体评分。 【GEMINI】图像在材质渲染和色彩氛围上表现优异,但在核心指令的逻辑理解上出现了重大失误。最致命的问题在于未能实现「镂空」效果,且汉字生成完全错误,这直接导致了图像在功能性描述上的失败。 【KIMI】这是一张在美学表象上具有吸引力的图像,但在核心任务上彻底失败——将「旺」字错生成为「赌」字,这一错误性质极为严重,不仅违背提示词,更在文化语义上造成完全相反的表达(吉祥寓意变为赌博暗示)。材质与透视的技术表现虽有可圈可点之处,但无法弥补根本性内容错误。作为AI图像生成质量测试,该结果暴露了模型在中文语义理解与文字生成上的重大缺陷。

进阶难度评测结果

  • 得分:70.0 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只左手拿着一张半透明磨砂质感的卡片,背景是落日余晖下的海滩与椰子树林。画面色调以柔和的紫色、粉色和橙色为主,营造出宁静的黄昏氛围。卡片中心有一个镂空的艺术字体,其形状像是一个变形的汉字“峭”或“哨”,镂空处透出了背景中的两棵椰子树和金色的夕阳。卡片下方印有数字“2026”以及一个奔马的剪影图标。 作为一张 AI 生成的图片,画面存在明显的逻辑缺陷:首先,卡片中心的镂空汉字结构并不规范,属于无法准确辨认的错字;其次,左侧手部的持握姿势略显生硬,大拇指与食指捏住卡片边缘的方式在透视上有些不自然;此外,卡片右下角的马形图标边缘略显模糊,与整体精致的磨砂质感不完全匹配。背景中的椰子树呈现出梦幻的虚化效果,增强了画面的纵深感。

图中展示了一只左手拿着一张半透明磨砂质感的卡片,背景是落日余晖下的海滩与椰子树林。画面色调以柔和的紫色、粉色和橙色为主,营造出宁静的黄昏氛围。卡片中心有一个镂空的艺术字体,其形状像是一个变形的汉字“峭”或“哨”,镂空处透出了背景中的两棵椰子树和金色的夕阳。卡片下方印有数字“2026”以及一个奔马的剪影图标。

作为一张 AI 生成的图片,画面存在明显的逻辑缺陷:首先,卡片中心的镂空汉字结构并不规范,属于无法准确辨认的错字;其次,左侧手部的持握姿势略显生硬,大拇指与食指捏住卡片边缘的方式在透视上有些不自然;此外,卡片右下角的马形图标边缘略显模糊,与整体精致的磨砂质感不完全匹配。背景中的椰子树呈现出梦幻的虚化效果,增强了画面的纵深感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张AI生成图像在氛围营造和摄影质感方面表现优秀,背景的紫粉色日落Bokeh效果堪称亮点。然而,最致命的问题是镂空汉字字形错误——生成的是「靖」而非提示词要求的「旺」,这是对核心要求的直接失败。此外,文字颜色偏差(灰紫而非白色)也是明显瑕疵。综合来看,图像在视觉美感上有相当水准,但在关键文字内容的准确性上存在根本性错误,导致整体评分被显著拉低。 【GEMINI】图像在氛围营造和材质模拟上表现出较高的审美水准,但在核心的文字处理和物理逻辑(镂空)上出现了严重的模型幻觉。尤其是汉字「旺」的错误生成和底部图案的崩坏,极大地削弱了图像的专业度。 【KIMI】该图像在视觉表层具备一定吸引力,但在核心语义层面出现致命错误——将「旺」字替换为「晴」字,直接违背了提示词的最基本要求。此外,文字颜色、图案清晰度等细节也与提示词存在明显偏差。模型似乎在处理汉字语义时出现了理解偏差或生成失控,这在需要精确文字内容的场景下是不可接受的。建议加强模型对中文汉字的准确生成能力,以及提示词与输出内容的严格对齐机制。

困难难度评测结果

  • 得分:73.0 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只左手拿着一张半透明磨砂质感的卡片,背景是落日余晖下的海滩。画面色调以温暖的橙黄色和柔和的紫色为主,远处可见模糊的椰子树剪影和波光粼粼的海面。卡片中心有一个镂空的汉字,形似“晴”字,透过镂空可以看到背景中清晰的椰林与夕阳。卡片下方印有数字“2026”,右下角有一个奔马的剪影图案。 在 AI 生成的细节方面,存在明显的逻辑和结构缺陷。首先,卡片中心的汉字结构扭曲,笔画之间缺乏正确的连接,呈现出一种无意义的符号感。其次,持卡的手部比例失调,大拇指的指甲形状异常,且手指与卡片接触的边缘显得模糊、不自然。此外,卡片右下角的马匹剪影线条生硬,缺乏动态美感。整体构图虽然意境优美,但细节处的文字和人体结构错误揭示了其 AI 生成的本质。

图中展示了一只左手拿着一张半透明磨砂质感的卡片,背景是落日余晖下的海滩。画面色调以温暖的橙黄色和柔和的紫色为主,远处可见模糊的椰子树剪影和波光粼粼的海面。卡片中心有一个镂空的汉字,形似“晴”字,透过镂空可以看到背景中清晰的椰林与夕阳。卡片下方印有数字“2026”,右下角有一个奔马的剪影图案。

在 AI 生成的细节方面,存在明显的逻辑和结构缺陷。首先,卡片中心的汉字结构扭曲,笔画之间缺乏正确的连接,呈现出一种无意义的符号感。其次,持卡的手部比例失调,大拇指的指甲形状异常,且手指与卡片接触的边缘显得模糊、不自然。此外,卡片右下角的马匹剪影线条生硬,缺乏动态美感。整体构图虽然意境优美,但细节处的文字和人体结构错误揭示了其 AI 生成的本质。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像基本完成了提示词的核心构图要求,日落海边氛围、手持卡片视角、镂空透景效果均有呈现,整体视觉效果具有一定吸引力。但在关键技术细节上存在明显短板:最突出的问题是镂空「旺」字字形失真,辨识度不足;其次是卡片半透明感表现不到位,磨砂亚克力的核心材质特征——半透明性——未能充分体现;rim light边缘透光效果几乎缺失。综合来看,图像属于「基本完成但有多处明显瑕疵」的水平,在材质物理真实性和镂空精度上有较大提升空间。 【GEMINI】这是一张『远看有氛围,近看全是坑』的AI生成图。虽然背景的色彩和光影氛围营造得相当不错,但作为核心主体的卡片,在文字准确性、透视逻辑和物理材质表现上均有重大失误。特别是汉字『旺』的生成完全不可用,直接导致了作品的实用性归零。对于需要精准控制图文内容的商业设计场景,该结果完全不合格。 【KIMI】该图像在氛围营造上有一定基础,但在核心技术要求上存在多处明显缺陷。镂空透视的连续性失败是最严重的问题,直接违背了提示词「精准框取」与「视觉对齐」的核心意图。材质的高级质感(rim light、边缘折射、油墨哑光感)均未达标,显示模型对半透明介质与印刷工艺的理解仍停留在表面。奔马剪影与白色油墨的色彩偏差属于低级错误。整体处于「部分完成要求」的水平,建议针对镂空区域的透视一致性与材质光学特性进行专项优化。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...