Google: Gemini 2.5 Flash Image (Nano Banana) 在「双物体属性」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:Google: Gemini 2.5 Flash Image (Nano Banana)
- 用例名称:双物体属性
- 测试类型:图像生成
- 评测维度:属性绑定
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张图片:一个红色的圆和一个蓝色的正方形 要求: - 圆是红色的 - 正方形是蓝色的 - 不要搞混颜色
任务要求
AI 模型需要满足以下要求:
- 图像中必须包含一个圆形,且该圆形整体呈红色,颜色纯正、覆盖完整
- 图像中必须包含一个正方形,且该正方形整体呈蓝色,颜色纯正、覆盖完整
- 红色与蓝色不得混淆:红色仅属于圆形,蓝色仅属于正方形,不得出现颜色错位或交叉
- 圆形轮廓需清晰闭合、无明显变形;正方形四边平直、四角分明,两个形状均需清晰可辨
- 图像中有且仅有上述两个几何形状,不得出现多余的物体或干扰性几何元素
评测结果
综合得分
该模型在此用例的得分为:90.5 分(满分 100 分),已通过
基础难度评测结果
- 得分:90.5 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一个极简主义风格的几何构图,背景是带有细微纹理的纯白色平面。画面中央偏右的位置有一个深蓝色的正方形,其表面呈现出细腻的磨砂金属质感。在这个蓝色正方形的左前方,叠放着一个深红色的圆形,圆形的直径略小于正方形的边长。光线似乎从右上方照射下来,使得红色圆形在左侧投射出一道柔和的弧形阴影,而蓝色正方形的左侧和底部也带有淡淡的投影,增强了物体的立体感。画面右下角有一块模糊的深色阴影,像是某种物体遮挡光线形成的自然投影。作为一张 AI 生成的图片,其几何边缘非常锐利,但在透视上存在细微的逻辑矛盾:红色圆形的阴影方向与右下角的大面积阴影来源似乎并不完全一致,且蓝色正方形的左下角边缘与红色圆形的交界处显得过于生硬,缺乏自然的物理接触感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】图像基本完成了提示词的核心要求——红色圆形与蓝色正方形均清晰呈现,颜色属性绑定准确无误。主要扣分点集中在:圆形颜色偏暗红而非纯正红、两形状重叠导致圆形轮廓不完整、以及未要求的投影效果带来额外视觉元素。这些问题不影响核心语义的传达,但在严格的几何形状测试场景下,形状的完整独立呈现和颜色的纯正度本应更精确。综合来看属于「基本完成要求,存在少量可改进细节」的水平。 【GEMINI】该图像在属性绑定和内容完整性方面表现优异,准确执行了颜色与形状的对应关系。然而,作为核心测试点的「正方形」在几何准确性上出现了明显失误,右侧线条的倾斜导致其不再是一个标准正方形,这在严苛的几何图形生成测试中是不可忽视的缺陷。 【KIMI】该图像成功完成了提示词的核心测试目标——验证两个物体各自的属性绑定。红色与蓝色、圆形与正方形的对应关系准确无误,无任何颜色混淆。形状几何特征基本准确,虽存在因光影导致的边缘清晰度轻微损失,但未影响形状的本质辨识。整体而言,这是一张完成度很高的属性绑定测试图像,模型在基础几何与颜色对应任务上表现可靠。
进阶难度评测结果
- 得分:89.1 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一位年轻女性在充满欧洲风情的古镇街道上漫步。她身穿一件鲜艳的深红色吊带连衣长裙,头戴一顶宽大的蓝色遮阳草帽,斜挎着一个橄榄绿色的皮质小包。她面带灿烂的笑容,侧头望向画面左侧,右手自然下垂,左手轻轻提起裙摆,呈现出轻盈愉悦的状态。背景是狭长的石砖街道,两旁矗立着米黄色的石材建筑,阳台上点缀着红花,远处有几位模糊的行人,阳光洒满街道,营造出温暖的夏日午后氛围。 在 AI 生成细节方面,画面存在几处明显的逻辑缺陷:首先,女性左手提起裙摆的动作显得非常生硬,手指与布料的融合处模糊不清,缺乏真实的抓握感;其次,她斜挎包的肩带在左肩处凭空消失,并未连接到包身,且肩带的透视关系与身体结构不符;最后,背景中行人的面部特征和肢体轮廓显得扭曲且不自然,尤其是最左侧行人的腿部线条存在明显的断裂感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像高质量地完成了提示词的核心要求:红色连衣裙、蓝色帽子、绿色包三件物品颜色属性绑定准确,物体完整清晰,归属关系明确。图像整体质量达到商业摄影水准,人物自然,场景协调。唯一可挑剔之处在于帽子颜色略偏青蓝而非纯蓝,连衣裙为深酒红而非鲜红,但均在合理色彩范畴内。综合来看,这是一张高度符合提示词要求、视觉质量优秀的AI生成图像。 【GEMINI】该图像在颜色属性绑定上表现优异,完美达成了红裙、蓝帽、绿包的色彩组合要求。然而,在物体完整性与图像忠实度方面存在典型 AI 瑕疵:手部解剖结构错误严重,且包的携带方式(斜挎而非手拿)及包带的物理逻辑存在明显破绽,拉低了整体的专业质感。 【KIMI】该图像成功完成了提示词的核心要求:一名女孩同时穿着红色连衣裙、戴着蓝色帽子、拿着绿色包。三件物品颜色绑定准确,形态完整,空间关系符合常识。虽在苛刻标准下可挑剔包的颜色偏向橄榄绿、帽子带有装饰花纹,但整体而言是一次高质量的生成结果。背景欧洲街道场景增添了画面氛围,但未干扰主体识别。
困难难度评测结果
- 得分:94.6 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了五个色彩鲜艳的气球,在晴朗明亮的蓝色天空背景下呈横向排列。气球的颜色从左到右依次为:一个大红色、一个小红色、一个大蓝色、一个小蓝色以及一个绿色的气球。每个气球下方都垂下一条细长的白色线条,笔直地延伸向画面底部,仿佛被固定在下方不可见的位置。阳光从左侧照射,在气球表面形成了柔和的高光。天空呈现出纯净的浅蓝色,底部带有几抹淡淡的白色云影。 画面中存在明显的 AI 生成缺陷:首先,气球下方的白色线条呈现出不自然的笔直状态,且线条与气球底部的连接处缺乏真实的物理褶皱或结扣感;其次,最右侧的绿色气球形状略显不规则,底部收口处呈现出尖锐且生硬的黑色块,与真实气球的质感不符;此外,气球的大小比例分布较为随意,缺乏透视上的逻辑关联,整体构图显得有些机械和僵硬。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像高质量地完成了提示词的全部核心要求:5个气球数量准确,颜色属性绑定无误,左右排列顺序严格符合规范,大/小/中等尺寸差异清晰可辨。唯一轻微瑕疵是第5个绿色气球的「中等」尺寸定位略偏大,与小气球的比例差距稍显不足,但不影响整体判断。这是一张接近满分的高质量生成图像,属性绑定测试表现优异。 【GEMINI】这是一张在属性绑定和逻辑排列上表现优异的生成图像。模型准确理解了复杂的「颜色+大小+顺序」组合指令。唯一的遗憾在于对「中等」这一相对概念的尺度把握稍显粗糙,导致其与「大」气球的视觉区分度不够显著,但在功能性测试中已属于高水准作品。 【KIMI】该图像在核心要求上表现优异,颜色绑定、数量顺序、水平排列均完美达标。唯一瑕疵在于「中等」尺寸的执行偏差——绿色气球被放大至「大」的规格,导致大小层级仅有「大/小」两档而非预期的三档。此问题属于对提示词中「中等」这一相对概念的语义理解不足,而非技术缺陷。整体而言,这是一张高质量完成提示词要求的生成图像。
相关链接
您可以通过以下链接查看更多相关内容: