Google: Gemini 3.1 Flash Image Preview (Nano Banana 2) 在「七个物体」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:Google: Gemini 3.1 Flash Image Preview (Nano Banana 2)
  • 用例名称:七个物体
  • 测试类型:图像生成
  • 评测维度:数量控制

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张图片:桌面上整齐排列着七个红色苹果,每个苹果大小相似,形状饱满,表面光滑有光泽。苹果排成一排,从左到右依次排列。白色桌面,简洁背景,自然光照。

任务要求

AI 模型需要满足以下要求:

  1. 图像中红色苹果的数量必须严格为七个,每个苹果个体边界清晰,可独立辨认,不得因遮挡或重叠导致数量歧义
  2. 七个苹果须从左到右排成水平一排,间距均匀,不得出现多行、散乱或明显弯曲排列
  3. 每个苹果大小相近,形状饱满圆润,颜色鲜红,表面具有光泽高光效果
  4. 桌面为白色,背景简洁无杂乱元素,采用自然光照,整体画面干净清晰

评测结果

综合得分

该模型在此用例的得分为:91.8 分(满分 100 分),已通过

基础难度评测结果

  • 得分:91.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中,七个鲜红的苹果在白色平坦的桌面上横向排成一排。背景是极简主义风格的室内环境,墙壁和窗框均为纯白色,光线柔和且均匀,营造出一种干净、明亮的氛围。这些苹果色泽红润,表面带有细小的浅色斑点,顶部的果柄短小。构图上采用了水平视角,苹果位于画面的中景位置,前景和背景都有适度的虚化,使视觉重心集中在水果本身。 在 AI 生成的细节方面,存在一些明显的逻辑缺陷:首先,最左侧和最右侧的两个苹果在桌面上没有留下任何阴影,看起来像是悬浮或粘贴在背景上,与中间苹果自然的投影形成对比。其次,从左数第四个和第五个苹果的接触位置显得非常生硬,边缘融合不自然。此外,桌面的边缘线条在最左侧略显模糊且透视关系不够严谨,与背景窗台的衔接处也显得有些生硬。

画面中,七个鲜红的苹果在白色平坦的桌面上横向排成一排。背景是极简主义风格的室内环境,墙壁和窗框均为纯白色,光线柔和且均匀,营造出一种干净、明亮的氛围。这些苹果色泽红润,表面带有细小的浅色斑点,顶部的果柄短小。构图上采用了水平视角,苹果位于画面的中景位置,前景和背景都有适度的虚化,使视觉重心集中在水果本身。

在 AI 生成的细节方面,存在一些明显的逻辑缺陷:首先,最左侧和最右侧的两个苹果在桌面上没有留下任何阴影,看起来像是悬浮或粘贴在背景上,与中间苹果自然的投影形成对比。其次,从左数第四个和第五个苹果的接触位置显得非常生硬,边缘融合不自然。此外,桌面的边缘线条在最左侧略显模糊且透视关系不够严谨,与背景窗台的衔接处也显得有些生硬。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像高质量地完成了提示词的核心要求:七个红色苹果数量精准、排列整齐、外观属性符合描述、背景环境简洁自然。最主要的瑕疵是最右侧苹果被画面边缘轻微裁切,以及苹果间距均匀性略有不足。整体而言这是一张执行度很高的图像,核心测试目标「处理七个物体」完成得相当出色,属于高分作品。 【GEMINI】这是一张高质量的 AI 生成图像,精准地完成了提示词中关于数量、排列和属性的所有核心要求。在处理多个重复物体时表现出了极高的稳定性,光影和材质处理达到了专业摄影水准,仅在构图的绝对对称性和边缘几何形状上存在极细微的提升空间。 【KIMI】该图像在核心任务「七个苹果整齐排列」上基本完成,数量准确无误。但在「整齐」与「相似」的精细要求上存在可挑剔之处:间距微差、排列微弯、颜色一致性不足。作为AI生成图像,属于中等偏上水平,但距离摄影级真实感仍有差距,尤其在果实个体特征的有机差异性表现上略显机械重复。

进阶难度评测结果

  • 得分:76.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一幅壮丽的山间星空夜景。画面上半部分是深蓝色的夜空,繁星点点,银河的淡淡光影斜贯其中。最引人注目的是天空中排列成类似“北斗七星”形状的七颗巨大且明亮的恒星,它们带有明显的十字星芒。画面下半部分是连绵起伏的深色群山,山谷间有一条蜿蜒的河流,河岸散落着微弱的灯火。右下角有一名摄影师正站在山顶,架起三脚架拍摄这片星空。 作为一张 AI 生成的图片,画面存在明显的逻辑和透视缺陷:首先,天空中那七颗巨大的星辰在比例上极不真实,且其排列形状虽然模仿北斗七星,但角度和结构与真实星象不符。其次,右下角摄影师的人影与三脚架的线条显得有些生硬,与脚下的岩石融合得不够自然。此外,远方山谷中的灯光亮度分布不均,缺乏真实的透视感。

图中展示了一幅壮丽的山间星空夜景。画面上半部分是深蓝色的夜空,繁星点点,银河的淡淡光影斜贯其中。最引人注目的是天空中排列成类似“北斗七星”形状的七颗巨大且明亮的恒星,它们带有明显的十字星芒。画面下半部分是连绵起伏的深色群山,山谷间有一条蜿蜒的河流,河岸散落着微弱的灯火。右下角有一名摄影师正站在山顶,架起三脚架拍摄这片星空。

作为一张 AI 生成的图片,画面存在明显的逻辑和透视缺陷:首先,天空中那七颗巨大的星辰在比例上极不真实,且其排列形状虽然模仿北斗七星,但角度和结构与真实星象不符。其次,右下角摄影师的人影与三脚架的线条显得有些生硬,与脚下的岩石融合得不够自然。此外,远方山谷中的灯光亮度分布不均,缺乏真实的透视感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】图像在数量控制(7颗)和视觉氛围营造上表现优秀,星星的光芒效果、背景色调、山脉云雾等元素均高度符合提示词描述。然而核心考察点——北斗七星的空间拓扑形态——存在明显失误:斗身四星未能构成矩形,整体星座轮廓偏离经典勺子形状,这是本次测试「处理七个物体空间关系」的关键失分项。图像更像是7颗随机分布的亮星,而非严格遵循北斗七星天文形态的星座图。 【GEMINI】该模型在执行「定量」指令上表现完美,准确生成了 7 颗核心元素。但在「空间布局」这一高级语义理解上出现偏差,未能还原北斗七星标志性的天文排列结构,将勺柄方向搞反,导致形似而神不似。视觉表现力方面达到了专业摄影水准。 【KIMI】该图像在氛围营造与摄影质感上表现专业,但作为「北斗七星」主题创作存在根本性失败:数量缺1颗,结构完全错误。6颗星的排列无法对应任何已知星座形态,属于典型的「形似天文摄影,实则星座乱序」的AI生成缺陷。若作为商业星空摄影作品可接受,作为提示词要求的「北斗七星」示意图则不合格。

困难难度评测结果

  • 得分:77.4 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展现了一幅宁静的中式园林夏日景观。画面前景是清澈的池塘,几朵粉红色的荷花竞相绽放,花瓣娇艳欲滴,中心点缀着金黄色的花蕊,周围簇拥着翠绿宽大的荷叶。中景处有一座古色古香的木质凉亭和蜿蜒的走廊,灰瓦飞檐,展现出典型的江南建筑风格。背景中,一座小巧的石拱桥横跨水面,四周环绕着郁郁葱葱的垂柳和绿植,阳光明媚,倒影在水面上清晰可见。 作为一张 AI 生成的图片,画面存在一些明显的逻辑缺陷:右侧凉亭的柱子与石拱桥的连接处结构模糊,透视关系显得生硬;部分荷花的茎部在水面下的折射效果缺失,看起来像是直接悬浮在水面上;此外,远处的走廊内部细节略显混乱,木质结构的交接处不够严谨,缺乏真实的建筑物理支撑感。

图中展现了一幅宁静的中式园林夏日景观。画面前景是清澈的池塘,几朵粉红色的荷花竞相绽放,花瓣娇艳欲滴,中心点缀着金黄色的花蕊,周围簇拥着翠绿宽大的荷叶。中景处有一座古色古香的木质凉亭和蜿蜒的走廊,灰瓦飞檐,展现出典型的江南建筑风格。背景中,一座小巧的石拱桥横跨水面,四周环绕着郁郁葱葱的垂柳和绿植,阳光明媚,倒影在水面上清晰可见。

作为一张 AI 生成的图片,画面存在一些明显的逻辑缺陷:右侧凉亭的柱子与石拱桥的连接处结构模糊,透视关系显得生硬;部分荷花的茎部在水面下的折射效果缺失,看起来像是直接悬浮在水面上;此外,远处的走廊内部细节略显混乱,木质结构的交接处不够严谨,缺乏真实的建筑物理支撑感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在视觉质量、空间层次和开放阶段多样性方面表现优秀,中式园林氛围营造到位。然而,最核心的测试目标——精确生成七朵荷花——未能达标,实际数量超出要求约1-2朵,主要问题集中在右侧区域的荷花数量控制失准。这一数量精确性问题在权重50%的核心维度上造成明显扣分,反映出AI模型在严格数量控制方面仍存在局限性。 【GEMINI】这是一张视觉效果极佳但逻辑严谨性不足的作品。模型在理解「多样化开放程度」和「空间层次」上表现出极高的审美水准,但在执行「精确数量控制」这一硬性指令时出现了偏差(多出一朵)。此外,AI 在处理复杂遮挡关系(茎叶穿插)时仍存在典型的像素坍塌问题。作为艺术创作是合格的,作为精准控图测试则存在明显失分点。 【KIMI】该图像在视觉表象上具有吸引力,但严格对照提示词要求后,核心指标多处失守。数量维度勉强达标但存在复制粘贴嫌疑;阶段多样性维度完全失败,仅呈现二元分布而非连续变化;空间布局虽有层次但分布失衡。作为「测试模型处理七个物体」的任务,模型未能展现对「七个独立个体差异化生成」的掌控能力,而是采用了「复制相似形态+简单位移」的偷懒策略。视觉质量维度的较高得分无法弥补功能性要求的缺失,整体属于「看起来不错但经不起细究」的典型AI生成图像。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...