Google: Gemini 3.1 Flash Image Preview (Nano Banana 2) 在「交通工具」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：Google: Gemini 3.1 Flash Image Preview (Nano Banana 2)
用例名称：交通工具
测试类型：图像生成
评测维度：物体生成

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一张图片：一辆红色的轿车要求： - 现代轿车造型 - 红色车身 - 侧视角度

任务要求

AI 模型需要满足以下要求：

生成主体为现代轿车（四门或两厢轿车造型），车身整体轮廓清晰完整
车身颜色为鲜明的红色（正红/中国红范围），颜色饱和度充足，不可偏向橙色、粉色或深棕色
视角为标准侧视角（车辆左侧或右侧90°方向），需同时可见前后两个车轮
车身结构符合现代轿车规范，包括合理的车身比例、可识别的车窗、车门及轮毂细节
背景简洁（纯色或浅色地面），不遮挡或干扰车辆主体的展示

评测结果

综合得分

该模型在此用例的得分为：81.5 分（满分 100 分），已通过

基础难度评测结果

得分：81.5 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一辆亮红色的轿车正行驶在蜿蜒的海滨公路上。车辆占据了画面中心，车身线条流畅，在阳光下闪烁着金属质感。背景是壮丽的海岸线，左侧是碧蓝的大海和拍打着沙滩的白色浪花，右侧则是郁郁葱葱的山坡和远处的车流。构图采用了侧拍视角，呈现出一种动态的行驶感。然而，画面中存在多处明显的 AI 生成缺陷：首先，车辆的轮毂结构异常，辐条分布不均且中心标志模糊；其次，车窗内的驾驶员形象非常模糊，且方向盘的位置与人体比例不协调；最显著的错误在于车身后部的油箱盖，它被放置在了一个极高的位置，且形状与车身线条融合得非常生硬。此外，远景中的车流呈现出扭曲的色块，缺乏真实的细节。整体光影虽然亮丽，但在车底阴影和路面接缝处显得不够自然。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这张图像在语义匹配的核心三要素（轿车类型、红色车身、侧视角度）上表现优秀，车身结构与图像质量均达到高水准。主要失分点集中在背景处理上——复杂的海岸公路场景明显偏离提示词「背景简洁」的要求，使图像更接近商业宣传摄影风格而非标准的车辆展示图。若背景替换为纯色或简洁地面，该图像可轻松达到90分以上。【GEMINI】这是一张视觉冲击力很强的作品，准确捕捉了红色轿车的动态美感。但在挑剔的专业视角下，车身细节的结构逻辑漏洞（如门把手缺失和饰条畸变）拉低了整体评分。虽然背景美观，但未能遵守提示词中对简洁背景的特定要求。【KIMI】该图像在车辆主体呈现上具备基础完成度，但作为「严格按提示词生成」的评审对象，背景违规构成致命伤——提示词明确要求「纯色或浅色地面」，而模型输出了复杂的商业摄影风格海岸场景，这是典型的「过度发挥」错误。此外，车窗材质、轮毂结构及接地阴影等问题反映出AI在物理一致性上的固有缺陷。若作为汽车广告素材尚可接受，但作为提示词忠实度的测试样本，其背景失控与多处结构瑕疵导致评分处于及格线边缘。

进阶难度评测结果

得分：83.3 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展现了一座古色古香的中式园林景观。画面中心是一座宏伟的三层重檐八角亭，名为“醉月亭”，亭顶铺设青绿色琉璃瓦，飞檐翘角，朱红色的柱子上刻有金色对联。亭子前方是一座平直的石桥，跨越在清澈的池塘之上，池中倒映着亭台与绿植。一名身着淡雅汉服的女子正背对着镜头走在石桥上。背景中点缀着错落有致的假山、翠绿的垂柳和茂密的树丛，右侧可见一处带有月亮门的白墙建筑。整体色调清新自然，充满宁静的意境。在 AI 生成的细节方面，存在一些明显的逻辑缺陷：亭子顶部的结构过于复杂且略显扭曲，瓦片的排列在边缘处不够自然；亭柱上的金色文字模糊不清，无法辨认；石桥的护栏在连接处显得生硬，缺乏真实的建筑衔接感；此外，水面上的倒影与实物的透视关系略有偏差，部分假山的纹理显得过于破碎且不符合自然岩石的构造。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这是一张高完成度的中国古典园林亭子图像，对提示词五项关键要求的满足率达到100%，场景元素丰富且空间逻辑合理。画面质量达到写实摄影级别，水面倒影、石材质感、植被层次均有出色表现。主要扣分点集中在牌匾文字顺序错误这一细节问题上，暴露了AI在中文文字方向处理上的固有缺陷。整体而言，这是一张接近优秀的AI生成图像，若非文字错误，可达满分区间。【GEMINI】这是一张在第一眼视觉上非常符合提示词要求的作品，但在专业建筑摄影和设计视角下经不起推敲。语义对齐度极高，准确捕捉了所有核心元素。然而，AI 在处理复杂中式古建筑的榫卯、斗拱及屋面逻辑时出现了明显的结构性坍塌，文字匾额的崩坏也是典型的质量短板。整体属于「形似而神散」的生成结果。【KIMI】该图像在视觉表现力上达到较高水准，色彩与材质细节的处理展现了AI生成图像的优势。然而作为「中国古典园林亭子」的命题作文，建筑结构的合规性存在明显硬伤——尤其是亭内实心封闭的结构错误，以及飞檐翘角的过度装饰化处理，反映出AI对中国传统建筑形制的理解仍停留在表面符号拼贴层面，未能把握「亭」作为开敞空间载体的本质特征。人物元素的添加虽丰富了画面叙事，却引入了额外的比例与光影一致性问题。综合而言，这是一张「好看但不对」的图像，适合作为风景壁纸，但经不起建筑专业视角的审视。

困难难度评测结果

得分：85.6 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

画面中展示了一张模拟扫描电子显微镜（SEM）拍摄的雪花特写。图像采用黑白单色调，背景呈现出粗糙且带有颗粒感的深灰色质地。正中央是一个结构极其复杂的雪花，它具有典型的六角对称性，向外延伸出六条主枝，每条主枝上又分叉出密集的、类似羽毛或树丛状的微小晶体结构。雪花下方似乎垫着一个带有蜂窝状纹理的圆柱形支架。画面底部有一行白色的专业参数文字和比例尺标注。虽然这张图片极力模仿科学摄影，但存在明显的 AI 生成缺陷：首先，雪花的几何对称性并不严谨，左右两侧的分支细节无法完全对应，部分晶体边缘出现了模糊和不自然的融合；其次，底部的文字和数值虽然看起来专业，但字体渲染略显生硬，且比例尺的线条与背景的衔接处有轻微的像素重影。此外，雪花中心区域的结构过于堆叠，缺乏真实冰晶应有的通透感和物理逻辑。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这是一张高度还原SEM雪花晶体摄影风格的优秀图像，在语义对齐、结构对称性和科学摄影风格三个维度均表现出色。图像不仅完整呈现了提示词要求的六重对称、多层次分形、晶莹质感和科学摄影风格，更通过真实的SEM参数标注、二次电子成像特有的立体光影效果，将整体可信度提升至接近真实科学图像的水准。主要不足集中在晶体中心区域细节略显拥挤、右侧末端对称性轻微偏差，以及样品台基座对构图纯粹性的轻微干扰，但这些均属细节层面的瑕疵，不影响整体高质量评价。【GEMINI】从视觉生成角度看，这是一张质量极高的科学摄影仿真图，完美复刻了 SEM 下的雪花形态。然而，在多模态指令遵循测试中，模型完全忽略了任务描述中的「交通工具」指令，导致语义对齐维度得分极低。此外，图像成功模拟了 SEM 的不透明二次电子成像风格，却因此牺牲了提示词中要求的「晶莹剔透」光学特性。【KIMI】该图像在视觉呈现上具备 convincing 的科学摄影外观，但经不起严格的物理与几何检验。作为「电子显微镜下的雪花」这一特定提示词，其最大矛盾在于混淆了SEM（表面形貌）与光学显微镜（透明质感）的成像特征，且对称性瑕疵在放大观察下明显。若作为科普插图可接受，作为科学图像则存在原则性错误。评分策略上，semantic_alignment因主体明确且标注专业给予较高分，但structural_symmetry因对称破缺显著拉低，style_and_quality因质感矛盾处于临界。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

进阶难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

困难难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

相关链接

反馈评测问题