Google: Gemini 3.1 Flash Image Preview (Nano Banana 2) 在「故事场景」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：Google: Gemini 3.1 Flash Image Preview (Nano Banana 2)
用例名称：故事场景
测试类型：图像生成
评测维度：语义理解

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一张图片：小红帽在森林小径上行走，她穿着红色斗篷，手提装着食物的篮子，阳光透过树叶洒在地面上。

任务要求

AI 模型需要满足以下要求：

图片中必须包含一名穿着红色斗篷的小红帽人物，红色斗篷特征需清晰可辨
图片中必须呈现森林小径场景，包含树木与可识别的路径
图片中必须包含小红帽手中提着的篮子，篮子需清晰可见
图片中必须体现阳光透过树叶投射在地面上的光影效果（如斑驳光斑或丁达尔光效）
整体画风应符合童话故事风格，避免出现现代元素干扰场景氛围

评测结果

综合得分

该模型在此用例的得分为：87.6 分（满分 100 分），已通过

基础难度评测结果

得分：87.6 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展现了一个充满童话色彩的森林场景。一位年约六七岁的小女孩正走在林间蜿蜒的小径上，她打扮成“小红帽”的模样，穿着一件鲜艳的大红色连帽斗篷，内搭白色刺绣连衣裙，梳着两条可爱的麻花辫。她右手提着一个精致的竹编野餐篮，篮子里露出了红酒瓶、苹果和面包。阳光穿过茂密的翠绿树叶，在地面上洒下斑驳的光影，营造出宁静而明亮的氛围。构图上，小女孩位于画面右侧中心，正向镜头方向走来，背景是深邃且富有层次感的绿色森林。在 AI 生成的细节方面，存在一些明显的逻辑缺陷：小女孩提篮子的右手手指显得模糊且结构异常，与篮柄的衔接不够自然；她左侧的小腿线条在裙摆下方显得有些僵硬，且双脚落地的透视角度略显失真。此外，篮子里的红酒瓶形状不够规整，瓶颈处有轻微的扭曲。尽管如此，整幅画面的色彩饱和度高，光影效果非常迷人。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这是一张高质量的AI生成图像，对「小红帽在森林小径行走」这一经典童话场景的还原达到了相当专业的水准。提示词的五项核心要求均得到满足，光影表现尤为突出，丁达尔光效与地面斑驳光斑的自然呈现是本图的核心竞争力。主要扣分点集中在细节层面：现代短靴的风格错位、手部细节的轻微模糊，以及远景树木的AI平滑感。这些问题不影响整体叙事完整性，但在苛刻的专业审视下确实存在提升空间。综合加权评分约为92分，属于优秀级别的场景生成作品。【GEMINI】这是一张视觉冲击力很强的作品，精准捕捉了「小红帽」故事的经典瞬间。语义还原度极高，光影氛围营造得非常到位。然而，作为专业评审，不能忽视其在精细肢体结构上的硬伤，尤其是手部抓握逻辑的混乱，这直接拉低了图像的专业工业水准。【KIMI】该图像作为AI生成作品，基本完成了提示词的核心要求，小红帽主题明确、场景识别度高。主要失分点集中在时代元素错位（现代红酒瓶、登山靴）和光影逻辑瑕疵，这些细节削弱了童话沉浸感。画面整体偏向写实摄影风格而非童话插画风格，若提示词隐含风格期待则存在偏差。综合而言属于「可用但需后期调整」的中上水平生成结果。

进阶难度评测结果

得分：88.3 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中描绘了一个经典的《三只小猪》童话场景。画面左侧是一座正在被大风吹散的草屋，大量稻草在空中飞舞。一只拟人化的大灰狼站在草屋前，它穿着一件带补丁的棕色马甲和破旧的蓝色牛仔裤，正鼓起腮帮子用力吹气，口中吐出白色的气流。画面右侧依次排列着一座木屋和一座红砖房，三只粉色的小猪分别从这两座房子的窗户探头观察，表情各异。背景是绿油油的草地、蜿蜒的小路和远处的森林，天空明亮并点缀着几朵白云。作为 AI 生成的图像，画面存在一些逻辑和细节缺陷：大灰狼吹出的气流方向与草屋顶端稻草飞散的方向并不完全一致，透视略显违和；木屋和砖房的烟囱冒出的烟雾形状较为生硬；最右侧砖房窗户里的小猪手部线条模糊，且砖墙的纹理在窗框边缘处处理得不够自然。此外，大灰狼的脚部与地面的接触感略显漂浮。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这是一张质量较高的童话插画，核心要素（三种材质房屋、大灰狼吹气、稻草飞舞）均得到有效呈现，动态表现尤为出色。主要扣分点在于三座房子未能实现「并排而立」的空间关系，而是呈现出前后纵深错落的布局，这是对提示词空间要求的明显偏离。大灰狼服装略带现代感也是小瑕疵。综合来看，图像完成度良好，属于提示词执行较为忠实的优质输出。【GEMINI】这是一张高质量的童话插画，精准地执行了提示词的所有关键要求。无论是材质的语义表达、角色的动作设计，还是空间上的逻辑排布，都达到了专业插画的水准。画面色彩明快，动态感十足，是 AI 在理解复杂叙事场景方面的优秀范例。【KIMI】该图像在材质表现与动态刻画上达到专业插画水准，大灰狼吹气动作与稻草飞散效果尤为出色。主要扣分点在于空间布局未严格遵循「并排而立」的提示词要求，三座房子呈纵深分布而非水平排列，且稻草房内缺失第三只小猪的可见形象。整体而言，这是一张完成度较高的AI生成图像，但在空间构图的精确性上仍有提升空间。

困难难度评测结果

得分：— 分
通过状态：未通过

模型生成产物

该模型生成了以下图片：

AI 生成图片，模型：Google: Gemini 3.1 Flash Image Preview (Nano Banana 2) — 在新标签页中查看原图

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】本次评测中，模型未能成功生成图像，输出结果为「图像生成失败，无法评分」。所有评分维度均无实质内容可供评估，三项维度得分均为0分。建议排查图像生成模块的故障原因，确保模型能够正常响应图像生成类指令。【KIMI】该候选输出为图像生成系统的失败反馈，未产生任何实际图像内容。作为视觉生成任务（xsct-vg类型），模型未能完成核心的图像生成职能，属于任务完全失败。所有评分维度均无法获得及格分（60分），三项维度均判为0分。建议检查图像生成模块的稳定性或Prompt的兼容性，重新执行任务。【GEMINI】本次评测中，模型未能成功生成图像（输出为「图像生成失败，无法评分」），三个评分维度均无实质内容可供评估，全部得分为0。建议排查图像生成模块的调用链路、接口权限或内容过滤策略，确认是否存在技术故障或内容审核拦截导致生成失败。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

进阶难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

困难难度评测结果

模型生成产物

AI 评审点评

相关链接

反馈评测问题