Google: Gemini 3.1 Flash Image Preview (Nano Banana 2) 在「故事场景」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:Google: Gemini 3.1 Flash Image Preview (Nano Banana 2)
  • 用例名称:故事场景
  • 测试类型:图像生成
  • 评测维度:语义理解

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张图片:小红帽在森林小径上行走,她穿着红色斗篷,手提装着食物的篮子,阳光透过树叶洒在地面上。

任务要求

AI 模型需要满足以下要求:

  1. 图片中必须包含一名穿着红色斗篷的小红帽人物,红色斗篷特征需清晰可辨
  2. 图片中必须呈现森林小径场景,包含树木与可识别的路径
  3. 图片中必须包含小红帽手中提着的篮子,篮子需清晰可见
  4. 图片中必须体现阳光透过树叶投射在地面上的光影效果(如斑驳光斑或丁达尔光效)
  5. 整体画风应符合童话故事风格,避免出现现代元素干扰场景氛围

评测结果

综合得分

该模型在此用例的得分为:87.6 分(满分 100 分),已通过

基础难度评测结果

  • 得分:87.6 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展现了一个充满童话色彩的森林场景。一位年约六七岁的小女孩正走在林间蜿蜒的小径上,她打扮成“小红帽”的模样,穿着一件鲜艳的大红色连帽斗篷,内搭白色刺绣连衣裙,梳着两条可爱的麻花辫。她右手提着一个精致的竹编野餐篮,篮子里露出了红酒瓶、苹果和面包。阳光穿过茂密的翠绿树叶,在地面上洒下斑驳的光影,营造出宁静而明亮的氛围。构图上,小女孩位于画面右侧中心,正向镜头方向走来,背景是深邃且富有层次感的绿色森林。 在 AI 生成的细节方面,存在一些明显的逻辑缺陷:小女孩提篮子的右手手指显得模糊且结构异常,与篮柄的衔接不够自然;她左侧的小腿线条在裙摆下方显得有些僵硬,且双脚落地的透视角度略显失真。此外,篮子里的红酒瓶形状不够规整,瓶颈处有轻微的扭曲。尽管如此,整幅画面的色彩饱和度高,光影效果非常迷人。

图中展现了一个充满童话色彩的森林场景。一位年约六七岁的小女孩正走在林间蜿蜒的小径上,她打扮成“小红帽”的模样,穿着一件鲜艳的大红色连帽斗篷,内搭白色刺绣连衣裙,梳着两条可爱的麻花辫。她右手提着一个精致的竹编野餐篮,篮子里露出了红酒瓶、苹果和面包。阳光穿过茂密的翠绿树叶,在地面上洒下斑驳的光影,营造出宁静而明亮的氛围。构图上,小女孩位于画面右侧中心,正向镜头方向走来,背景是深邃且富有层次感的绿色森林。

在 AI 生成的细节方面,存在一些明显的逻辑缺陷:小女孩提篮子的右手手指显得模糊且结构异常,与篮柄的衔接不够自然;她左侧的小腿线条在裙摆下方显得有些僵硬,且双脚落地的透视角度略显失真。此外,篮子里的红酒瓶形状不够规整,瓶颈处有轻微的扭曲。尽管如此,整幅画面的色彩饱和度高,光影效果非常迷人。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张高质量的AI生成图像,对「小红帽在森林小径行走」这一经典童话场景的还原达到了相当专业的水准。提示词的五项核心要求均得到满足,光影表现尤为突出,丁达尔光效与地面斑驳光斑的自然呈现是本图的核心竞争力。主要扣分点集中在细节层面:现代短靴的风格错位、手部细节的轻微模糊,以及远景树木的AI平滑感。这些问题不影响整体叙事完整性,但在苛刻的专业审视下确实存在提升空间。综合加权评分约为92分,属于优秀级别的场景生成作品。 【GEMINI】这是一张视觉冲击力很强的作品,精准捕捉了「小红帽」故事的经典瞬间。语义还原度极高,光影氛围营造得非常到位。然而,作为专业评审,不能忽视其在精细肢体结构上的硬伤,尤其是手部抓握逻辑的混乱,这直接拉低了图像的专业工业水准。 【KIMI】该图像作为AI生成作品,基本完成了提示词的核心要求,小红帽主题明确、场景识别度高。主要失分点集中在时代元素错位(现代红酒瓶、登山靴)和光影逻辑瑕疵,这些细节削弱了童话沉浸感。画面整体偏向写实摄影风格而非童话插画风格,若提示词隐含风格期待则存在偏差。综合而言属于「可用但需后期调整」的中上水平生成结果。

进阶难度评测结果

  • 得分:88.3 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中描绘了一个经典的《三只小猪》童话场景。画面左侧是一座正在被大风吹散的草屋,大量稻草在空中飞舞。一只拟人化的大灰狼站在草屋前,它穿着一件带补丁的棕色马甲和破旧的蓝色牛仔裤,正鼓起腮帮子用力吹气,口中吐出白色的气流。画面右侧依次排列着一座木屋和一座红砖房,三只粉色的小猪分别从这两座房子的窗户探头观察,表情各异。背景是绿油油的草地、蜿蜒的小路和远处的森林,天空明亮并点缀着几朵白云。 作为 AI 生成的图像,画面存在一些逻辑和细节缺陷:大灰狼吹出的气流方向与草屋顶端稻草飞散的方向并不完全一致,透视略显违和;木屋和砖房的烟囱冒出的烟雾形状较为生硬;最右侧砖房窗户里的小猪手部线条模糊,且砖墙的纹理在窗框边缘处处理得不够自然。此外,大灰狼的脚部与地面的接触感略显漂浮。

图中描绘了一个经典的《三只小猪》童话场景。画面左侧是一座正在被大风吹散的草屋,大量稻草在空中飞舞。一只拟人化的大灰狼站在草屋前,它穿着一件带补丁的棕色马甲和破旧的蓝色牛仔裤,正鼓起腮帮子用力吹气,口中吐出白色的气流。画面右侧依次排列着一座木屋和一座红砖房,三只粉色的小猪分别从这两座房子的窗户探头观察,表情各异。背景是绿油油的草地、蜿蜒的小路和远处的森林,天空明亮并点缀着几朵白云。

作为 AI 生成的图像,画面存在一些逻辑和细节缺陷:大灰狼吹出的气流方向与草屋顶端稻草飞散的方向并不完全一致,透视略显违和;木屋和砖房的烟囱冒出的烟雾形状较为生硬;最右侧砖房窗户里的小猪手部线条模糊,且砖墙的纹理在窗框边缘处处理得不够自然。此外,大灰狼的脚部与地面的接触感略显漂浮。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张质量较高的童话插画,核心要素(三种材质房屋、大灰狼吹气、稻草飞舞)均得到有效呈现,动态表现尤为出色。主要扣分点在于三座房子未能实现「并排而立」的空间关系,而是呈现出前后纵深错落的布局,这是对提示词空间要求的明显偏离。大灰狼服装略带现代感也是小瑕疵。综合来看,图像完成度良好,属于提示词执行较为忠实的优质输出。 【GEMINI】这是一张高质量的童话插画,精准地执行了提示词的所有关键要求。无论是材质的语义表达、角色的动作设计,还是空间上的逻辑排布,都达到了专业插画的水准。画面色彩明快,动态感十足,是 AI 在理解复杂叙事场景方面的优秀范例。 【KIMI】该图像在材质表现与动态刻画上达到专业插画水准,大灰狼吹气动作与稻草飞散效果尤为出色。主要扣分点在于空间布局未严格遵循「并排而立」的提示词要求,三座房子呈纵深分布而非水平排列,且稻草房内缺失第三只小猪的可见形象。整体而言,这是一张完成度较高的AI生成图像,但在空间构图的精确性上仍有提升空间。

困难难度评测结果

  • 得分:— 分
  • 通过状态:未通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:Google: Gemini 3.1 Flash Image Preview (Nano Banana 2)
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【GEMINI】由于模型明确反馈「图像生成失败」,未能完成任何预设的视觉任务。根据评测标准,在所有维度上均判定为 0 分。建议检查模型接口稳定性或内容安全过滤机制是否误触发。 【CLAUDE】本次评测的候选输出为「图像生成失败,无法评分」,模型未能成功生成任何图像内容。无论从语义还原度、构图空间逻辑还是视觉质量与氛围营造角度,均无任何可评估的内容,三项维度均得0分。建议排查图像生成模块的故障原因,确保后续测试能够正常产出图像结果。 【KIMI】本次评测因图像生成失败而无法进行有效评分。根据EVAL_BLOB中的candidate_output字段明确标注「图像生成失败,无法评分」,模型未能输出任何可供评估的视觉内容。所有评分维度均因缺乏实际生成结果而获得0分。建议检查图像生成系统的稳定性或重新提交生成任务。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...