Google: Gemini 2.5 Flash Image (Nano Banana) 在「汉服少女现代书店场景生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:Google: Gemini 2.5 Flash Image (Nano Banana)
  • 用例名称:汉服少女现代书店场景生成
  • 测试类型:图像生成
  • 评测维度:潮流服饰

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一位身着宋制汉服的少女站在现代书店书架旁的场景。 基本要求: - 少女身着宋制汉服,包含褙子与百迭裙 - 场景为现代风格书店,书架上摆放书籍 - 少女姿态自然,整体画面清晰

任务要求

AI 模型需要满足以下要求:

  1. 画面中有一位身着宋制汉服(褙子+百迭裙)的少女
  2. 场景为现代书店,书架上有书籍陈列
  3. 汉服整体造型基本准确,服饰轮廓清晰
  4. 人物姿态自然,画面构图完整
  5. 整体画面清晰,无明显变形或错误

评测结果

综合得分

该模型在此用例的得分为:77.3 分(满分 100 分),已通过

基础难度评测结果

  • 得分:77.3 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一位年轻女性在明亮现代的书店中阅读的场景。她侧身站立,身着一套淡雅的改良汉服,上衣为米白色提花交领长衫,下身是浅蓝色的百褶长裙,正低头专注地翻阅手中一本棕色封面的小书。背景是整齐排列的深棕色高大木质书架,上面摆满了各式书籍。书店空间宽敞,远处有两个拱形大窗户,透出室外的街景,窗前摆放着简约的灰色扶手椅。整体色调温暖柔和,光线从天花板的射灯均匀洒下。 在 AI 生成细节方面,画面存在一些明显的逻辑缺陷:首先,女性手中的书本边缘模糊,手指与书页的接触处结构混乱,缺乏清晰的握持感。其次,书架上的书籍背脊文字全是模糊的色块,无法辨认。最明显的异常在于背景的拱形窗户,左侧窗户的格栅线条与右侧并不对称,且窗外景物的透视关系略显扭曲。此外,天花板上的轨道灯排布较为随意,部分灯具的阴影表现不够自然。

图中展示了一位年轻女性在明亮现代的书店中阅读的场景。她侧身站立,身着一套淡雅的改良汉服,上衣为米白色提花交领长衫,下身是浅蓝色的百褶长裙,正低头专注地翻阅手中一本棕色封面的小书。背景是整齐排列的深棕色高大木质书架,上面摆满了各式书籍。书店空间宽敞,远处有两个拱形大窗户,透出室外的街景,窗前摆放着简约的灰色扶手椅。整体色调温暖柔和,光线从天花板的射灯均匀洒下。

在 AI 生成细节方面,画面存在一些明显的逻辑缺陷:首先,女性手中的书本边缘模糊,手指与书页的接触处结构混乱,缺乏清晰的握持感。其次,书架上的书籍背脊文字全是模糊的色块,无法辨认。最明显的异常在于背景的拱形窗户,左侧窗户的格栅线条与右侧并不对称,且窗外景物的透视关系略显扭曲。此外,天花板上的轨道灯排布较为随意,部分灯具的阴影表现不够自然。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像基本完成了提示词的核心要求:呈现了一位着汉服少女在现代书店书架旁的场景,人物姿态自然,场景真实感强。书店环境的构建是本图最突出的亮点。主要短板集中在服饰还原度上——宋制褙子的宽袖特征与百迭裙的褶裥细节均未能准确还原,服饰更接近现代改良汉服风格而非严格的宋制汉服,这是与提示词核心要求存在偏差的主要问题。综合而言,这是一张视觉质量良好、场景合理但服饰历史还原度有所欠缺的图像。 【GEMINI】这是一张典型的「远看尚可,近看崩溃」的 AI 生成图像。虽然成功捕捉了提示词中的核心元素,但在专业视觉层面表现欠佳。服饰还原仅停留在表面形似,完全丧失了宋制汉服的结构灵魂;场景中的书籍处理极其敷衍,存在大量低级的物理逻辑错误和形变,无法经受挑剔的视觉审查。 【KIMI】该图像在「现代书店少女」的泛化场景上表现合格,但在核心的「宋制汉服」形制还原上存在关键偏差。上衣的交领短款式与褙子的对襟长款式不符,百迭裙的褶裥表现亦未达宋代服饰特征。若以严格汉服考据标准评判,此图更接近「古风元素日常装」而非「宋制汉服」。场景构建与画面质量尚可,但服饰还原度的硬伤拉低了整体完成度。

进阶难度评测结果

  • 得分:74.0 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一位年轻女性在现代图书馆或书店中的场景。这位女性侧身站立,留着黑色长发,身穿一套浅棕色或香槟色的中式汉服,外袍宽大且带有丝绸质感,内搭褶皱长裙,展现出一种古典与现代交融的气质。她正伸出右手,指尖轻触白色书架上的一本书。背景是整洁的白色开放式书架,摆满了各式书籍,远处可见更多书架和现代化的条形顶灯,整体色调偏冷且柔和,营造出安静的阅读氛围。 在 AI 生成细节方面,存在一些明显的逻辑缺陷:最显著的是女性伸出的右手,手指线条模糊且结构异常,指尖与书籍接触的位置显得不自然;她左手藏在宽大袖口中,露出的部分形状也较为模糊。此外,书架上的书脊文字均为模糊的色块,无法辨认具体字迹,且部分书架的透视线条在远端略显扭曲。尽管如此,画面的整体构图平衡,光影过渡较为自然。

图中展示了一位年轻女性在现代图书馆或书店中的场景。这位女性侧身站立,留着黑色长发,身穿一套浅棕色或香槟色的中式汉服,外袍宽大且带有丝绸质感,内搭褶皱长裙,展现出一种古典与现代交融的气质。她正伸出右手,指尖轻触白色书架上的一本书。背景是整洁的白色开放式书架,摆满了各式书籍,远处可见更多书架和现代化的条形顶灯,整体色调偏冷且柔和,营造出安静的阅读氛围。

在 AI 生成细节方面,存在一些明显的逻辑缺陷:最显著的是女性伸出的右手,手指线条模糊且结构异常,指尖与书籍接触的位置显得不自然;她左手藏在宽大袖口中,露出的部分形状也较为模糊。此外,书架上的书脊文字均为模糊的色块,无法辨认具体字迹,且部分书架的透视线条在远端略显扭曲。尽管如此,画面的整体构图平衡,光影过渡较为自然。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】图像整体完成度较高,成功呈现了宋制汉服少女在极简书店中的场景氛围。服饰造型基本准确,褙子垂坠感和宽袖形态是明显亮点。主要不足集中在光影表现上——现代射灯的硬质点光源特征未能在人物身上得到充分体现,整体光效偏向摄影棚柔光风格,与提示词要求的「明显光影对比」有差距。百迭裙因被褙子遮盖而展示不足,是服饰表现的遗憾之处。综合来看,图像达到了提示词的基本要求,但在光影技术细节和服饰层次展示上仍有提升空间。 【GEMINI】这是一张氛围感出色但经不起细节推敲的作品。模型成功捕捉了宋制汉服的飘逸感和现代书店的冷峻色调,但在核心的「指尖触碰」交互动作上出现了AI常见的结构性错误。最严重的失分点在于光影逻辑的缺失,尤其是地面投影的遗漏,使得原本极具质感的画面失去了真实的空间说服力。 【KIMI】该图像在概念层面完成了「汉服少女在现代书店」的场景搭建,但在核心材质表现与光影逻辑上存在严重缺陷。最致命的是百迭裙褶皱纹理的完全缺失与真丝质感的塑料化呈现,这直接违背了提示词对服饰细节的明确要求。光影方面,模型未能理解「现代射灯」的硬光特性,呈现出暧昧的柔光效果,且光源方向自相矛盾。动作设计上,「轻触」的优雅意图被僵硬的肢体执行所破坏。整体属于「形似而神不似」的及格线作品,距离提示词要求的精致感差距显著。

困难难度评测结果

  • 得分:71.4 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中展示了一位身着中国传统汉服的年轻女性,正站在一个巨大的浅木色书架前。她侧身站立,留着黑色长发,穿着一套精致的米白色汉服,外罩一件宽大的长袖衫,内搭绣花抹胸和百褶长裙,整体气质温婉典雅。背景是极简风格的灰色墙面,上方有两盏射灯投射出柔和的光束,营造出一种静谧、现代的图书馆或书斋氛围。构图上,左侧是整齐排列的书架,右侧留有大量灰色的负空间,视觉中心集中在女性取书的动作上。 然而,画面中存在明显的 AI 生成缺陷:最显著的是女性举起取书的右手,手指线条模糊且扭曲,指尖与书脊的接触显得不自然;左手藏在宽大袖口中,露出的手指形状也较为生硬。此外,书架上的书籍背脊文字模糊不清,呈现为无意义的色块或乱码。书架的透视在画面左边缘处略显僵硬,与地面的衔接处阴影处理不够真实。

画面中展示了一位身着中国传统汉服的年轻女性,正站在一个巨大的浅木色书架前。她侧身站立,留着黑色长发,穿着一套精致的米白色汉服,外罩一件宽大的长袖衫,内搭绣花抹胸和百褶长裙,整体气质温婉典雅。背景是极简风格的灰色墙面,上方有两盏射灯投射出柔和的光束,营造出一种静谧、现代的图书馆或书斋氛围。构图上,左侧是整齐排列的书架,右侧留有大量灰色的负空间,视觉中心集中在女性取书的动作上。

然而,画面中存在明显的 AI 生成缺陷:最显著的是女性举起取书的右手,手指线条模糊且扭曲,指尖与书脊的接触显得不自然;左手藏在宽大袖口中,露出的手指形状也较为生硬。此外,书架上的书籍背脊文字模糊不清,呈现为无意义的色块或乱码。书架的透视在画面左边缘处略显僵硬,与地面的衔接处阴影处理不够真实。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在「古今交融」的主题意境与袖口空间物理关系两个维度上完成度较好,场景构建和人物姿态具有较强的视觉说服力。然而,提示词中最核心的技术挑战——真丝「流光」感的材质表现与多重射灯阴影的叠加逻辑——均未能达到要求。褙子表面缺乏丝绸特有的高光-阴影剧烈对比,材质质感偏向哑光织物;两盏射灯应产生的多重独立阴影及叠加效果在人物身上几乎不可见。这两个高权重维度(合计65%)的失分导致整体评分中等偏下,图像停留在「视觉上悦目但技术上不达标」的层次。 【GEMINI】图像在视觉氛围和材质表面纹理上表现出色,成功营造了现代书店与古典汉服碰撞的意境。然而,在严苛的物理逻辑检查下,袖口与家具的穿模问题是致命伤,直接破坏了空间的真实感。同时,多光源下的阴影叠加处理过于简化,未能完全达到提示词要求的「多重阴影合理叠加」的深度。 【KIMI】该图像在「古今意境」表层达成一定效果,但核心测试目标——多重光源下的真丝材质物理表现与宽袖空间交互——存在显著缺陷。阴影逻辑矛盾与袖口穿模属于硬性物理错误,直接暴露AI对复杂光源与布料动力学理解的局限。材质表现停留在「有光泽的布料」而非「真丝流光」,提示词中「流光」「细密褶皱」「自然形变」等关键要求均未充分实现。构图安全但缺乏空间叙事深度,整体属于「能看但不能细究」的AI生成典型样本。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...