Google: Gemini 2.5 Flash Image (Nano Banana) 在「汉服少女现代书店场景生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：Google: Gemini 2.5 Flash Image (Nano Banana)
用例名称：汉服少女现代书店场景生成
测试类型：图像生成
评测维度：潮流服饰

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一位身着宋制汉服的少女站在现代书店书架旁的场景。基本要求： - 少女身着宋制汉服，包含褙子与百迭裙 - 场景为现代风格书店，书架上摆放书籍 - 少女姿态自然，整体画面清晰

任务要求

AI 模型需要满足以下要求：

画面中有一位身着宋制汉服（褙子+百迭裙）的少女
场景为现代书店，书架上有书籍陈列
汉服整体造型基本准确，服饰轮廓清晰
人物姿态自然，画面构图完整
整体画面清晰，无明显变形或错误

评测结果

综合得分

该模型在此用例的得分为：77.3 分（满分 100 分），已通过

基础难度评测结果

得分：77.3 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一位年轻女性在明亮现代的书店中阅读的场景。她侧身站立，身着一套淡雅的改良汉服，上衣为米白色提花交领长衫，下身是浅蓝色的百褶长裙，正低头专注地翻阅手中一本棕色封面的小书。背景是整齐排列的深棕色高大木质书架，上面摆满了各式书籍。书店空间宽敞，远处有两个拱形大窗户，透出室外的街景，窗前摆放着简约的灰色扶手椅。整体色调温暖柔和，光线从天花板的射灯均匀洒下。在 AI 生成细节方面，画面存在一些明显的逻辑缺陷：首先，女性手中的书本边缘模糊，手指与书页的接触处结构混乱，缺乏清晰的握持感。其次，书架上的书籍背脊文字全是模糊的色块，无法辨认。最明显的异常在于背景的拱形窗户，左侧窗户的格栅线条与右侧并不对称，且窗外景物的透视关系略显扭曲。此外，天花板上的轨道灯排布较为随意，部分灯具的阴影表现不够自然。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像基本完成了提示词的核心要求：呈现了一位着汉服少女在现代书店书架旁的场景，人物姿态自然，场景真实感强。书店环境的构建是本图最突出的亮点。主要短板集中在服饰还原度上——宋制褙子的宽袖特征与百迭裙的褶裥细节均未能准确还原，服饰更接近现代改良汉服风格而非严格的宋制汉服，这是与提示词核心要求存在偏差的主要问题。综合而言，这是一张视觉质量良好、场景合理但服饰历史还原度有所欠缺的图像。【GEMINI】这是一张典型的「远看尚可，近看崩溃」的 AI 生成图像。虽然成功捕捉了提示词中的核心元素，但在专业视觉层面表现欠佳。服饰还原仅停留在表面形似，完全丧失了宋制汉服的结构灵魂；场景中的书籍处理极其敷衍，存在大量低级的物理逻辑错误和形变，无法经受挑剔的视觉审查。【KIMI】该图像在「现代书店少女」的泛化场景上表现合格，但在核心的「宋制汉服」形制还原上存在关键偏差。上衣的交领短款式与褙子的对襟长款式不符，百迭裙的褶裥表现亦未达宋代服饰特征。若以严格汉服考据标准评判，此图更接近「古风元素日常装」而非「宋制汉服」。场景构建与画面质量尚可，但服饰还原度的硬伤拉低了整体完成度。

进阶难度评测结果

得分：74.0 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一位年轻女性在现代图书馆或书店中的场景。这位女性侧身站立，留着黑色长发，身穿一套浅棕色或香槟色的中式汉服，外袍宽大且带有丝绸质感，内搭褶皱长裙，展现出一种古典与现代交融的气质。她正伸出右手，指尖轻触白色书架上的一本书。背景是整洁的白色开放式书架，摆满了各式书籍，远处可见更多书架和现代化的条形顶灯，整体色调偏冷且柔和，营造出安静的阅读氛围。在 AI 生成细节方面，存在一些明显的逻辑缺陷：最显著的是女性伸出的右手，手指线条模糊且结构异常，指尖与书籍接触的位置显得不自然；她左手藏在宽大袖口中，露出的部分形状也较为模糊。此外，书架上的书脊文字均为模糊的色块，无法辨认具体字迹，且部分书架的透视线条在远端略显扭曲。尽管如此，画面的整体构图平衡，光影过渡较为自然。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】图像整体完成度较高，成功呈现了宋制汉服少女在极简书店中的场景氛围。服饰造型基本准确，褙子垂坠感和宽袖形态是明显亮点。主要不足集中在光影表现上——现代射灯的硬质点光源特征未能在人物身上得到充分体现，整体光效偏向摄影棚柔光风格，与提示词要求的「明显光影对比」有差距。百迭裙因被褙子遮盖而展示不足，是服饰表现的遗憾之处。综合来看，图像达到了提示词的基本要求，但在光影技术细节和服饰层次展示上仍有提升空间。【GEMINI】这是一张氛围感出色但经不起细节推敲的作品。模型成功捕捉了宋制汉服的飘逸感和现代书店的冷峻色调，但在核心的「指尖触碰」交互动作上出现了AI常见的结构性错误。最严重的失分点在于光影逻辑的缺失，尤其是地面投影的遗漏，使得原本极具质感的画面失去了真实的空间说服力。【KIMI】该图像在概念层面完成了「汉服少女在现代书店」的场景搭建，但在核心材质表现与光影逻辑上存在严重缺陷。最致命的是百迭裙褶皱纹理的完全缺失与真丝质感的塑料化呈现，这直接违背了提示词对服饰细节的明确要求。光影方面，模型未能理解「现代射灯」的硬光特性，呈现出暧昧的柔光效果，且光源方向自相矛盾。动作设计上，「轻触」的优雅意图被僵硬的肢体执行所破坏。整体属于「形似而神不似」的及格线作品，距离提示词要求的精致感差距显著。

困难难度评测结果

得分：71.4 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

画面中展示了一位身着中国传统汉服的年轻女性，正站在一个巨大的浅木色书架前。她侧身站立，留着黑色长发，穿着一套精致的米白色汉服，外罩一件宽大的长袖衫，内搭绣花抹胸和百褶长裙，整体气质温婉典雅。背景是极简风格的灰色墙面，上方有两盏射灯投射出柔和的光束，营造出一种静谧、现代的图书馆或书斋氛围。构图上，左侧是整齐排列的书架，右侧留有大量灰色的负空间，视觉中心集中在女性取书的动作上。然而，画面中存在明显的 AI 生成缺陷：最显著的是女性举起取书的右手，手指线条模糊且扭曲，指尖与书脊的接触显得不自然；左手藏在宽大袖口中，露出的手指形状也较为生硬。此外，书架上的书籍背脊文字模糊不清，呈现为无意义的色块或乱码。书架的透视在画面左边缘处略显僵硬，与地面的衔接处阴影处理不够真实。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像在「古今交融」的主题意境与袖口空间物理关系两个维度上完成度较好，场景构建和人物姿态具有较强的视觉说服力。然而，提示词中最核心的技术挑战——真丝「流光」感的材质表现与多重射灯阴影的叠加逻辑——均未能达到要求。褙子表面缺乏丝绸特有的高光-阴影剧烈对比，材质质感偏向哑光织物；两盏射灯应产生的多重独立阴影及叠加效果在人物身上几乎不可见。这两个高权重维度（合计65%）的失分导致整体评分中等偏下，图像停留在「视觉上悦目但技术上不达标」的层次。【GEMINI】图像在视觉氛围和材质表面纹理上表现出色，成功营造了现代书店与古典汉服碰撞的意境。然而，在严苛的物理逻辑检查下，袖口与家具的穿模问题是致命伤，直接破坏了空间的真实感。同时，多光源下的阴影叠加处理过于简化，未能完全达到提示词要求的「多重阴影合理叠加」的深度。【KIMI】该图像在「古今意境」表层达成一定效果，但核心测试目标——多重光源下的真丝材质物理表现与宽袖空间交互——存在显著缺陷。阴影逻辑矛盾与袖口穿模属于硬性物理错误，直接暴露AI对复杂光源与布料动力学理解的局限。材质表现停留在「有光泽的布料」而非「真丝流光」，提示词中「流光」「细密褶皱」「自然形变」等关键要求均未充分实现。构图安全但缺乏空间叙事深度，整体属于「能看但不能细究」的AI生成典型样本。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

进阶难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

困难难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

相关链接

反馈评测问题