Google: Nano Banana Pro (Gemini 3 Pro Image Preview) 在「汉服少女现代书店场景生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：Google: Nano Banana Pro (Gemini 3 Pro Image Preview)
用例名称：汉服少女现代书店场景生成
测试类型：图像生成
评测维度：潮流服饰

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一位身着宋制汉服的少女站在现代书店书架旁的场景。基本要求： - 少女身着宋制汉服，包含褙子与百迭裙 - 场景为现代风格书店，书架上摆放书籍 - 少女姿态自然，整体画面清晰

任务要求

AI 模型需要满足以下要求：

画面中有一位身着宋制汉服（褙子+百迭裙）的少女
场景为现代书店，书架上有书籍陈列
汉服整体造型基本准确，服饰轮廓清晰
人物姿态自然，画面构图完整
整体画面清晰，无明显变形或错误

评测结果

综合得分

该模型在此用例的得分为：78.0 分（满分 100 分），已通过

基础难度评测结果

得分：78.0 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一个现代感十足且光线明亮的书店内部场景。画面中央站着一位面带微笑的年轻女性，她身穿浅色碎花中式上衣和灰蓝色百褶长裙，正专注地低头翻阅手中的书籍。她的右侧是一排高大的木质书架，整齐摆放着各类书籍，书架边缘嵌有温暖的线性灯光。左侧是巨大的落地窗，透出室外的城市建筑和绿植，窗边有几位读者正坐在高脚凳上阅读。整体色调清新自然，营造出宁静的文化氛围。在 AI 生成的细节方面，存在一些明显的逻辑缺陷：女子手中书籍的页面纹理模糊，没有真实的文字排版；她右手的手指线条生硬，与书本接触的位置略显不自然；背景中书架上的书籍背脊文字多为模糊的色块，无法辨认。此外，远景处读者的身体轮廓与座椅的衔接也略显生硬。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像基本完成了提示词的核心要求：少女身着具有汉服风格的服饰（褙子+百迭裙），站立于现代书店书架旁，姿态自然，画面清晰。场景还原度是本图最大亮点，书店环境真实感强，构图与光线处理专业。主要扣分点集中于服饰还原度：褙子的袖型、版型与领型与标准宋制存在一定偏差，宽袖特征不够突出，真丝材质的光泽与垂坠感表现有待提升。整体而言，图像质量较高，视觉观感良好，但在汉服专业还原度上仍有改进空间。【GEMINI】这是一张视觉美感极佳的作品，成功捕捉了「古今碰撞」的氛围。但在严苛的专业视角下，服饰的形制细节（尤其是领口）和手部的生理结构处理仍有明显的人工智能痕迹，未能达到完全的写实严谨性。【KIMI】该图像在「现代书店场景」的表层构建上基本达标，但在核心要求「宋制汉服」的形制还原上存在严重偏差。褙子的领口处理、袖型宽度、百迭裙的褶裥结构均呈现典型的「改良汉服」或跨朝代混淆特征，对于要求严格的传统服饰还原场景而言属于显著失败。场景合理性存在多处物理逻辑漏洞，但视觉欺骗性较强。综合判定：模型未能准确理解「宋制」这一关键限定词的技术内涵，将提示词简化为「古风服饰+现代场景」的拼接处理，建议分数区间 60-65。

进阶难度评测结果

得分：75.5 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展现了一位年轻女性身处现代简约风格的书店或图书馆中。她侧身站立，正伸手触摸右侧木质书架上的书籍。女子身着改良汉服，内搭白色抹胸和灰色百褶裙，外披一件藕粉色的大袖衫，整体色调柔和淡雅。背景是工业风的灰色水泥墙面，天花板上装有黑色轨道射灯，营造出一种静谧的文化氛围。画面中存在几处明显的 AI 生成缺陷：最显著的是女子的手部，她伸向书架的右手手指比例失调，指尖显得尖锐且形状怪异，缺乏自然的关节结构；左手垂下的袖口处，手指的结构也模糊不清。此外，书架上的书籍背脊缺乏清晰的文字或纹理，显得较为模糊。天花板上的射灯排列略显杂乱，左上角的黑色轨道在透视上与空间结构衔接得不够自然。尽管如此，整幅画面的光影处理依然较好地烘托了温婉的气质。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像整体较好地完成了提示词的核心要求，人物着宋制汉服（褙子、抹胸、百迭裙）造型准确，指尖触书动作自然优雅，极简书店场景还原度高。主要不足集中在两点：其一，百迭裙的百褶纹理细节表现不够精细，未能充分体现宋制百迭裙的工艺特征；其二，射灯光源在服饰上的光影对比强度不足，缺乏聚光灯应有的硬质光影效果。交互动作与场景融合是本图最突出的亮点，整体评分处于「基本完成要求，存在1-2处明显瑕疵」的区间。【GEMINI】这张图像在环境氛围的营造上表现出色，成功捕捉了现代与传统的碰撞感。但在核心的「交互逻辑」和「手部细节」上出现了严重的 AI 生成痕迹。光影处理过于扁平，未能利用射灯创造出提示词要求的「明显光影对比」，且关键的手部动作崩坏，直接破坏了画面的优雅感。【KIMI】该图像在氛围营造上有一定完成度，但作为『测试传统汉服在现代室内复杂光源下的材质表现与交互逻辑』的测试样本，在核心考核点上存在明显缺陷。材质表现未能区分真丝与棉麻的光学特性，光影逻辑存在多光源矛盾的硬伤，而交互动作更是出现了AI生成图像中典型的『伪触碰』问题——手指与物体的空间关系暧昧不清。这些缺陷直接违背了提示词中『真丝垂坠感』『百褶纹理清晰』『指尖轻触』等关键要求，显示出模型在处理传统服饰材质与现代空间光影交互时的能力边界。

困难难度评测结果

得分：65.8 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一张左右对称的对比图，场景设定在一家极简风格的现代书店或图书馆内。一位年轻女性侧身站立在画面中央，她盘着发髻，佩戴着精致的发簪，身穿一套米金色的中式改良汉服，上衣袖口宽大，下身是垂坠感十足的百褶长裙，整体气质温婉典雅。她的右手正伸向左侧高大的木质书架，似乎在挑选书籍。背景是灰色的水泥质感墙面，天花板上装有黑色轨道射灯，营造出宁静的阅读氛围。画面中存在明显的 AI 生成缺陷：最显著的问题在于女性伸向书架的右手，手指线条模糊且扭曲，指尖与书籍的接触位置显得生硬不自然。此外，左右两幅图虽然高度相似，但在细节上存在微小差异，例如书架上书籍的排列位置和光影分布略有不同，且背景墙面上的纹理在两图中并不完全吻合，显示出生成过程中的随机性。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像在场景设定和人物造型上基本符合提示词的框架要求，极简书店与汉服少女的组合具有一定的视觉吸引力。然而，提示词中最核心的技术挑战——真丝材质的「流光」物理表现与多重射灯阴影逻辑——均未能达标。褙子缺乏丝绸特有的高光-阴影强对比，百迭裙褶皱密度不足，多重光源在人物身上的阴影叠加逻辑混乱，这三点是最主要的失分原因。袖口空间关系处理尚可，古今意境构图基本成立。整体而言，图像完成了提示词的表层叙事，但在材质物理表现和光影逻辑这两个核心技术维度上存在明显不足。【GEMINI】这是一张在构图和场景建模上表现优秀，但在物理光影逻辑和材质精细度上存在明显缺陷的 AI 生成图像。模型未能有效处理多光源环境下的复杂阴影叠加，且对真丝这一特定材质的物理特性理解停留于表面光泽，未能实现提示词要求的「流光」意境。空间交互方面虽无明显穿模，但重力感表现平庸。【KIMI】该图像在完成基础构图与人物姿态方面表现尚可，但在核心技术要求上存在明显短板。最突出的问题是「多重光源阴影逻辑」的严重缺失——画面仅呈现单一光源效果，与提示词明确要求的「至少两盏射灯」「多重阴影」存在根本性偏差，这直接影响了真丝「流光」感的表现基础。材质表现上，褙子与百迭裙更接近哑光缎面而非高光泽真丝，缺乏复杂光照下的动态光影变化。袖口空间关系基本合理但动态细节不足。整体而言，图像达到了「能看」的商用标准，但作为技术测试图像，在光源逻辑与材质物理表现上未能满足提示词的严苛要求，模型在复杂光照场景的处理能力仍有显著改进空间。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

进阶难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

困难难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

相关链接

反馈评测问题