Google: Nano Banana Pro (Gemini 3 Pro Image Preview) 在「汉服少女现代书店场景生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:Google: Nano Banana Pro (Gemini 3 Pro Image Preview)
- 用例名称:汉服少女现代书店场景生成
- 测试类型:图像生成
- 评测维度:潮流服饰
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一位身着宋制汉服的少女站在现代书店书架旁的场景。 基本要求: - 少女身着宋制汉服,包含褙子与百迭裙 - 场景为现代风格书店,书架上摆放书籍 - 少女姿态自然,整体画面清晰
任务要求
AI 模型需要满足以下要求:
- 画面中有一位身着宋制汉服(褙子+百迭裙)的少女
- 场景为现代书店,书架上有书籍陈列
- 汉服整体造型基本准确,服饰轮廓清晰
- 人物姿态自然,画面构图完整
- 整体画面清晰,无明显变形或错误
评测结果
综合得分
该模型在此用例的得分为:78.0 分(满分 100 分),已通过
基础难度评测结果
- 得分:78.0 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一个现代感十足且光线明亮的书店内部场景。画面中央站着一位面带微笑的年轻女性,她身穿浅色碎花中式上衣和灰蓝色百褶长裙,正专注地低头翻阅手中的书籍。她的右侧是一排高大的木质书架,整齐摆放着各类书籍,书架边缘嵌有温暖的线性灯光。左侧是巨大的落地窗,透出室外的城市建筑和绿植,窗边有几位读者正坐在高脚凳上阅读。整体色调清新自然,营造出宁静的文化氛围。在 AI 生成的细节方面,存在一些明显的逻辑缺陷:女子手中书籍的页面纹理模糊,没有真实的文字排版;她右手的手指线条生硬,与书本接触的位置略显不自然;背景中书架上的书籍背脊文字多为模糊的色块,无法辨认。此外,远景处读者的身体轮廓与座椅的衔接也略显生硬。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像基本完成了提示词的核心要求:少女身着具有汉服风格的服饰(褙子+百迭裙),站立于现代书店书架旁,姿态自然,画面清晰。场景还原度是本图最大亮点,书店环境真实感强,构图与光线处理专业。主要扣分点集中于服饰还原度:褙子的袖型、版型与领型与标准宋制存在一定偏差,宽袖特征不够突出,真丝材质的光泽与垂坠感表现有待提升。整体而言,图像质量较高,视觉观感良好,但在汉服专业还原度上仍有改进空间。 【GEMINI】这是一张视觉美感极佳的作品,成功捕捉了「古今碰撞」的氛围。但在严苛的专业视角下,服饰的形制细节(尤其是领口)和手部的生理结构处理仍有明显的人工智能痕迹,未能达到完全的写实严谨性。 【KIMI】该图像在「现代书店场景」的表层构建上基本达标,但在核心要求「宋制汉服」的形制还原上存在严重偏差。褙子的领口处理、袖型宽度、百迭裙的褶裥结构均呈现典型的「改良汉服」或跨朝代混淆特征,对于要求严格的传统服饰还原场景而言属于显著失败。场景合理性存在多处物理逻辑漏洞,但视觉欺骗性较强。综合判定:模型未能准确理解「宋制」这一关键限定词的技术内涵,将提示词简化为「古风服饰+现代场景」的拼接处理,建议分数区间 60-65。
进阶难度评测结果
- 得分:75.5 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展现了一位年轻女性身处现代简约风格的书店或图书馆中。她侧身站立,正伸手触摸右侧木质书架上的书籍。女子身着改良汉服,内搭白色抹胸和灰色百褶裙,外披一件藕粉色的大袖衫,整体色调柔和淡雅。背景是工业风的灰色水泥墙面,天花板上装有黑色轨道射灯,营造出一种静谧的文化氛围。 画面中存在几处明显的 AI 生成缺陷:最显著的是女子的手部,她伸向书架的右手手指比例失调,指尖显得尖锐且形状怪异,缺乏自然的关节结构;左手垂下的袖口处,手指的结构也模糊不清。此外,书架上的书籍背脊缺乏清晰的文字或纹理,显得较为模糊。天花板上的射灯排列略显杂乱,左上角的黑色轨道在透视上与空间结构衔接得不够自然。尽管如此,整幅画面的光影处理依然较好地烘托了温婉的气质。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像整体较好地完成了提示词的核心要求,人物着宋制汉服(褙子、抹胸、百迭裙)造型准确,指尖触书动作自然优雅,极简书店场景还原度高。主要不足集中在两点:其一,百迭裙的百褶纹理细节表现不够精细,未能充分体现宋制百迭裙的工艺特征;其二,射灯光源在服饰上的光影对比强度不足,缺乏聚光灯应有的硬质光影效果。交互动作与场景融合是本图最突出的亮点,整体评分处于「基本完成要求,存在1-2处明显瑕疵」的区间。 【GEMINI】这张图像在环境氛围的营造上表现出色,成功捕捉了现代与传统的碰撞感。但在核心的「交互逻辑」和「手部细节」上出现了严重的 AI 生成痕迹。光影处理过于扁平,未能利用射灯创造出提示词要求的「明显光影对比」,且关键的手部动作崩坏,直接破坏了画面的优雅感。 【KIMI】该图像在氛围营造上有一定完成度,但作为『测试传统汉服在现代室内复杂光源下的材质表现与交互逻辑』的测试样本,在核心考核点上存在明显缺陷。材质表现未能区分真丝与棉麻的光学特性,光影逻辑存在多光源矛盾的硬伤,而交互动作更是出现了AI生成图像中典型的『伪触碰』问题——手指与物体的空间关系暧昧不清。这些缺陷直接违背了提示词中『真丝垂坠感』『百褶纹理清晰』『指尖轻触』等关键要求,显示出模型在处理传统服饰材质与现代空间光影交互时的能力边界。
困难难度评测结果
- 得分:65.8 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张左右对称的对比图,场景设定在一家极简风格的现代书店或图书馆内。一位年轻女性侧身站立在画面中央,她盘着发髻,佩戴着精致的发簪,身穿一套米金色的中式改良汉服,上衣袖口宽大,下身是垂坠感十足的百褶长裙,整体气质温婉典雅。她的右手正伸向左侧高大的木质书架,似乎在挑选书籍。背景是灰色的水泥质感墙面,天花板上装有黑色轨道射灯,营造出宁静的阅读氛围。 画面中存在明显的 AI 生成缺陷:最显著的问题在于女性伸向书架的右手,手指线条模糊且扭曲,指尖与书籍的接触位置显得生硬不自然。此外,左右两幅图虽然高度相似,但在细节上存在微小差异,例如书架上书籍的排列位置和光影分布略有不同,且背景墙面上的纹理在两图中并不完全吻合,显示出生成过程中的随机性。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在场景设定和人物造型上基本符合提示词的框架要求,极简书店与汉服少女的组合具有一定的视觉吸引力。然而,提示词中最核心的技术挑战——真丝材质的「流光」物理表现与多重射灯阴影逻辑——均未能达标。褙子缺乏丝绸特有的高光-阴影强对比,百迭裙褶皱密度不足,多重光源在人物身上的阴影叠加逻辑混乱,这三点是最主要的失分原因。袖口空间关系处理尚可,古今意境构图基本成立。整体而言,图像完成了提示词的表层叙事,但在材质物理表现和光影逻辑这两个核心技术维度上存在明显不足。 【GEMINI】这是一张在构图和场景建模上表现优秀,但在物理光影逻辑和材质精细度上存在明显缺陷的 AI 生成图像。模型未能有效处理多光源环境下的复杂阴影叠加,且对真丝这一特定材质的物理特性理解停留于表面光泽,未能实现提示词要求的「流光」意境。空间交互方面虽无明显穿模,但重力感表现平庸。 【KIMI】该图像在完成基础构图与人物姿态方面表现尚可,但在核心技术要求上存在明显短板。最突出的问题是「多重光源阴影逻辑」的严重缺失——画面仅呈现单一光源效果,与提示词明确要求的「至少两盏射灯」「多重阴影」存在根本性偏差,这直接影响了真丝「流光」感的表现基础。材质表现上,褙子与百迭裙更接近哑光缎面而非高光泽真丝,缺乏复杂光照下的动态光影变化。袖口空间关系基本合理但动态细节不足。整体而言,图像达到了「能看」的商用标准,但作为技术测试图像,在光源逻辑与材质物理表现上未能满足提示词的严苛要求,模型在复杂光照场景的处理能力仍有显著改进空间。
相关链接
您可以通过以下链接查看更多相关内容: