Google: Gemini 3.1 Flash Image Preview (Nano Banana 2) 在「零重力空间站人物漂浮」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:Google: Gemini 3.1 Flash Image Preview (Nano Banana 2)
- 用例名称:零重力空间站人物漂浮
- 测试类型:图像生成
- 评测维度:人物生成
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
一位宇航员在空间站内漂浮,穿着蓝色连体工作服,短发,双臂自然张开
任务要求
AI 模型需要满足以下要求:
- 人物呈现明显的漂浮姿态,双臂自然向两侧张开,身体无任何与地面或墙面的接触支撑点
- 短发发丝应呈现失重状态下的轻微散开或蓬松上扬效果,不得出现向下垂落的重力感
- 连体工作服颜色准确为蓝色,款式为完整连体设计,衣领、袖口或口袋等服装细节清晰可见
- 人物肢体比例正确,头身比自然,双臂左右对称,手部结构清晰无明显变形
- 整体构图合理,人物主体完整呈现于画面中,与空间站背景环境的比例关系协调,画面具备基本的空间纵深感
评测结果
综合得分
该模型在此用例的得分为:77.4 分(满分 100 分),已通过
基础难度评测结果
- 得分:77.4 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一位身着蓝色宇航服的亚裔女性宇航员,她正张开双臂,仿佛漂浮在国际空间站的舱室内。背景充满了复杂的科学仪器、电缆、储物包和一个可以看见地球弧线的圆形舷窗。整体色调以金属灰、白色和宇航服的深蓝色为主,光线明亮且均匀。 然而,画面中存在多处明显的 AI 生成缺陷。最显著的是人物的手部:左手(画面右侧)的手指数量异常,且指节扭曲变形;右手(画面左侧)的掌心与手指连接处结构模糊。此外,宇航服上的文字和标志均无法辨认,呈现为杂乱的色块和虚假的字符。舱室内的设备细节也存在逻辑错误,例如右侧悬浮的笔记本电脑支架与墙壁的连接十分生硬,部分电缆在空间中凭空消失或交织成不合理的团状。尽管构图力求真实,但这些细节揭示了其 AI 生成的本质。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张图像在服装细节渲染和空间站环境构建上表现出色,整体视觉完成度高,人物姿态与构图基本符合提示词要求。然而作为「零重力环境漂浮」这一核心测试场景,最关键的物理细节——头发失重效果和服装飘动感——均未能令人信服地呈现,头发仍受重力影响向下垂落,衣物也缺乏失重飘浮感,这是该图像最主要的扣分项。综合来看,图像完成了提示词的基本要求,但在零重力物理细节的深度还原上存在明显不足。 【GEMINI】这张图像在环境氛围和物理态势(失重感)的营造上非常成功,背景的复杂度和发型的处理令人印象深刻。然而,在核心的人物解剖结构上出现了严重失误,尤其是手部畸形和下肢缺失,直接破坏了画面的写实逻辑。此外,服装细节上的低级错误(如国旗反向)也反映出模型在精细逻辑控制上的不足。 【KIMI】该图像在「看起来像宇航员照片」的表层任务上勉强及格,但在核心指令「零重力漂浮」的物理真实性上遭遇严重失败。头发与服装的失重表现是致命的硬伤,直接暴露了模型对物理规律的理解停留在视觉模仿而非物理模拟层面。人物姿态的过度对称与稳定进一步强化了「摆拍感」而非「真实漂浮感」。背景环境的丰富细节与人物主体的物理谬误形成讽刺对比——模型擅长堆砌视觉元素,却无力处理元素间的动态逻辑关系。作为「零重力环境测试」,本图未能通过核心考核。
进阶难度评测结果
- 得分:83.6 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一位亚裔女性宇航员在国际空间站内部的场景。她身穿深蓝色的连体宇航服,胸前贴有 NASA 标志和美国国旗臂章,正悬浮在空中,双手拿着一台平板电脑并露出微笑。她的长发因失重状态向上飘散,呈现出放射状。背景是一个巨大的多窗格穹顶窗,透过窗户可以看到美丽的蓝色地球弧线和白云。空间站内部充满了复杂的电缆、金属面板和各种科学仪器,色调以银灰色和蓝色为主。 在 AI 生成的细节方面,存在一些明显的缺陷:宇航员左手握持平板电脑的方式不自然,手指线条模糊且融合在一起;宇航服上的文字标签和背景设备上的标识均为无法辨认的乱码。此外,头发的质感略显僵硬,部分发丝与背景的衔接处处理得不够自然。尽管如此,画面整体构图平衡,成功营造了太空探索的科技氛围。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张在各项关键要求上均高度完成的优秀图像。失重物理逻辑、NASA制服细节、空间站环境还原三个维度均表现出色,尤其是长发飘散效果和ISS内部环境细节堪称AI生成图像的高水准案例。主要不足集中在人物漂浮姿态的「摆拍感」略重,以及手部持握细节的轻微僵硬,但这些瑕疵不影响整体叙事的成立。综合评分处于「基本完成要求,存在1-2处明显瑕疵」与「完美完成」之间的高分区间。 【GEMINI】这是一张视觉冲击力很强的作品,在环境渲染和头发失重物理模拟上表现惊艳。然而,AI 在处理复杂手部结构时出现了典型的多指畸形,且部分衣褶未能完全遵循失重逻辑,导致在严苛的物理真实性审查下失分明显。 【KIMI】该图像在环境还原与基础人物塑造上表现合格,但核心测试目标——零重力物理 fidelity——存在明显缺陷。头发的「海胆式」刚性造型是最突出的败笔,直接暴露了AI对复杂物理现象的理解局限:它能模仿「向上飘」的表象,却无法还原失重环境下流体(发丝)的混沌动力学特征。此外,手指结构缺陷与服装褶皱的重力残留,进一步说明模型在细节物理一致性上仍有短板。整体属于「形似而神不似」的完成度,提示词要求的基本元素均已呈现,但关键要求的品质未达高标准。
困难难度评测结果
- 得分:77.2 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了国际空间站内部繁忙而神奇的零重力场景。两名穿着蓝色连体宇航服的宇航员正漂浮在充满精密仪器和管线的舱室内。左侧是一位深色皮肤、蓄着爆炸头的男性宇航员,他正拿着扳手微笑;右侧是一位亚裔女性宇航员,她正倒立着漂浮,手中拿着平板电脑。画面中央悬浮着大量杂物,包括铅笔、电缆圈、金属零件和晶莹剔透的水滴。左侧的圆形舷窗外,可以看到深邃的星空和地球的大气边缘。 画面呈现出冷色调的工业感,构图错落有致。然而,图中存在明显的 AI 生成缺陷:女性宇航员右手握着的白色笔状物与手指融合,且其左手抓握平板电脑的姿势极不自然,手指数量和关节结构模糊。此外,背景墙上的文字标签均为无法辨认的乱码,悬浮的电缆圈末端没有合理的连接逻辑,部分细小零件的透视关系也显得有些扭曲。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张整体质量较高的AI生成图像,成功完成了提示词的核心要求:两名不同种族宇航员在空间站内相向漂浮、一人倒置、多件工具与水珠漂浮、舷窗可见星空。最突出的成就在于环境细节的丰富程度和工具漂浮的物理说服力。主要短板集中在头发的失重物理表现上——这是零重力场景中最难处理也最容易暴露AI局限性的细节,两名宇航员的头发均未能完全摆脱重力逻辑的束缚。综合加权评分约为85分,属于「基本出色但有明显可改进空间」的水准。 【GEMINI】这是一张细节质感极佳但物理逻辑存在硬伤的作品。模型在处理复杂的环境交互(如腿部与扶手的空间关系)和局部失重物理(男性的头发、电缆的形态)时出现了明显失误。尽管种族多样性和材质渲染达到了极高水准,但严重的穿模和肢体畸变使其无法进入高分段。 【KIMI】该图像在概念层面完成了提示词的基本要求,但在物理真实性与空间逻辑上存在多处硬伤。最核心的失败在于『假装零重力』——许多元素(尤其是平板电脑的握持、电缆的弧度、工具的朝向)暴露了AI对失重物理的理解停留在表面符号层面,而非真正的物理模拟。人体结构的拉伸变形与空间透视的矛盾进一步削弱了可信度。作为『零重力环境生成能力』的测试,该图像未能通过严格的技术审查,尤其在anatomical_and_spatial_logic维度表现不佳。
相关链接
您可以通过以下链接查看更多相关内容: