Google: Nano Banana Pro (Gemini 3 Pro Image Preview) 在「简单动作」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:Google: Nano Banana Pro (Gemini 3 Pro Image Preview)
- 用例名称:简单动作
- 测试类型:图像生成
- 评测维度:动作表现
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
一个小男孩正在客厅里跳跃,双脚离地,双臂向上高举,脸上露出兴奋的表情。他穿着蓝色T恤和短裤,背景是简洁的白色墙壁和木地板。
任务要求
AI 模型需要满足以下要求:
- 画面中必须呈现一名小男孩(单一人物),双脚同时明显离地,脚底与地面之间有可见间距,清晰表现跳跃瞬间的腾空状态
- 双臂须向上高举,手臂抬起高度至少达到肩部以上,整体姿势与跳跃动作协调一致,符合自然跳跃时的肢体运动规律
- 面部须呈现兴奋、喜悦的表情(如张嘴大笑、眼睛睁大等),表情与跳跃动作的活力感相匹配
- 人体结构须完整正确:四肢数量正确,各关节(肘、膝、踝)弯曲方向符合生理学逻辑,无多余肢体、断肢或明显比例失调
- 人物须穿着蓝色T恤和短裤,服装颜色与描述一致,无明显颜色偏差
- 背景须为简洁的室内环境,包含白色(或浅色)墙壁与木质地板,背景元素简洁,不干扰主体人物的视觉呈现
评测结果
综合得分
该模型在此用例的得分为:88.1 分(满分 100 分),已通过
基础难度评测结果
- 得分:88.1 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中展示了一个明亮的现代简约风格客厅,一名约五六岁的小男孩正处于跳跃的瞬间,身体悬浮在木质地板上方。他穿着蓝色短袖 T 恤和牛仔短裤,双臂高举过头顶,脸上洋溢着灿烂的笑容。背景是纯白色的墙壁,左侧有一扇大窗户,阳光洒在浅色的木地板上。房间内布置有绿植、米色沙发和白色电视柜,整体色调清新自然。 然而,画面中存在明显的 AI 生成缺陷:最显著的是男孩的手部,双手手指数量异常且扭曲,呈现出杂乱的肉团状,缺乏清晰的指关节结构。此外,男孩的双脚脚趾模糊不清,右脚似乎只有四个脚趾。在环境细节上,沙发下方的阴影与男孩悬浮位置的投影逻辑不完全一致,且背景中电视柜的支脚显得有些歪斜,这些特征揭示了图片的 AI 生成属性。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张图像对提示词的还原程度极高,核心动作要素(腾空、双臂上举、兴奋表情)全部准确呈现,人体结构无明显AI畸变,服装与背景环境均与描述高度匹配。整体质量接近真实摄影水准,是一张成功完成「简单动作测试」任务的优秀生成图像。仅有的轻微不足在于背景元素略多及动态模糊带来的细节损失,但均不影响核心要求的达成。 【GEMINI】该模型在理解动作指令和环境描述方面表现卓越,成功捕捉了「跳跃瞬间」这一动态难点。然而,在人体微观结构(手部和脚部)上出现了典型的AI生成错误,尤其是多指问题严重影响了图像的写实严谨性,拉开了与顶级表现的差距。 【KIMI】该图像在核心叙事(跳跃动作、兴奋表情、服装背景)上高度完成提示词要求,属于「基本合格但经不起细看」的典型AI输出。主要失分点集中在解剖学细节的「过度平滑」处理——肘关节、膝关节与脚趾均呈现出AI为规避畸形而采用的「安全但失真」策略,牺牲了动态人体的力学真实感。建议用于中远距离浏览场景,近距离 scrutiny 会暴露肢体结构的塑料质感。
进阶难度评测结果
- 得分:76.0 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一场宏大的室内芭蕾舞演出。画面中心是一位身穿粉色芭蕾舞裙的女性舞者,她正单脚尖伫立在木质舞台上,另一条腿向后平平抬起,双臂舒展,姿态优雅。舞台灯光从左侧打来,在地面上投射出她修长的影子。背景是富丽堂皇的歌剧院,右侧可以看到交响乐团正在演奏,指挥家背对观众挥动指挥棒,上方是带有金色装饰的欧式包厢。整体色调温暖,充满了艺术氛围。 然而,画面中存在明显的 AI 生成缺陷:舞者的右手手指线条模糊且扭曲,缺乏清晰的关节结构;她支撑地面的右脚足尖鞋形状异常,与地板接触的方式显得不够自然。此外,背景中乐团成员的面部特征非常模糊,部分乐手的乐器(如小提琴)与手部的衔接处出现了透视错误和结构缺失,指挥家的左手也显得不够完整。这些细节上的不协调揭示了图片的生成式来源。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】图像在场景营造和服装细节上表现优秀,舞台氛围真实感人。然而核心动作「阿拉贝斯克」的执行存在根本性偏差:抬腿膝关节弯曲、高度严重不足、左右腿角色互换,实际呈现的是attitude derrière而非arabesque。这对于一个以「测试模型表现简单动作」为目标的任务而言,是不可忽视的失败。动作准确性的缺失拉低了整体评分,图像更像是一张精美的芭蕾舞台照片,而非对提示词动作规范的精确响应。 【GEMINI】这是一张视觉冲击力很强但经不起专业推敲的图像。模型在营造舞台氛围和服装质感上表现卓越,但在核心的芭蕾动作规范(尤其是膝盖绷直)和关键部位的人体解剖(脚踝与手指)上出现了明显失误。作为测试简单动作的题目,其动作的准确性尚需大幅改进。 【KIMI】该图像在视觉氛围与服装细节上表现尚可,但核心动作准确性出现严重偏差——左右腿功能完全颠倒,这直接违背了提示词的基础指令。作为「测试模型表现简单动作」的任务,这种方向性错误不可接受。人体结构的解剖瑕疵虽不至于完全破坏画面,但支撑脚的「折断」感与髋部的生硬转折暴露了AI对人体力学理解的不足。综合判定为「部分完成要求,有多处需要改进」,分数需拉开差距以体现对基础指令准确性的严格要求。
困难难度评测结果
- 得分:74.5 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一个充满活力的室外街头篮球场场景。画面中心,一名身穿红色布鲁克林篮网队 23 号球衣的非裔男子正跃起在半空中,右手单手扣篮,他的肌肉线条清晰,动作极具张力。球场背景是带有涂鸦的陈旧砖墙和老式公寓楼,周围聚集了一群围观的年轻人,有的在欢呼,有的正举着手机拍摄。阳光从侧面照射,为整个场景笼罩上一层温暖的金色调。 然而,画面中存在多处明显的 AI 生成缺陷。最显著的是扣篮者的右手,手指与篮球的接触方式显得扭曲且模糊,缺乏自然的抓握感。背景中围观人群的细节处理非常混乱:许多人的面部特征模糊不清或严重变形,部分人的手臂和腿部线条不自然地交织在一起,甚至出现了多余的肢体。此外,篮筐的网格结构在靠近边缘处显得杂乱无章,失去了真实的几何逻辑。这些细节揭示了图像并非真实摄影作品。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张图像在氛围营造、空间逻辑和人体结构方面表现优秀,街头篮球场的现场感极具感染力。然而最致命的问题是「左手扶篮筐」这一提示词核心动作要求完全未被执行——左手悬空而非扶筐,导致action_accuracy维度无法达到高分。身体后仰幅度不足也削弱了扣篮动作的戏剧张力。综合来看,这是一张视觉质量较高但动作细节执行不够精准的图像,在「简单动作测试」的任务目标下,核心动作描述的偏差是主要扣分点。 【GEMINI】这张图像在氛围和色彩上表现优异,成功捕捉了街头篮球的质感。然而,作为核心任务的「扣篮动作」在细节指令执行上存在明显缺失,特别是左手扶筐这一关键动作被忽略。更严重的是,AI 在处理高动态下的人体结构时出现了明显的腋下融合和手部畸形,这在专业评审眼中是不可忽视的硬伤。 【KIMI】该图像在氛围营造和环境细节上表现专业,但核心动作指令的执行出现严重偏差。左手扶筐这一扣篮动作的标志性要素完全缺失,导致「测试模型表现简单动作」的评估目标未能达成。模型似乎将「扣篮」理解为泛化的「跳跃投篮」,忽略了提示词中明确的手部交互细节。此外,防守球员的数量和姿态也与提示词不符。建议重新生成时强化对「左手-篮筐」接触关系的物理约束,以及多人物动态高度的层次控制。
相关链接
您可以通过以下链接查看更多相关内容: