Google: Gemini 3.1 Flash Image Preview (Nano Banana 2) 在「简单动作」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:Google: Gemini 3.1 Flash Image Preview (Nano Banana 2)
  • 用例名称:简单动作
  • 测试类型:图像生成
  • 评测维度:动作表现

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

一个小男孩正在客厅里跳跃,双脚离地,双臂向上高举,脸上露出兴奋的表情。他穿着蓝色T恤和短裤,背景是简洁的白色墙壁和木地板。

任务要求

AI 模型需要满足以下要求:

  1. 画面中必须呈现一名小男孩(单一人物),双脚同时明显离地,脚底与地面之间有可见间距,清晰表现跳跃瞬间的腾空状态
  2. 双臂须向上高举,手臂抬起高度至少达到肩部以上,整体姿势与跳跃动作协调一致,符合自然跳跃时的肢体运动规律
  3. 面部须呈现兴奋、喜悦的表情(如张嘴大笑、眼睛睁大等),表情与跳跃动作的活力感相匹配
  4. 人体结构须完整正确:四肢数量正确,各关节(肘、膝、踝)弯曲方向符合生理学逻辑,无多余肢体、断肢或明显比例失调
  5. 人物须穿着蓝色T恤和短裤,服装颜色与描述一致,无明显颜色偏差
  6. 背景须为简洁的室内环境,包含白色(或浅色)墙壁与木质地板,背景元素简洁,不干扰主体人物的视觉呈现

评测结果

综合得分

该模型在此用例的得分为:88.7 分(满分 100 分),已通过

基础难度评测结果

  • 得分:88.7 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:Google: Gemini 3.1 Flash Image Preview (Nano Banana 2)
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张高质量的AI生成图像,对提示词的还原度极高。跳跃动作、服装颜色、背景环境三大核心要求均得到出色执行,尤其是动态感的捕捉和儿童表情的生动性表现突出。人体结构整体合理,仅左腿透视存在轻微瑕疵。背景元素略比提示词描述丰富,但不影响主体表达。综合来看,该图像属于AI生成图像中的优秀水准,加权总分约为92分。 【GEMINI】这是一张视觉冲击力很强的动态抓拍模拟图,在动作还原和场景一致性上表现卓越。然而,AI 在处理极端动态下的末端肢体(手指、脚尖)时露出了马脚,存在明显的解剖学错误,拉低了整体的专业严谨性。 【KIMI】这是一张完成度较高的AI生成图像,核心要求(跳跃动作、服装颜色、背景环境)均得到满足。主要扣分项集中在解剖细节的精确性(膝关节畸形、脚踝模糊)和动作张力的不足(跳跃高度偏低)。作为「测试简单动作」的生成任务,模型表现良好,但在动态肢体的生理结构还原上仍有提升空间。整体属于「基本完成要求,但存在1-2处明显瑕疵」的区间。

进阶难度评测结果

  • 得分:73.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一位芭蕾舞女演员在宏伟剧院舞台上翩翩起舞的瞬间。画面中心,舞者身着精致的粉红色蕾丝芭蕾舞裙,正单脚脚尖伫立在木质地板上,双臂向两侧优雅舒展,另一条腿向斜上方抬起,姿态轻盈优美。背景是深邃且略显模糊的观众席,暖黄色的舞台灯光从上方和侧面打下,为舞者镀上了一层柔和的光晕,营造出梦幻的表演氛围。然而,画面中存在明显的 AI 生成缺陷:舞者的右手手指线条混乱,呈现出不自然的扭曲和多余的关节;左脚足尖鞋与地面的接触点透视异常,阴影处理略显生硬;此外,背景中远处的观众面部细节缺失,呈现出扭曲的色块。尽管如此,整体构图平衡,色彩温润,捕捉到了舞蹈艺术的动感与张力。

图中展示了一位芭蕾舞女演员在宏伟剧院舞台上翩翩起舞的瞬间。画面中心,舞者身着精致的粉红色蕾丝芭蕾舞裙,正单脚脚尖伫立在木质地板上,双臂向两侧优雅舒展,另一条腿向斜上方抬起,姿态轻盈优美。背景是深邃且略显模糊的观众席,暖黄色的舞台灯光从上方和侧面打下,为舞者镀上了一层柔和的光晕,营造出梦幻的表演氛围。然而,画面中存在明显的 AI 生成缺陷:舞者的右手手指线条混乱,呈现出不自然的扭曲和多余的关节;左脚足尖鞋与地面的接触点透视异常,阴影处理略显生硬;此外,背景中远处的观众面部细节缺失,呈现出扭曲的色块。尽管如此,整体构图平衡,色彩温润,捕捉到了舞蹈艺术的动感与张力。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在视觉观感上颇具美感,服装、场景和人体结构均有较高完成度,但在最核心的「动作准确性」上存在根本性偏差——生成的动作更接近侧向的阿提蒂德或阿拉贝斯克变体,而非提示词要求的标准阿拉贝斯克(腿向正后方高抬至水平)。双臂姿态也偏离了标准阿拉贝斯克的手臂规范。对于一个以「测试模型表现简单动作」为目的的任务,这一核心动作的失准是不可忽视的失败,说明模型对芭蕾专业动作的理解存在明显局限。 【GEMINI】这是一张视觉冲击力较强但经不起专业推敲的作品。模型在渲染服装材质和舞台光影方面表现出色,但在核心的芭蕾舞专业姿态(尤其是手臂线条)和关键的解剖学细节(支撑脚的足尖结构)上出现了明显失误。支撑脚的畸形是整幅画作最大的硬伤,直接破坏了动作的稳定性与美感。 【KIMI】该图像作为「芭蕾舞美学」的展示尚可,但作为「阿拉贝斯克动作准确性」的测试则明显不达标。核心失败在于右腿的高度与伸直状态——这是阿拉贝斯克最标志性的技术要素,却呈现为弯曲的中低抬腿,更接近「 attitude 」或其他舞姿。AI模型似乎更擅长捕捉「优雅的舞蹈感」而非「精确的动作规范」,在需要严格解剖学和技术标准的专业领域暴露了其理解偏差。评分需严厉:动作维度因关键要求未满足而低于75分,解剖维度因结构可疑处较多同步降分,场景维度相对最好但仍非完美。

困难难度评测结果

  • 得分:76.3 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一个充满活力的户外街头篮球比赛场景。画面中央,一名身穿红色 8 号球衣和黑色短裤的非裔球员正高高跃起准备扣篮,他肌肉线条分明,单手托球,姿态极具爆发力。两名身穿蓝色球衣的防守球员正举手试图封盖。背景是充满生活气息的城市建筑和铁丝网围栏,大批观众围在场边,有的在欢呼,有的正举着手机拍摄。阳光从侧后方射入,为球员轮廓镀上了一层金边,营造出热烈的黄昏氛围。 然而,画面中存在多处明显的 AI 生成缺陷:首先,最显眼的是防守球员的手部,左侧蓝衣球员举起的右手手指数量异常且扭曲;其次,扣篮球员的左手手指显得过长且关节僵硬;背景中的观众面部特征模糊或扭曲,部分人的肢体与躯干连接不自然;此外,篮筐的结构与篮网的透视关系也略显生硬,右下角拍摄者的手部和手机比例也存在透视异常。

图中展示了一个充满活力的户外街头篮球比赛场景。画面中央,一名身穿红色 8 号球衣和黑色短裤的非裔球员正高高跃起准备扣篮,他肌肉线条分明,单手托球,姿态极具爆发力。两名身穿蓝色球衣的防守球员正举手试图封盖。背景是充满生活气息的城市建筑和铁丝网围栏,大批观众围在场边,有的在欢呼,有的正举着手机拍摄。阳光从侧后方射入,为球员轮廓镀上了一层金边,营造出热烈的黄昏氛围。

然而,画面中存在多处明显的 AI 生成缺陷:首先,最显眼的是防守球员的手部,左侧蓝衣球员举起的右手手指数量异常且扭曲;其次,扣篮球员的左手手指显得过长且关节僵硬;背景中的观众面部特征模糊或扭曲,部分人的肢体与躯干连接不自然;此外,篮筐的结构与篮网的透视关系也略显生硬,右下角拍摄者的手部和手机比例也存在透视异常。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在视觉冲击力和氛围营造方面表现卓越,黄金时段的逆光处理、密集的观众群体和街头文化元素共同打造了极具感染力的城市篮球场景。然而在核心动作还原上存在一个关键性失误:提示词明确要求「左手扶着篮筐边缘」,但图像呈现的是左手完全悬空的单手扣篮姿态,这一偏差直接影响了action_accuracy维度的得分。双腿弯曲程度不足也是次要问题。综合来看,图像在氛围、空间逻辑和人体结构方面表现优秀,但对提示词核心动作细节的忠实还原度存在明显缺口,属于「视觉效果优秀但动作描述执行不完整」的典型案例。 【GEMINI】这张图像在氛围感和光影渲染上达到了极高水准,但在核心动作还原和人体结构严谨性上表现欠佳。最致命的问题在于完全忽略了「左手扶筐」这一明确的动作指令,且近景手部畸形严重拉低了画面的专业度。作为 AI 生成图像,其背景人群的崩坏也是典型的质量短板。 【KIMI】该图像在氛围营造和基础视觉呈现上具备一定水准,但在核心动作准确性上存在严重偏差。提示词明确要求的「左手扶筐」动作完全缺失,且身体姿态方向相反,这属于对指令关键要素的实质性违背。作为「测试模型表现简单动作」的任务,模型未能正确理解并执行描述性动作的空间关系,将「右手抓球+左手扶筐」的双侧支撑动作错误渲染为单手扣篮。此外,防守球员的高度层次关系也未达到「明显不够」的视觉要求。综合评判,该图像在完成提示词核心动作要求方面表现不佳,但在场景氛围和色彩表现上有一定可取之处。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...