GLM-Image 在「特定年龄人物」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：GLM-Image
用例名称：特定年龄人物
测试类型：图像生成
评测维度：人物生成

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

一个5岁的小男孩站在草地上，穿着蓝色T恤和牛仔短裤，圆圆的脸蛋，大大的眼睛，露出天真的笑容，背景是明亮的天空。

任务要求

AI 模型需要满足以下要求：

图像中呈现一个5岁左右的小男孩，头身比符合儿童比例（约1:4至1:5），面部圆润，无成人化骨骼特征
男孩面部具有明显儿童特征：脸蛋圆润饱满、眼睛相对面部比例较大、五官集中于面部中下方
男孩穿着蓝色T恤（颜色明确为蓝色）和牛仔短裤（可见牛仔布质感或典型款式）
男孩呈站立姿态，脚踩草地，背景为明亮的天空（蓝天或晴天效果）
男孩面部表情自然天真，呈现微笑或开心笑容，无刻意夸张或成人化神情
人物不得出现任何成熟化或年龄误导性特征，如过于修长的四肢、清晰的下颌轮廓线或皮肤纹理

评测结果

综合得分

该模型在此用例的得分为：75.7 分（满分 100 分），已通过

基础难度评测结果

得分：75.7 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展现了一个阳光明媚的户外场景，一名约五六岁的东亚男孩正对着镜头开怀大笑。男孩留着利落的黑色短发，身穿一件灰蓝色的短袖圆领 T 恤和深蓝色牛仔裤，身体略微前倾，仿佛正在草地上奔跑或玩耍。背景是广阔的绿色草地和清澈的蓝天白云，整体色调明亮、自然，给人一种充满活力的感觉。构图上采用了中近景，男孩位于画面中心，背景带有柔和的虚化效果。在 AI 生成的细节方面，画面存在几处明显的逻辑缺陷：首先是男孩的手部，右侧（画面左下角）的手掌形状模糊且手指数量异常，左侧（画面右下角）的手指也显得扭曲且比例失调。其次，男孩的牙齿排列过于细密且整齐得不自然，缺乏真实的生理结构。此外，背景草地与男孩身体交界处的边缘处理略显生硬，右下角还带有明显的“AI 生成”水印。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这张AI生成图像整体质量较高，成功呈现了儿童在户外草地上的活泼场景，蓝色T恤、蓝天草地等核心元素均有体现。主要问题在于：男孩姿势为俯身奔跑而非站立，与提示词存在明显偏差；画面构图导致下半身几乎不可见，牛仔短裤无法得到验证；眼睛特征未能充分体现「大大的眼睛」描述。年龄特征基本符合儿童形象，但面部略显成熟。综合来看，图像完成了大部分提示词要求，但在姿势还原和构图完整性上存在明显不足。【GEMINI】这是一张典型的 AI 生成图像，在构图和色彩上达到了及格线，但在关键的解剖结构（尤其是手部）和人物年龄特征的精细化塑造上表现不足。作为摄影评审，我无法忽视手部结构的崩坏和面部骨骼的成人化倾向，这些细节直接影响了图像的专业度和真实感。【KIMI】该图像在第一眼观感上具备「可爱儿童」的表象，但经不起专业审视。核心失败在于年龄定位的偏移——模型似乎将「5岁」理解为「较小的儿童」而非具有明确发育特征的年龄节点，导致面部比例、肢体比例均向成熟方向滑动。提示词要求的「圆圆的脸蛋、大大的眼睛」未能准确落实，反而呈现出一种精致的「小模特」气质。作为年龄测试任务，该结果未能通过5岁儿童的精准刻画检验，暴露出当前模型在细分年龄特征把握上的粗糙。

进阶难度评测结果

得分：67.7 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一个繁忙的医院走廊场景，一位留着深色短发的亚洲女性医生站在画面中央。她神情严肃，穿着白大褂和浅色衬衫，颈部挂着一副黑色听诊器，双手捧着一本翻开的书。在她身后，许多穿着蓝色刷手服或白大褂的医护人员正走动或站立，背景呈现出明显的透视感，天花板上的长条形灯光向远方延伸。画面色调以白色和蓝色为主，整体氛围专业且忙碌。在 AI 生成的细节方面，存在几处明显的缺陷：首先，中心女医生的手部结构异常，手指显得僵硬且比例不自然，尤其是握书的左手手指模糊不清。其次，她颈部的听诊器结构逻辑错误，耳管部分似乎直接悬浮或与衣领融合，缺乏合理的物理连接。此外，背景中人物的面部特征较为模糊扭曲，右侧一名穿着蓝色制服的男子手臂线条生硬，且其腰部的口袋细节显得杂乱。这些特征体现了 AI 在处理复杂人体结构和物体连接时的局限性。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像在静态医生形象的塑造上完成度较高，服装道具、发型、表情、环境氛围均基本符合提示词要求。然而存在两个核心失误：其一，主体人物完全未呈现「快步行走」的动态，而是以正面站立姿势直视镜头，这是对提示词最关键动作要求的失败；其二，人物面部年龄特征偏年轻，未能准确呈现35岁成熟女性的面部细节。这两点缺陷使图像整体表现停留在「基本完成但有明显瑕疵」的水平。【GEMINI】该图像在构图上中规中矩，但作为职业场景图，在专业细节和动作捕捉上表现较差。尤其是听诊器的佩戴错误和手部畸变，极大地破坏了图像的专业真实感，未能达到高质量AI生成图的标准。【KIMI】该图像在核心动作与道具上出现严重偏差，「快步行走」变为静止站立、「病历本」变为普通书籍，这两项失误直接违背提示词核心要求。年龄呈现也明显偏年轻。虽然画面整体视觉完成度尚可，但关键语义要素的错位使其难以满足测试目标。

困难难度评测结果

得分：63.9 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展现了一个温馨的室内场景，祖孙三代人正围坐在一起翻看相册。画面中央是一位白发苍苍的老年男性，他穿着深灰色毛衣坐在浅色布艺沙发上；左侧是一位穿白 T 恤的小男孩，正笑容灿烂地扶着相册；中间是一位穿着格子衬衫的中年男子，他身体前倾，一只手搭在老人肩上，另一只手指着相册。背景是充满生活气息的客厅，有木质书架、多盆绿色植物和挂满照片墙的相框，光线从窗外洒入，色调温暖和煦。画面存在明显的 AI 生成缺陷：中年男子搭在老人肩膀上的手部结构异常，手指数量和关节连接显得杂乱且不自然；他指向相册的另一只手，手指形状也较为模糊且比例失调。此外，背景墙上的照片内容模糊不清，呈现出扭曲的色块，书架上的书籍脊背缺乏细节，相册内部的页面也完全是空白的，缺乏真实的影像内容。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】图像在环境营造和部分服饰细节上完成度较高，客厅氛围温馨，光影自然。但核心测试目标「表现不同年龄」存在严重失误：孙子被生成为儿童而非25岁青年，这是对提示词最根本的偏差，直接导致三代年龄梯度测试失败。此外孙子坐姿位置错误（椅子而非地毯）、父亲白发特征缺失，均为明显的语义对齐问题。综合来看，图像部分完成了提示词要求，但在最核心的年龄测试维度上表现不及格。【GEMINI】该图像在氛围营造上表现尚可，但在核心的人物年龄刻画和解剖结构处理上表现较差。AI在处理多人交互场景时，对于肢体接触（如搭肩）和年龄特征的精细化区分能力明显不足，导致画面在近看时存在多处逻辑硬伤。【KIMI】本图在核心测试维度「年龄表现」上遭遇结构性失败。提示词明确要求测试「80岁-50岁-25岁」三代年龄区分，但模型将25岁青年降格为儿童，导致年龄谱系从「老中青」崩塌为「老中幼」，完全偏离测试意图。此错误可能源于模型对「孙子」一词的刻板关联（默认儿童）而非数值年龄（25岁）的忠实执行。此外，位置、道具、视线等细节多处偏离提示词。建议评分：严重未达标，需重新生成。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

进阶难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

困难难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

相关链接

反馈评测问题