GLM-Image 在「特定年龄人物」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:GLM-Image
- 用例名称:特定年龄人物
- 测试类型:图像生成
- 评测维度:人物生成
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
一个5岁的小男孩站在草地上,穿着蓝色T恤和牛仔短裤,圆圆的脸蛋,大大的眼睛,露出天真的笑容,背景是明亮的天空。
任务要求
AI 模型需要满足以下要求:
- 图像中呈现一个5岁左右的小男孩,头身比符合儿童比例(约1:4至1:5),面部圆润,无成人化骨骼特征
- 男孩面部具有明显儿童特征:脸蛋圆润饱满、眼睛相对面部比例较大、五官集中于面部中下方
- 男孩穿着蓝色T恤(颜色明确为蓝色)和牛仔短裤(可见牛仔布质感或典型款式)
- 男孩呈站立姿态,脚踩草地,背景为明亮的天空(蓝天或晴天效果)
- 男孩面部表情自然天真,呈现微笑或开心笑容,无刻意夸张或成人化神情
- 人物不得出现任何成熟化或年龄误导性特征,如过于修长的四肢、清晰的下颌轮廓线或皮肤纹理
评测结果
综合得分
该模型在此用例的得分为:75.7 分(满分 100 分),已通过
基础难度评测结果
- 得分:75.7 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展现了一个阳光明媚的户外场景,一名约五六岁的东亚男孩正对着镜头开怀大笑。男孩留着利落的黑色短发,身穿一件灰蓝色的短袖圆领 T 恤和深蓝色牛仔裤,身体略微前倾,仿佛正在草地上奔跑或玩耍。背景是广阔的绿色草地和清澈的蓝天白云,整体色调明亮、自然,给人一种充满活力的感觉。构图上采用了中近景,男孩位于画面中心,背景带有柔和的虚化效果。 在 AI 生成的细节方面,画面存在几处明显的逻辑缺陷:首先是男孩的手部,右侧(画面左下角)的手掌形状模糊且手指数量异常,左侧(画面右下角)的手指也显得扭曲且比例失调。其次,男孩的牙齿排列过于细密且整齐得不自然,缺乏真实的生理结构。此外,背景草地与男孩身体交界处的边缘处理略显生硬,右下角还带有明显的“AI 生成”水印。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张AI生成图像整体质量较高,成功呈现了儿童在户外草地上的活泼场景,蓝色T恤、蓝天草地等核心元素均有体现。主要问题在于:男孩姿势为俯身奔跑而非站立,与提示词存在明显偏差;画面构图导致下半身几乎不可见,牛仔短裤无法得到验证;眼睛特征未能充分体现「大大的眼睛」描述。年龄特征基本符合儿童形象,但面部略显成熟。综合来看,图像完成了大部分提示词要求,但在姿势还原和构图完整性上存在明显不足。 【GEMINI】这是一张典型的 AI 生成图像,在构图和色彩上达到了及格线,但在关键的解剖结构(尤其是手部)和人物年龄特征的精细化塑造上表现不足。作为摄影评审,我无法忽视手部结构的崩坏和面部骨骼的成人化倾向,这些细节直接影响了图像的专业度和真实感。 【KIMI】该图像在第一眼观感上具备「可爱儿童」的表象,但经不起专业审视。核心失败在于年龄定位的偏移——模型似乎将「5岁」理解为「较小的儿童」而非具有明确发育特征的年龄节点,导致面部比例、肢体比例均向成熟方向滑动。提示词要求的「圆圆的脸蛋、大大的眼睛」未能准确落实,反而呈现出一种精致的「小模特」气质。作为年龄测试任务,该结果未能通过5岁儿童的精准刻画检验,暴露出当前模型在细分年龄特征把握上的粗糙。
进阶难度评测结果
- 得分:67.7 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一个繁忙的医院走廊场景,一位留着深色短发的亚洲女性医生站在画面中央。她神情严肃,穿着白大褂和浅色衬衫,颈部挂着一副黑色听诊器,双手捧着一本翻开的书。在她身后,许多穿着蓝色刷手服或白大褂的医护人员正走动或站立,背景呈现出明显的透视感,天花板上的长条形灯光向远方延伸。画面色调以白色和蓝色为主,整体氛围专业且忙碌。 在 AI 生成的细节方面,存在几处明显的缺陷:首先,中心女医生的手部结构异常,手指显得僵硬且比例不自然,尤其是握书的左手手指模糊不清。其次,她颈部的听诊器结构逻辑错误,耳管部分似乎直接悬浮或与衣领融合,缺乏合理的物理连接。此外,背景中人物的面部特征较为模糊扭曲,右侧一名穿着蓝色制服的男子手臂线条生硬,且其腰部的口袋细节显得杂乱。这些特征体现了 AI 在处理复杂人体结构和物体连接时的局限性。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在静态医生形象的塑造上完成度较高,服装道具、发型、表情、环境氛围均基本符合提示词要求。然而存在两个核心失误:其一,主体人物完全未呈现「快步行走」的动态,而是以正面站立姿势直视镜头,这是对提示词最关键动作要求的失败;其二,人物面部年龄特征偏年轻,未能准确呈现35岁成熟女性的面部细节。这两点缺陷使图像整体表现停留在「基本完成但有明显瑕疵」的水平。 【GEMINI】该图像在构图上中规中矩,但作为职业场景图,在专业细节和动作捕捉上表现较差。尤其是听诊器的佩戴错误和手部畸变,极大地破坏了图像的专业真实感,未能达到高质量AI生成图的标准。 【KIMI】该图像在核心动作与道具上出现严重偏差,「快步行走」变为静止站立、「病历本」变为普通书籍,这两项失误直接违背提示词核心要求。年龄呈现也明显偏年轻。虽然画面整体视觉完成度尚可,但关键语义要素的错位使其难以满足测试目标。
困难难度评测结果
- 得分:63.9 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展现了一个温馨的室内场景,祖孙三代人正围坐在一起翻看相册。画面中央是一位白发苍苍的老年男性,他穿着深灰色毛衣坐在浅色布艺沙发上;左侧是一位穿白 T 恤的小男孩,正笑容灿烂地扶着相册;中间是一位穿着格子衬衫的中年男子,他身体前倾,一只手搭在老人肩上,另一只手指着相册。背景是充满生活气息的客厅,有木质书架、多盆绿色植物和挂满照片墙的相框,光线从窗外洒入,色调温暖和煦。 画面存在明显的 AI 生成缺陷:中年男子搭在老人肩膀上的手部结构异常,手指数量和关节连接显得杂乱且不自然;他指向相册的另一只手,手指形状也较为模糊且比例失调。此外,背景墙上的照片内容模糊不清,呈现出扭曲的色块,书架上的书籍脊背缺乏细节,相册内部的页面也完全是空白的,缺乏真实的影像内容。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】图像在环境营造和部分服饰细节上完成度较高,客厅氛围温馨,光影自然。但核心测试目标「表现不同年龄」存在严重失误:孙子被生成为儿童而非25岁青年,这是对提示词最根本的偏差,直接导致三代年龄梯度测试失败。此外孙子坐姿位置错误(椅子而非地毯)、父亲白发特征缺失,均为明显的语义对齐问题。综合来看,图像部分完成了提示词要求,但在最核心的年龄测试维度上表现不及格。 【GEMINI】该图像在氛围营造上表现尚可,但在核心的人物年龄刻画和解剖结构处理上表现较差。AI在处理多人交互场景时,对于肢体接触(如搭肩)和年龄特征的精细化区分能力明显不足,导致画面在近看时存在多处逻辑硬伤。 【KIMI】本图在核心测试维度「年龄表现」上遭遇结构性失败。提示词明确要求测试「80岁-50岁-25岁」三代年龄区分,但模型将25岁青年降格为儿童,导致年龄谱系从「老中青」崩塌为「老中幼」,完全偏离测试意图。此错误可能源于模型对「孙子」一词的刻板关联(默认儿童)而非数值年龄(25岁)的忠实执行。此外,位置、道具、视线等细节多处偏离提示词。建议评分:严重未达标,需重新生成。
相关链接
您可以通过以下链接查看更多相关内容: