GLM-Image 在「人物表情」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:GLM-Image
  • 用例名称:人物表情
  • 测试类型:图像生成
  • 评测维度:人物生成

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

一位中年男性坐在公园长椅上,面露忧郁的表情,眉头紧锁,眼神望向远方,嘴角微微下垂,双手交叉放在膝盖上。他穿着深色的休闲外套,背景是秋天的公园,有几片落叶飘过。

任务要求

AI 模型需要满足以下要求:

  1. 画面中的中年男性面部须呈现明显忧郁表情,眉头紧锁(可见皱眉纹),嘴角向下弯曲
  2. 人物眼神方向明确朝向画面远处或侧方,而非直视镜头
  3. 人物坐姿自然,双手交叉叠放于膝盖之上,动作清晰可辨
  4. 服装为深色(深灰、深蓝或黑色)休闲外套,颜色与款式符合描述
  5. 背景呈现秋季公园特征,包含暖色调(橙/黄/红)落叶元素,且有落叶飘落的动态感
  6. 人物面部结构完整,五官比例正常,无畸形、融合或多余器官

评测结果

综合得分

该模型在此用例的得分为:75.2 分(满分 100 分),已通过

基础难度评测结果

  • 得分:75.2 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展现了一位中年亚洲男性独自坐在秋日公园长椅上的半身特写。他留着整齐的黑色短发,身穿一件质感厚实的深灰色毛呢外套,双手交叠放在膝头,眼神低垂,神情显得忧郁且充满思虑。背景是色彩浓郁的秋天景色,金黄色的树木在柔和的自然光下呈现出虚化的美感,地面铺满了落叶。构图上,人物位于画面中心偏左,营造出一种孤独沉思的氛围。在 AI 生成的细节方面,存在一些明显的逻辑缺陷:男子的双手交叠处结构混乱,手指的数量和关节衔接显得不自然,呈现出相互嵌入的扭曲感;此外,他外套左侧的领口与肩膀的衔接处透视略显生硬,与身体的结构不够贴合。右下角标有“AI生成”的半透明字样。

图中展现了一位中年亚洲男性独自坐在秋日公园长椅上的半身特写。他留着整齐的黑色短发,身穿一件质感厚实的深灰色毛呢外套,双手交叠放在膝头,眼神低垂,神情显得忧郁且充满思虑。背景是色彩浓郁的秋天景色,金黄色的树木在柔和的自然光下呈现出虚化的美感,地面铺满了落叶。构图上,人物位于画面中心偏左,营造出一种孤独沉思的氛围。在 AI 生成的细节方面,存在一些明显的逻辑缺陷:男子的双手交叠处结构混乱,手指的数量和关节衔接显得不自然,呈现出相互嵌入的扭曲感;此外,他外套左侧的领口与肩膀的衔接处透视略显生硬,与身体的结构不够贴合。右下角标有“AI生成”的半透明字样。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张AI生成图像整体完成度较好,人物主体特征、服装和背景季节感均有较准确的呈现。最核心的表情维度存在明显不足——忧郁情绪的表达强度偏弱,眉头紧锁不够明显,整体情绪更偏向平静沉思而非提示词要求的明显忧郁。手部姿势与提示词描述存在细节偏差,背景缺乏落叶飘落的动态感。综合来看,图像质量尚可但在情绪表达这一核心测试目标上未能充分达标。 【GEMINI】这是一张在氛围营造上表现尚可,但在细节处理上(尤其是手部)存在明显硬伤的 AI 生成图像。模型在处理复杂肢体动作时依然表现出明显的局限性,导致画面在近距离观察时缺乏说服力。 【KIMI】该图像在人物主体与姿势呈现上表现稳健,但核心短板在于背景氛围的失职——提示词明确要求的落叶动态完全缺失,这是不可接受的遗漏。面部表情处于「及格但不够强烈」的区间,未能充分释放忧郁情绪的视觉张力。作为「测试模型表现特定表情」的任务,表情强度与背景叙事的双重不足使其难以进入优秀行列。

进阶难度评测结果

  • 得分:66.6 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一个热闹的生日派对场景,四名亚洲青年男女正围着一个插有五根点燃蜡烛的白色奶油蛋糕。画面中心是一位戴着粉色尖顶生日帽的长发女性,她面带灿烂的笑容,脸颊红润。她身后站着两名男性和一名女性,都在欢快地鼓掌庆祝。背景充满了五颜六色的气球和派对彩旗,整体色调明亮温暖,洋溢着喜庆的气氛。 然而,画面中存在多处明显的 AI 生成缺陷。最显著的是人物的手部:左侧男性的左手手指数量异常且扭曲,右手掌心与手指的连接逻辑混乱;右侧女性举起的双手手指细长且排列密集,看起来极不自然。此外,中心女性的牙齿结构过于整齐且密集,缺乏真实的牙缝细节。背景中气球的线条与人物手部的衔接也显得生硬且不合常理,这些特征共同指向了这张图片的 AI 生成属性。

图中展示了一个热闹的生日派对场景,四名亚洲青年男女正围着一个插有五根点燃蜡烛的白色奶油蛋糕。画面中心是一位戴着粉色尖顶生日帽的长发女性,她面带灿烂的笑容,脸颊红润。她身后站着两名男性和一名女性,都在欢快地鼓掌庆祝。背景充满了五颜六色的气球和派对彩旗,整体色调明亮温暖,洋溢着喜庆的气氛。

然而,画面中存在多处明显的 AI 生成缺陷。最显著的是人物的手部:左侧男性的左手手指数量异常且扭曲,右手掌心与手指的连接逻辑混乱;右侧女性举起的双手手指细长且排列密集,看起来极不自然。此外,中心女性的牙齿结构过于整齐且密集,缺乏真实的牙缝细节。背景中气球的线条与人物手部的衔接也显得生硬且不合常理,这些特征共同指向了这张图片的 AI 生成属性。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张AI生成图像在氛围营造和场景元素方面表现出色,背景装饰丰富、人物互动自然、色彩喜庆饱满。然而,图像在最核心的任务要求上出现了根本性失误:提示词明确要求女孩「正在吹生日蛋糕上的蜡烛」,但模型生成的是大张嘴大笑的表情,完全没有实现吹蜡烛的收拢嘴型动作。这一失误暴露了模型在处理「特定动作表情」时的局限性——它选择了更「安全」的大笑表情,而放弃了更难生成的吹气动作。对于「测试模型表现特定表情」这一任务描述而言,这是一次不及格的表现。 【GEMINI】该图像在构图和色彩上达到了及格线,但在关键的「动作逻辑」和「细节解剖」上表现较差。AI 在处理复杂的手部动作和物理交互(如吹蜡烛)时显得力不从心,导致画面在细看之下破绽百出,未能满足提示词中对动作精准度的要求。 【KIMI】该图像在氛围营造和道具呈现上达到基础水平,但核心动作指令「吹蜡烛」完全失败,表情呈现与提示词要求存在本质性偏差。模型似乎将「吹蜡烛」与「大笑庆祝」两种场景混淆,导致嘴型、表情逻辑无法自洽。作为「测试模型表现特定表情」的任务,关键表情动作的失准构成严重扣分项。双颊泛红和手部细节进一步暴露生成质量的不稳定性。整体属于「部分完成要求,有多处需要改进」的档次,主要问题集中在表情-动作一致性这一核心维度。

困难难度评测结果

  • 得分:72.9 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展现了一位满头白发的老年男性画家,正身处光线明亮的画室中专心创作。他面容和蔼,皮肤布满皱纹,穿着一件深绿色的长袖衬衫,外面套着一件沾满五彩颜料点缀的米白色围裙。他右手横握着一支细长的画笔,左手托着一个色彩斑斓的调色盘,正面对着画面右侧的画布。背景中,墙上挂着多幅风景油画和素描稿,窗边透进柔和的自然光,营造出宁静的艺术氛围。然而,画面存在明显的 AI 生成缺陷:画家的右手握笔姿势极其不自然,手指结构模糊且扭曲,画笔似乎直接穿过了手掌而非被手指握住;左手大拇指的比例异常粗大,且调色盘的边缘与手部的衔接处显得生硬、缺乏真实的透视感。此外,背景中部分画框的线条略显歪斜。

图中展现了一位满头白发的老年男性画家,正身处光线明亮的画室中专心创作。他面容和蔼,皮肤布满皱纹,穿着一件深绿色的长袖衬衫,外面套着一件沾满五彩颜料点缀的米白色围裙。他右手横握着一支细长的画笔,左手托着一个色彩斑斓的调色盘,正面对着画面右侧的画布。背景中,墙上挂着多幅风景油画和素描稿,窗边透进柔和的自然光,营造出宁静的艺术氛围。然而,画面存在明显的 AI 生成缺陷:画家的右手握笔姿势极其不自然,手指结构模糊且扭曲,画笔似乎直接穿过了手掌而非被手指握住;左手大拇指的比例异常粗大,且调色盘的边缘与手部的衔接处显得生硬、缺乏真实的透视感。此外,背景中部分画框的线条略显歪斜。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张AI生成图像在老年画家的整体形象塑造上有一定水准,皮肤质感和围裙颜料细节表现较好。然而在「测试模型表现特定表情」这一核心任务上存在明显不足:眼神未聚焦于画布、嘴唇紧抿感不足、额头汗珠完全缺失,这三点都是提示词明确要求的关键表情细节,直接影响「高度专注」复合情绪的精准传达。图像更像是一位画家「看向观众」的肖像照,而非「专注作画中」的抓拍状态,与提示词的核心意图存在一定偏差。 【GEMINI】该图像在光影氛围和背景构建上表现良好,但在核心人物动作逻辑和微小细节(如汗珠、握笔)上未能满足提示词要求。作为一幅表现「专注作画」的作品,人物眼神的失焦和手部结构的崩坏是致命伤,导致整体叙事感大打折扣。 【KIMI】该图像在基础视觉呈现上具备一定完成度,但在核心任务——「表现特定表情(高度专注)」上存在严重失败。人物情绪状态与提示词要求背道而驰,从「专注锐利的创作者」滑向「疲惫忧郁的老人」,这是不可接受的偏差。关键细节如汗珠、面部颜料、自然握笔姿势的缺失进一步削弱可信度。模型似乎更擅长渲染「氛围感」而非精准控制「表情状态」,在需要精确情绪传达的任务中表现薄弱。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...