qwen-image-max 在「情感表达」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:qwen-image-max
  • 用例名称:情感表达
  • 测试类型:图像生成
  • 评测维度:语义理解

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

一只小狗独自坐在雨中的公园长椅上,耷拉着耳朵,眼神忧伤地望着远方,周围是湿漉漉的落叶,整个画面呈现出灰蓝色调,表达深深的孤独感。

任务要求

AI 模型需要满足以下要求:

  1. 小狗独自坐在公园长椅上,姿态自然,画面构图体现主体的孤立感(如留白充足、主体周围无其他生命体)
  2. 小狗须呈现耷拉耳朵的具体形态,眼神方向朝向远方,神情忧伤,情感细节清晰可辨
  3. 雨天场景须有明确的视觉证据:可见雨丝、地面积水反射或雨雾效果至少其中一项
  4. 公园长椅形态完整清晰,小狗与长椅的位置关系明确(坐于其上)
  5. 画面中须有湿漉漉的落叶元素,落叶散布于长椅周围地面,具有潮湿质感
  6. 整体画面色调须以灰蓝色系为主导,冷色调覆盖画面主要区域,饱和度偏低以烘托孤独氛围

评测结果

综合得分

该模型在此用例的得分为:78.7 分(满分 100 分),已通过

基础难度评测结果

  • 得分:78.7 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只幼小的混血小狗,正独自坐在雨中的公园长椅上。这只小狗拥有黑棕相间的厚实毛发,胸前有一抹白毛,它垂着耳朵,眼神显得有些忧郁和迷茫。背景是深秋或初冬的公园,地面铺满了湿漉漉的枯黄落叶,远处的树木在阴雨天中显得模糊。长椅是深绿色的木质结构,表面布满了细密的雨滴。整体色调偏冷、偏暗,营造出一种凄凉、孤独的氛围。在 AI 生成的细节方面,存在明显的逻辑缺陷:小狗右前肢的爪子结构异常,脚趾数量和形状模糊不清,且与长椅接触的位置显得有些漂浮。此外,长椅靠背的木条纹理在右侧边缘处出现了不自然的扭曲和断裂,背景中的雨丝分布也略显生硬,缺乏真实的动态感。

图中展示了一只幼小的混血小狗,正独自坐在雨中的公园长椅上。这只小狗拥有黑棕相间的厚实毛发,胸前有一抹白毛,它垂着耳朵,眼神显得有些忧郁和迷茫。背景是深秋或初冬的公园,地面铺满了湿漉漉的枯黄落叶,远处的树木在阴雨天中显得模糊。长椅是深绿色的木质结构,表面布满了细密的雨滴。整体色调偏冷、偏暗,营造出一种凄凉、孤独的氛围。在 AI 生成的细节方面,存在明显的逻辑缺陷:小狗右前肢的爪子结构异常,脚趾数量和形状模糊不清,且与长椅接触的位置显得有些漂浮。此外,长椅靠背的木条纹理在右侧边缘处出现了不自然的扭曲和断裂,背景中的雨丝分布也略显生硬,缺乏真实的动态感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在场景还原层面表现出色,公园长椅、雨天氛围、湿落叶等核心场景元素均得到有效呈现,技术执行质量较高。然而在情感精准度和色调控制两个关键维度上存在明显偏差:小狗的耳朵未呈现「耷拉」的具体形态,眼神方向也未指向「远方」,导致提示词最核心的情感细节要求未能精确落地;同时主体暖棕色毛发与前景橙色落叶的高饱和度,使画面色调偏离了「灰蓝色系主导、低饱和度」的明确要求,整体呈现为秋季写实色调而非孤独冷调氛围。图像具备一定的情感感染力,但与提示词的精确要求之间仍有可见差距。 【GEMINI】画面成功捕捉了提示词要求的核心情感,小狗的形态与神情是整幅画作的灵魂。但在硬性物理逻辑上表现欠佳,尤其是雨丝的生成痕迹过重,长椅的透视结构在边缘处崩坏,这些技术瑕疵拉低了写实摄影的质感。 【KIMI】该图像在基础构图与色调框架上达标,但关键细节执行存在『概念替代』问题——用『湿润反光』替代『可见降雨』、用『自然下垂』替代『耷拉』、用『散落叶片』替代『湿漉漉落叶』。这些替代虽在语义上相关,却未能精确还原提示词要求的视觉特征,导致情感传达力度打折。作为情感概念测试,模型对抽象情绪词汇的具象转化能力仍有提升空间。

进阶难度评测结果

  • 得分:80.7 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一个深夜便利店的室内场景,透出一种孤独而静谧的氛围。画面中心是一位白发苍苍的老年男性,他穿着黑色厚外套,神情落寞地坐在靠窗的长吧台前,双臂交叠支在桌上,面前放着一杯珍珠奶茶。窗外是模糊的城市夜景,红色霓虹灯招牌在玻璃上留下倒影。背景中,一名店员正趴在收银柜台上休息,四周货架堆满了各类商品,白炽灯光显得有些冷清。 这张图片存在明显的 AI 生成缺陷:首先,老人的手部结构异常,交叠的手臂末端缺乏清晰的手指细节,显得模糊且扭曲。其次,左上角的红色霓虹灯文字呈现为无意义的乱码符号。此外,背景中店员的身体比例略显僵硬,且收银台上的设备细节模糊不清。吧台下方椅子的金属腿部线条也存在透视上的不连贯,与地面的衔接不够自然。

图中展示了一个深夜便利店的室内场景,透出一种孤独而静谧的氛围。画面中心是一位白发苍苍的老年男性,他穿着黑色厚外套,神情落寞地坐在靠窗的长吧台前,双臂交叠支在桌上,面前放着一杯珍珠奶茶。窗外是模糊的城市夜景,红色霓虹灯招牌在玻璃上留下倒影。背景中,一名店员正趴在收银柜台上休息,四周货架堆满了各类商品,白炽灯光显得有些冷清。

这张图片存在明显的 AI 生成缺陷:首先,老人的手部结构异常,交叠的手臂末端缺乏清晰的手指细节,显得模糊且扭曲。其次,左上角的红色霓虹灯文字呈现为无意义的乱码符号。此外,背景中店员的身体比例略显僵硬,且收银台上的设备细节模糊不清。吧台下方椅子的金属腿部线条也存在透视上的不连贯,与地面的衔接不够自然。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在情感氛围营造和场景还原上整体表现优秀,老人的神态姿态、收银员的打瞌睡细节、室内外光线对比均较好地完成了提示词的核心叙事意图。但存在两处不可忽视的偏差:其一是核心道具「咖啡杯」被替换为珍珠奶茶,改变了叙事道具的文化语境与情感符号;其二是老人视线方向与提示词「凝视窗外」的意象错位,使人物与都市夜景的情感对话缺失。这两处偏差均属于「关键要求未完全满足」的范畴,在高标准评审下应予以明确扣分。综合而言,这是一张质量较高但细节执行存在瑕疵的AI生成图像。 【GEMINI】这是一张情感张力极强的作品,在「孤独感」的传达上几乎达到了顶尖水平。老人的神态与背景收银员的呼应构成了完美的叙事闭环。然而,作为一名挑剔的评审,不能忽视其在物体建模上的低级错误:将咖啡误制作为奶茶,以及手臂与桌面的穿模问题,这些技术瑕疵拉低了画面的写实严谨性。 【KIMI】这是一张「氛围正确、细节崩塌」的典型AI图像。模型成功捕捉了「深夜便利店孤独老人」的表层情绪符号,但在执行层面暴露出严重的空间逻辑与道具叙事缺陷。咖啡杯与高脚椅这两个核心道具的错位,直接瓦解了提示词构建的情感锚点;窗外霓虹的单一化处理,使「都市光污染」的孤独背景沦为廉价滤镜。整体而言,图像适合缩略图浏览,经不起凝视——这正是当前AI生成图像的通病:情绪模仿到位,生活质感缺席。

困难难度评测结果

  • 得分:73.3 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展现了一个被废弃游乐园的黄昏景象,近景是一座破旧的旋转木马,远景可见一座巨大的摩天轮。画面色调温暖但略显凄凉,夕阳的光辉洒在木质地板和锈迹斑斑的设施上。旋转木马的主体是一匹白色的独角兽,身上装饰着彩色花纹,但漆面已经剥落。左侧的装饰板上有彩色玻璃窗,其中一块已经破碎。背景中,几个彩色气球静止地悬浮在空中,摩天轮的支架上爬满了绿色藤蔓。 画面中存在明显的 AI 生成缺陷:首先,旋转木马的机械结构逻辑混乱,独角兽下方的支撑杆并未垂直连接到圆盘中心,而是错位悬空或连接在奇怪的位置;其次,独角兽的后腿形态扭曲,与身体的衔接不自然;背景中的气球缺乏拉绳,且悬浮高度和透视感显得生硬,像是贴在背景上的色块;摩天轮的座舱细节模糊且结构不对称,整体呈现出一种超现实但逻辑不通的荒废感。

图中展现了一个被废弃游乐园的黄昏景象,近景是一座破旧的旋转木马,远景可见一座巨大的摩天轮。画面色调温暖但略显凄凉,夕阳的光辉洒在木质地板和锈迹斑斑的设施上。旋转木马的主体是一匹白色的独角兽,身上装饰着彩色花纹,但漆面已经剥落。左侧的装饰板上有彩色玻璃窗,其中一块已经破碎。背景中,几个彩色气球静止地悬浮在空中,摩天轮的支架上爬满了绿色藤蔓。

画面中存在明显的 AI 生成缺陷:首先,旋转木马的机械结构逻辑混乱,独角兽下方的支撑杆并未垂直连接到圆盘中心,而是错位悬空或连接在奇怪的位置;其次,独角兽的后腿形态扭曲,与身体的衔接不自然;背景中的气球缺乏拉绳,且悬浮高度和透视感显得生硬,像是贴在背景上的色块;摩天轮的座舱细节模糊且结构不对称,整体呈现出一种超现实但逻辑不通的荒废感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在场景元素的基本构建上完成度尚可,独角兽造型、夕阳氛围和空间纵深均有一定水准。然而在最关键的几个技术要求上存在明显缺失:彩色玻璃光斑投影完全缺席、摩天轮藤蔓覆盖严重不足、气球褪色感不够。更深层的问题在于情感表达的失衡——画面过于「好看」,废弃感和孤独感被美化的光线和鲜艳色彩所稀释,未能真正实现提示词所要求的「温暖与荒凉共存且形成张力」的双重情感冲突。整体呈现为一张视觉上较为悦目的「废墟美学」图像,但在情感深度和关键细节的精准落实上与提示词要求存在明显差距。 【GEMINI】这是一张氛围感极佳但细节经不起推敲的作品。模型在宏观叙事和色彩调性上精准捕捉了「孤独与温暖并存」的主题,但在执行具体的物理逻辑(如彩色玻璃投影)和特定细节要求(藤蔓覆盖率、气球真实感)时表现疲软。尤其是地面光影的缺失,使得原本可以成为视觉亮点的彩色玻璃元素沦为背景板,未能完成提示词中的核心光影挑战。 【KIMI】这是一张视觉完成度较高但叙事准确性存疑的AI图像。模型在「废弃游乐园」的氛围营造上表现熟练,却在关键叙事指令——「只有一匹独角兽完整」——上出现严重偏差,多匹马的并存直接瓦解了提示词的核心情感结构。此外,气球褪色感、藤蔓覆盖率、彩色玻璃光斑等细节均未达标,显示模型对量化描述和精确叙事指令的理解仍有局限。情感表达偏向安全的「怀旧美学」,未能实现提示词要求的温暖与荒凉之间的尖锐张力。整体属于「看起来不错但讲错了故事」的类型。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...