qwen-image-max 在「《背影》经典场景插画生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:qwen-image-max
- 用例名称:《背影》经典场景插画生成
- 测试类型:图像生成
- 评测维度:教材插图
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张插画,表现朱自清《背影》中父亲穿过铁道去买橘子的场景。 画面要求: - 人物为一位肥胖的中年男性背影 - 身穿黑布大马褂、深青布棉袍,头戴黑布小帽 - 人物正在攀爬月台,姿态笨拙 - 背景为老式火车站月台
任务要求
AI 模型需要满足以下要求:
- 画面中有一位肥胖中年男性的背影
- 人物穿着黑布大马褂与深青布棉袍,头戴黑布小帽
- 人物姿态体现攀爬月台的动作
- 背景可见老式火车站或月台元素
- 整体画面清晰,人物主体突出
评测结果
综合得分
该模型在此用例的得分为:67.7 分(满分 100 分),已通过
基础难度评测结果
- 得分:67.7 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】图像在构图立意上抓住了《背影》的核心——父亲背影持橘,但在两个最关键的维度上存在明显失分:其一,服饰的历史还原不够准确,「大马褂」的传统形制未能体现;其二,「攀爬月台」这一《背影》中最具情感张力的核心动作完全缺失,人物仅呈弯腰站立状态,未能还原父亲费力翻越月台的笨拙与艰辛,导致画面的叙事感大打折扣。场景背景还原较为成功。整体而言,图像停留在「父亲在月台买橘子」的表层,未能深入还原「攀爬」这一最具文学价值的动作细节。 【GEMINI】该图像在环境渲染上表现出色,但在核心叙事动作「攀爬」上完全失败。人物姿态与《背影》原文描述的艰辛攀爬感背道而驰,且存在明显的 AI 生成缺陷(手部畸变)。虽然服饰色彩符合要求,但人物角度和动作逻辑的偏差使得其作为文学插画的合格度大幅降低。 【KIMI】该图像在氛围营造上具备一定水准,但核心动作的严重偏离构成致命缺陷。模型将「攀爬月台」误读为「月台行走」,导致整个场景的叙事根基崩塌——没有攀爬,就没有《背影》。服饰的色彩与形制偏差进一步削弱了时代还原度。建议重新生成时明确强调「身体前倾攀爬高台」「一脚蹬地一脚抬起」「双手攀附边缘」等关键姿态描述。
进阶难度评测结果
- 得分:72.4 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在构图和基本人物姿态上有一定完成度,但在最核心的两项要求上存在明显失误:服饰还原严重偏差(夹克+长裤替代马褂+棉袍)和攀爬动作缺失(弯腰拾物替代翻越月台)。这两项恰恰是《背影》场景还原的灵魂所在。色调偏冷也与提示词要求的暖灰基调相悖。整体而言,图像具备基本的场景框架,但在文学经典情感场景的精准还原上存在多处关键性偏差,未能充分传递朱自清笔下那个特定历史语境中父爱的厚重与辛酸。 【GEMINI】这张图像在视觉风格和环境营造上非常成功,精准捕捉了老课本的怀旧感。然而,在核心叙事动作上出现了严重偏差,将艰难的「攀爬」误表达为轻松的「跪立」,且在橘子和手部细节上存在明显的AI生成瑕疵,削弱了文学经典的感染力。 【KIMI】此图对《背影》核心场景的理解存在根本性偏差。最关键的失败在于动作姿态——模型将「攀爬月台」误解为「跪地捡拾」,导致整个叙事场景崩塌。服饰方面将传统长袍马褂替换为短外套长裤,丧失了民国父亲的典型形象特征。橘子位置的错误进一步偏离原文情节。虽然画面技术完成度尚可,但作为文学经典场景的还原,在人物、动作、道具三个核心要素上均出现严重失误,情感表达力薄弱。
困难难度评测结果
- 得分:64.1 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在场景元素和道具方面有一定完成度,橘子、蒸汽火车、铁轨等元素均有呈现。但在两个最核心的要求上严重失败:其一,父亲的攀爬动作完全错误,图中呈现的是弯腰放置橘子的姿态而非从铁道侧艰难攀爬月台;其二,构图视角根本性偏差,未实现「儿子俯视父亲攀爬」的叙事视角,站台高度差透视关系缺失。这两点失误直接导致《背影》最核心的情感叙事——父亲笨拙而艰辛地攀爬月台买橘子——无法通过画面传递,与提示词的核心意图严重背离。 【GEMINI】这张图像在服饰和环境质感上达到了较高的还原度,但在核心叙事逻辑上存在重大偏差。最致命的问题在于视角完全背离了提示词要求的「儿子俯视视角」,使得攀爬动作变得平淡且缺乏张力。同时,人物脚步的支撑点错误属于低级的物理逻辑问题,严重影响了画面的真实感。虽然色彩和光影营造了不错的氛围,但作为一张文学经典插画,其叙事准确性不及格。 【KIMI】这是一次对经典文学场景的「形似神非」式还原。模型捕捉了「火车站」「父亲」「橘子」等符号元素,却在最核心的「攀爬动作」与「俯视视角」上完全偏离,导致叙事瞬间从「艰难的爱」滑向「普通的劳作」。服饰的现代化改编与光影的顺光处理进一步削弱了时代厚重感。作为语文课本插画,其情感穿透力不足;作为AI生成测试,显示出模型对复杂动作语义(「攀爬」「努力」「笨拙」)与特定视角关系(「俯视」「高度差」)的理解仍有显著缺陷。建议重新生成时强化「身体向上腾起、双腿弯曲蹬踏、双手撑台发力」的动态瞬间,并严格锁定俯视视角。
相关链接
您可以通过以下链接查看更多相关内容: