wan2.7-image 在「复杂比喻」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：wan2.7-image
用例名称：复杂比喻
测试类型：图像生成
评测维度：语义理解

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一张图片：时间是河流的隐喻画面。一条发光的河流从远处流来，河水由无数钟表、日历页和沙漏组成，流经一个人站在河岸边，看着河水带走他的青春照片和记忆碎片。简洁构图，重点突出时间流逝的概念。

任务要求

AI 模型需要满足以下要求：

画面必须包含一条清晰可辨的河流作为核心视觉主体
河水中必须融入至少2种时间相关符号（钟表、日历页、沙漏三选二），且符号需与河流形成视觉上的融合关系（如构成水流或随水流动），而非简单叠加
必须有一个人物站立于河岸边，姿态朝向河流（如凝视、俯视），体现"观看"的动作关系
整体画面须能传达时间流逝的隐喻概念，观者无需额外说明即可感知抽象含义
构图应保持简洁，避免过多装饰性元素干扰主题，视觉重心集中于河流与人物的关系

评测结果

综合得分

该模型在此用例的得分为：65.5 分（满分 100 分），已通过

基础难度评测结果

得分：65.5 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像在视觉形式上完成了部分要求，但在隐喻逻辑上发生了根本性偏移——将「时间是河流」转化为「时间是道路」，失去了河流流动、带走记忆的核心叙事逻辑。最关键的「青春照片和记忆碎片」元素完全缺失，人物与时间流的关系也从「岸边观看」变为「站在路上」，削弱了旁观者面对时间流逝的情感张力。加之乱码文字和过于密集的元素堆砌，整体完成度偏低，未能有效传达提示词所要求的复杂隐喻意境。【GEMINI】这是一张在视觉表现力上尚可，但在深度隐喻理解和指令执行上存在明显偏差的作品。模型采取了‘堆砌元素’的偷懒策略，未能实现提示词要求的结构性融合（如钟表齿轮构成水流纹理）。构图过于追求宏大叙事而忽略了‘简洁’与‘情感连接’，导致画面更像是一张通用的奇幻背景图，而非精准的时间隐喻艺术品。【KIMI】图像基本遵循了提示词要求，包含了河流、时间符号和人物。然而，人物的姿态和朝向河流的互动关系不够明确，时间符号的排列和分布略显杂乱，缺乏内在逻辑性。河流和时间符号的排列略显拥挤，缺乏视觉层次感，影响了画面的简洁性和艺术质量。

进阶难度评测结果

得分：72.5 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这张图像在场景营造和氛围渲染上表现出色，成功建立了「图书馆+发光书本」的知识隐喻基础框架。然而，它在最关键的叙事层面严重失败：提示词的核心要求是「有的人沐浴在光中变得明亮，有的人背对光明仍在阴影里」——这种人物状态的明暗对比才是整个隐喻的灵魂所在。但图中5人全部是相同的黑色剪影，站在强光前却无一被照亮，既违背了光影物理逻辑，也彻底抹去了「知识启蒙改变人」的叙事张力。画面从「知识启蒙的力量」退化为「人们围观发光书本」的平淡观景图。漂浮符号中混入音符和货币符号也显示出AI对「知识符号」理解的偏差。总体而言，这是一张视觉上有一定美感但在隐喻深度和指令完整性上存在重大缺陷的作品。【GEMINI】这是一张在视觉冲击力上达标，但在逻辑严密性和隐喻深度上有所欠缺的作品。模型成功理解了‘光’与‘书’的表象关联，但在处理多光源环境下的光影平衡，以及‘脚印’所代表的动态叙事时表现乏力。画面更像是一张华丽的壁纸，而非具有深刻哲思的插画。【KIMI】这张AI生成的图像总体上较好地完成了提示词的要求，成功地将'知识是光明'这一抽象概念转化为连贯、符合逻辑的视觉叙事，整体能够传达知识启蒙的力量与意涵。在光影处理、明暗对比、构图与整体艺术质量等方面表现较好，但漂浮的文字符号与书本光芒的视觉关联可以更紧密一些，光影渲染的自然度与艺术感染力还有提升空间。

困难难度评测结果

得分：71.6 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像在概念层面理解了提示词的核心意图，建立了「人物剪影作为气象容器、内外环境情绪联动」的基本框架，并完成了大部分具体元素的布置。然而，执行质量存在明显短板：卡通emoji天气符号与写实摄影背景的风格混搭是最致命的艺术缺陷，使整体呈现更像概念示意图而非艺术作品；地面倒影未能有效反映剪影内部气象；四肢天气元素分布不均；内外情绪联动的叙事说服力不足。综合来看，这是一张「完成了指令清单但未能实现艺术升华」的作品，停留在元素机械罗列的层面，距离提示词所期望的多层次情绪隐喻表达仍有明显差距。【GEMINI】这是一张视觉效果华丽但逻辑执行不够严谨的作品。模型在处理复杂空间指令（如‘剪影内部’与‘四肢特定位置’）时出现了明显的理解坍缩，将本应属于内部的元素放到了背景中。虽然艺术氛围到位，但作为对‘复杂隐喻理解’的测试，其在精密遵循指令方面仍有较大改进空间。【KIMI】这张图像在整体上较好地完成了提示词要求，成功将情绪与天气的隐喻转化为视觉意象。但在细节表现上还存在一些不足，尤其是头部雷电和腹部乌云的表现力度不够。整体构图和艺术质量较好，营造出了情绪如天气般变幻无常的艺术氛围。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

AI 评审点评

进阶难度评测结果

模型生成产物

AI 评审点评

困难难度评测结果

模型生成产物

AI 评审点评

相关链接

反馈评测问题