qwen-image-max 在「黄山迎客松镂空寿字卡片生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:qwen-image-max
- 用例名称:黄山迎客松镂空寿字卡片生成
- 测试类型:图像生成
- 评测维度:VG-FramedPerspective
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张写实风格的图像:一只手拿着一张深灰色岩石质感的卡片,卡片中心镂空刻有汉字「寿」,透过镂空部分可以看到远处的黄山迎客松与云海。背景云雾缭绕,整体氛围大气磅礴。
任务要求
AI 模型需要满足以下要求:
- 画面中有一只手持有深灰色岩石质感卡片
- 卡片中心有镂空的汉字「寿」
- 透过镂空部分可见黄山迎客松
- 背景有云海或云雾元素
- 整体风格为写实摄影风格
评测结果
综合得分
该模型在此用例的得分为:78.0 分(满分 100 分),已通过
基础难度评测结果
- 得分:78.0 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只左手捏着一块方形深灰色石板,背景是云雾缭绕的高山奇峰,整体风格带有浓郁的中国山水画意境。石板中心被镂空刻出了一个复杂的汉字形状,透过这个镂空处,恰好可以看到远处山崖上生长的一棵翠绿苍劲的松树。石板的质感粗糙且真实,边缘有自然的岩石断裂纹理。背景中的远山在浓雾中若隐若现,冷色调的蓝灰色天空与松树的鲜绿色形成对比。 然而,画面中存在明显的 AI 生成缺陷:首先,左下角的手部结构异常,大拇指的比例过大,且下方的指关节连接处显得扭曲、不自然,手指的数量和排列逻辑模糊。其次,石板中心镂空的汉字并非真实的文字,而是由杂乱的笔画组合而成的「伪汉字」,缺乏实际意义。此外,镂空边缘的透视关系与背景松树的衔接过于生硬,石板左侧边缘还出现了一小块莫名其妙的重叠山体影像,违背了物理遮挡逻辑。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像高质量地完成了提示词的核心要求:手持深灰色岩石质感卡片、镂空「寿」字、透见迎客松与云海、写实摄影风格、大气磅礴意境,五项关键要求全部满足。镂空透视关系处理较为自然,整体意境出色。主要不足在于镂空边缘局部融合略显生硬,以及左侧近景岩石的出现略微影响了纵深感。综合来看,这是一张高完成度的AI生成图像,在意境营造和风格把控上表现尤为突出。 【GEMINI】这是一张典型的「初看惊艳,细看崩坏」的 AI 生成图。虽然在材质渲染和氛围营造上展现了不错的技术水准,但在核心的逻辑构建上——即镂空透视和汉字结构——出现了严重失误。特别是「寿」字被扭曲成不可名状的形状,以及石板边缘莫名出现的微型松树,极大地降低了作品的专业度。作为一张需要体现「镂空透视」概念的图,其核心逻辑的失败使其难以达到及格线以上的评价。 【KIMI】该图像呈现典型的「概念过关、执行翻车」的AI生成特征。提示词要求的核心创意——手持镂空「寿」字卡片框景黄山——在构图层面得到实现,但关键的文字符号完整性遭到破坏,透视逻辑存在物理矛盾,最终沦为「看似专业、细究崩溃」的半成品。模型在处理镂空结构的立体一致性、汉字笔画的完整性保持、以及前后景景深统一性方面暴露明显短板。若作为商业用途,「寿」字的残缺属于不可接受的文化符号错误;若作为技术测试,透视与景深矛盾显示空间理解能力的局限。
进阶难度评测结果
- 得分:78.3 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只左手拿着一块深灰色石板,背景是云雾缭绕的山峰和苍劲的松树,呈现出一种中国画般的意境。石板中心有一个巨大的镂空汉字,其形状介于“泰”与“寿”之间,透过镂空可以看到远处的山峦。石板底部刻有数字“2026”,两侧各有一匹马的浮雕。画面色调以灰、绿、白为主,构图采用了前景实景与背景虚化相结合的方式。 在 AI 生成的细节方面,存在明显的逻辑缺陷:首先,石板中心的镂空汉字并非标准汉字,笔画结构混乱且不连贯,属于典型的 AI 字体生成错误。其次,画面左下角的手部细节异常,大拇指的指甲形状不自然,且手指与石板接触的受力感显得生硬。此外,石板底部的马匹浮雕线条略显模糊,与石材纹理的融合不够自然,整体透视关系在镂空处略显平面化。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像较好地完成了提示词的核心要求,第一人称手持镂空石刻卡片的场景构建成功,主要元素(手、卡片、镂空「寿」字、「2026」与马剪影、云雾山景背景)均已呈现。镂空透视效果基本实现,景深处理自然,整体写实摄影风格到位。主要不足在于「寿」字笔画形态略有变形、迎客松特征不够典型,以及石刻镂空边缘的精细度有待提升。综合来看,这是一张质量中上的AI生成图像,基本满足提示词要求,但在细节精准度上仍有提升空间。 【GEMINI】这是一张典型的「AI 拼凑感」较强的图片。虽然在构图和背景氛围上达到了预期的写实效果,但在细节处理上暴露了模型对复杂结构(如手部)和物理材质(如石刻)理解的匮乏。手部的畸形和卡片底部元素的平面化处理是最大的败笔,严重影响了作品的整体真实感。 【KIMI】该图像在概念执行上基本到位,但AI在汉字结构理解、空间透视逻辑和光源一致性等核心能力上暴露明显短板。「寿」字的结构性错误尤为致命,直接违背了提示词中「汉字」的准确性要求;镂空透视的断裂则破坏了摄影真实感。整体属于「看似完成,实则漏洞明显」的AI典型输出,勉强可用但经不起专业审视。
困难难度评测结果
- 得分:76.6 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中,一只左手在镜头前方捏着一块灰色石板。石板中心被镂空刻出了一个复杂的汉字,看起来像是“寿”字的变体,透过镂空处可以看到背景中挺拔的迎客松。背景是壮丽的山岳景观,云雾缭绕,山峰陡峭,呈现出黄山般的意境。石板右下方刻有数字“2026”和一匹奔马的剪影。整体色调偏冷,光线柔和,构图采用了前景虚实结合的手法。 画面中存在明显的 AI 生成缺陷:首先,手部建模异常,大拇指的指甲形状不自然,且手指与石板接触的受力点显得生硬。其次,石板上的汉字并非标准字体,笔画结构存在逻辑错误,无法准确辨认。最明显的错误在于石板右下角的马匹剪影,马的后腿与尾部连接处结构混乱,且马蹄的形状模糊不清。此外,石板边缘的纹理与背景树木的透视衔接略显违和,缺乏真实的物理遮挡感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像整体完成度较高,核心创意——手持镂空「寿」字石板对准黄山迎客松——得到了有效实现,构图意图清晰,视觉冲击力较强。第一人称视角自然,景深处理合理,整体意境符合提示词的文化底蕴要求。主要不足集中在材质细节的精细度上:石刻凿痕缺失、卡片厚度立体感不足、奔马剪影细节模糊,这些细节问题使图像停留在「基本完成」而非「完美完成」的层次。侧逆光效果也略显保守,未能充分发挥戏剧性光影的潜力。综合来看,这是一张有亮点、有瑕疵的中高质量AI生成图像。 【GEMINI】这是一张视觉效果上乘但逻辑细节经不起推敲的 AI 生成图。虽然在光影氛围和构图意境上表现出色,但在处理「镂空透视」这一核心难点时,模型未能理解物理空间关系,导致卡片看起来像是一张悬浮的平面图层,而非具有厚度的岩石实物。对于追求写实感的作品,这种空间逻辑的缺失是致命的。 【KIMI】这是一张「概念诱人、执行翻车」的典型AI生成案例。模型似乎「理解」了镂空卡片的创意形式,却未能「推理」出透视的物理必然性——镂空内外的双松并存暴露了空间逻辑的根本缺陷。石材厚度的缺失与工艺的统一性失败,进一步瓦解了写实摄影的可信度。建议重新生成时强制约束「镂空内景物必须与背景连续」的物理规则,并加强边缘厚度的立体渲染。
相关链接
您可以通过以下链接查看更多相关内容: