qwen-image-2.0 在「黄山迎客松镂空寿字卡片生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:qwen-image-2.0
  • 用例名称:黄山迎客松镂空寿字卡片生成
  • 测试类型:图像生成
  • 评测维度:VG-FramedPerspective

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张写实风格的图像:一只手拿着一张深灰色岩石质感的卡片,卡片中心镂空刻有汉字「寿」,透过镂空部分可以看到远处的黄山迎客松与云海。背景云雾缭绕,整体氛围大气磅礴。

任务要求

AI 模型需要满足以下要求:

  1. 画面中有一只手持有深灰色岩石质感卡片
  2. 卡片中心有镂空的汉字「寿」
  3. 透过镂空部分可见黄山迎客松
  4. 背景有云海或云雾元素
  5. 整体风格为写实摄影风格

评测结果

综合得分

该模型在此用例的得分为:76.9 分(满分 100 分),已通过

基础难度评测结果

  • 得分:76.9 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一幅极具创意的自然景观摄影。画面中心,一只肤色偏深的手捏着一块深灰色的长方形粗糙石板。石板中心被镂空刻出了一个复杂的汉字形状(形似“寿”字的变体),透过这个镂空的字形,可以清晰地看到背景中一棵生长在悬崖边的苍劲松树。背景是烟雾缭绕的黄山风格奇峰,云海洁白如雪,与深色的石板形成鲜明对比。整体色调清新自然,构图巧妙地将人造艺术与自然美景融合。 在 AI 生成的细节方面,存在明显的逻辑缺陷:首先,石板镂空处的松树枝干与背景中的树木在空间透视上并不完全吻合,看起来更像是贴在石板后的照片而非实景。其次,持物的手部细节略显生硬,指甲形状不够自然,且石板左侧似乎悬浮在空中,缺乏合理的支撑受力点。最显著的问题在于镂空的汉字结构并不规范,存在笔画断裂和逻辑错误的变形。

图中展示了一幅极具创意的自然景观摄影。画面中心,一只肤色偏深的手捏着一块深灰色的长方形粗糙石板。石板中心被镂空刻出了一个复杂的汉字形状(形似“寿”字的变体),透过这个镂空的字形,可以清晰地看到背景中一棵生长在悬崖边的苍劲松树。背景是烟雾缭绕的黄山风格奇峰,云海洁白如雪,与深色的石板形成鲜明对比。整体色调清新自然,构图巧妙地将人造艺术与自然美景融合。

在 AI 生成的细节方面,存在明显的逻辑缺陷:首先,石板镂空处的松树枝干与背景中的树木在空间透视上并不完全吻合,看起来更像是贴在石板后的照片而非实景。其次,持物的手部细节略显生硬,指甲形状不够自然,且石板左侧似乎悬浮在空中,缺乏合理的支撑受力点。最显著的问题在于镂空的汉字结构并不规范,存在笔画断裂和逻辑错误的变形。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像高质量地完成了提示词的全部核心要求:手持岩石质感卡片、镂空「寿」字、透视可见迎客松、云海背景、写实摄影风格五项关键要求均得到满足,且执行质量较高。材质表现、空间层次与意境营造均属上乘。主要不足在于镂空内景物排布略显刻意,以及背景云海细节层次稍显不足,但这些均属细节层面的瑕疵,不影响整体高完成度的判断。 【GEMINI】这是一张典型的“AI幻觉”作品。虽然在材质渲染和背景氛围上表现尚可,但在核心任务——“镂空汉字”的结构准确性以及“透视融合”的物理逻辑上表现严重失准。汉字结构的崩坏直接导致了作品的叙事功能失效,属于典型的视觉效果尚可但逻辑完全不通的生成结果。 【KIMI】该图像在概念层面完成了提示词的基本要求,但在执行层面暴露出AI生成图像典型的空间逻辑缺陷。最核心的失败在于镂空透视关系的处理——模型未能理解「透过镂空观看背景」这一简单物理场景的深度关系,导致前景卡片与背景景观产生不可调和的空间矛盾。岩石质感与手部质感的材质分离、云海的动态僵硬等问题进一步削弱了写实摄影的可信度。作为测试手持镂空卡片生成能力的样本,此图在透视准确性上未达标,但在元素完整性上勉强及格。

进阶难度评测结果

  • 得分:80.9 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中,一只手在云雾缭绕的山巅背景下,举起一块深灰色的长方形石板。石板中心镂空雕刻着一个巨大的繁体“寿”字,透过镂空处可以看到背景中标志性的黄山迎客松。石板下方刻有数字“2026”,两侧各有一只浮雕小马。背景是雄伟的奇峰怪石和翻腾的云海,色调清新自然,充满中式意境。 然而,画面存在明显的 AI 生成缺陷:首先是文字错误,石板上的繁体“寿”字结构混乱,笔画多处断裂且不符合书法逻辑,底部甚至出现了一个多余的类似“石”字的结构;其次是手部异常,握住石板的手指比例不协调,指尖与石板边缘的接触显得生硬且透视不准;最后,石板上的“2026”数字刻痕深浅不一,且左侧的小马浮雕细节模糊,与整体石材纹理融合得不够自然。

画面中,一只手在云雾缭绕的山巅背景下,举起一块深灰色的长方形石板。石板中心镂空雕刻着一个巨大的繁体“寿”字,透过镂空处可以看到背景中标志性的黄山迎客松。石板下方刻有数字“2026”,两侧各有一只浮雕小马。背景是雄伟的奇峰怪石和翻腾的云海,色调清新自然,充满中式意境。

然而,画面存在明显的 AI 生成缺陷:首先是文字错误,石板上的繁体“寿”字结构混乱,笔画多处断裂且不符合书法逻辑,底部甚至出现了一个多余的类似“石”字的结构;其次是手部异常,握住石板的手指比例不协调,指尖与石板边缘的接触显得生硬且透视不准;最后,石板上的“2026”数字刻痕深浅不一,且左侧的小马浮雕细节模糊,与整体石材纹理融合得不够自然。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像高质量完成了提示词的全部核心要求,六项关键要求均已满足。手持镂空石刻「寿」字卡片的第一人称视角构图自然,透过镂空可见黄山迎客松与云海的空间层次感是本图最大亮点,背景虚化处理专业,整体写实摄影质感强烈,中国传统文化意境营造到位。细节上仅存在镂空边缘融合略显生硬等小瑕疵,整体属于高质量生成结果。 【GEMINI】这是一张在氛围营造上非常成功,但在细节逻辑和AI生成硬伤上表现明显的图像。虽然成功捕捉了黄山意境和卡片质感,但手部结构和文字处理的失败严重拉低了作品的写实可信度。 【KIMI】该图像在氛围营造上具备一定水准,但核心功能——镂空「寿」字的正确性与透视逻辑——出现严重失误。错字问题直接违背提示词对「寿」字的明确要求,镂空内外的空间关系混乱暴露了AI对三维透视的理解局限。马剪影与数字的添加显得生硬,手部结构亦有瑕疵。整体属于「看起来不错但经不起审视」的典型AI生成案例,提示词完成度约65%。

困难难度评测结果

  • 得分:74.9 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:qwen-image-2.0
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像整体上较为成功地完成了提示词的核心要求,实现了手持镂空岩石卡片与黄山背景融合的视觉效果。镂空透视、第一人称视角、侧逆光氛围等关键要素均有体现。主要不足集中在:迎客松与镂空区域的对准精准度不够理想,石材质感的细腻程度有待提升,以及镂空边缘的光学过渡处理略显生硬。综合来看,图像属于「基本完成要求但存在若干明显瑕疵」的水平,在镂空透视这一核心难点上表现尚可,但在精细度和精准度上仍有提升空间。 【GEMINI】这张图像在氛围营造和光影处理上达到了一定水准,但在物理逻辑和细节刻画上暴露了 AI 生成的典型弱点。最令人失望的是对「石刻」这一核心元素的处理,无论是奔马的畸形还是文字的平庸,都削弱了画面的质感。此外,缺乏厚度感的卡片让整个构图显得像是一张合成的平面海报,而非真实的摄影作品。 【KIMI】该图像在核心难点「镂空透视」上完全失败,镂空内的迎客松影像是独立生成的虚假内容,与外部真实背景形成「画中画」的割裂感,而非物理上透过孔洞看到的真实远景。构图上镂空与真实迎客松的错位、手部姿态的不稳定、景深效果的缺失,共同导致第一人称手持镂空卡片的核心创意未能实现。材质与刻绘细节停留在表面纹理,缺乏真实石材的立体雕刻感。整体属于「形似而神不似」的AI生成典型问题——画面元素齐全,但物理逻辑与空间关系崩塌。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...