qwen-image-2.0 在「天坛祈年殿镂空岁字卡片生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:qwen-image-2.0
  • 用例名称:天坛祈年殿镂空岁字卡片生成
  • 测试类型:图像生成
  • 评测维度:VG-FramedPerspective

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张图像:一只手拿着一张银色金属质感的长方形卡片,卡片中心镂空刻有汉字「岁」,透过镂空部分可以看到远处的北京天坛祈年殿,背景是湛蓝的天空。

任务要求

AI 模型需要满足以下要求:

  1. 画面中有一只手持银色金属长方形卡片
  2. 卡片中心有镂空的汉字「岁」
  3. 透过「岁」字镂空可见北京天坛祈年殿
  4. 背景为湛蓝天空
  5. 整体画面清晰,构图完整

评测结果

综合得分

该模型在此用例的得分为:81.0 分(满分 100 分),已通过

基础难度评测结果

  • 得分:81.0 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只手拿着一块长方形的金属镂空板,背景是北京天坛的祈年殿。画面构图以金属板为中心,背景的天坛建筑略微虚化。天气晴朗,天空呈现出纯净的深蓝色,点缀着几抹淡淡的白云。金属板表面有细微的划痕和反光,中间镂空出一个汉字形状,通过镂空处可以看到远处的祈年殿金顶。 画面中存在明显的 AI 生成缺陷:首先,金属板中间镂空的汉字并非标准的中文字符,它看起来像是“岁”字或“步”字的变形重组,笔画结构不符合逻辑,且镂空边缘存在不自然的毛刺感。其次,右侧持板的手部细节异常,手指的比例和关节褶皱显得生硬,指甲的形状也略显不自然。最后,背景中天坛下方的游客人群呈现出模糊的色块状,缺乏真实的形体细节,与前景的金属板质感存在透视上的违和感。

图中展示了一只手拿着一块长方形的金属镂空板,背景是北京天坛的祈年殿。画面构图以金属板为中心,背景的天坛建筑略微虚化。天气晴朗,天空呈现出纯净的深蓝色,点缀着几抹淡淡的白云。金属板表面有细微的划痕和反光,中间镂空出一个汉字形状,通过镂空处可以看到远处的祈年殿金顶。

画面中存在明显的 AI 生成缺陷:首先,金属板中间镂空的汉字并非标准的中文字符,它看起来像是“岁”字或“步”字的变形重组,笔画结构不符合逻辑,且镂空边缘存在不自然的毛刺感。其次,右侧持板的手部细节异常,手指的比例和关节褶皱显得生硬,指甲的形状也略显不自然。最后,背景中天坛下方的游客人群呈现出模糊的色块状,缺乏真实的形体细节,与前景的金属板质感存在透视上的违和感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像高质量地完成了提示词的全部核心要求:手、银色金属卡片、镂空「岁」字、天坛祈年殿四要素齐全;框景构图精准,祈年殿完美嵌入镂空区域;金属材质质感真实;背景天空湛蓝通透。整体构图具有强烈的视觉冲击力和文化意涵,是一张完成度极高的图像。 【GEMINI】这张图像在构图和空间层次上表现良好,成功营造了摄影作品的氛围。然而,作为核心视觉元素的汉字「岁」出现了严重的结构性崩坏,这是 AI 在处理复杂文字镂空时的典型弱点。此外,手部细节的瑕疵也影响了整体的写实度。如果文字能够准确还原,这将是一张高质量的作品。 【KIMI】该图像完成了提示词的基础要求,但在核心考验点——异形镂空与古建筑的透视融合上表现不佳。「岁」字的结构瑕疵与空间层次的错位问题,暴露出AI在处理「镂空遮挡+远景对齐」这一复杂空间任务时的能力边界。金属质感与手部细节的中庸表现进一步拉低整体完成度。作为「拉开模型差距」的测试案例,此图在60-75分区间具有典型参考价值。

进阶难度评测结果

  • 得分:74.3 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只右手拿着一张长方形金属镂空卡片,背景是北京天坛祈年殿。画面构图以卡片为中心,背景在蓝天白云下显得十分宏伟。金属卡片表面有拉丝质感,中心镂空了一个巨大的汉字,其轮廓试图模仿“梦”字,但笔画结构并不标准。卡片右下角刻有数字“2026”和一个小马形状的剪影。透过卡片的镂空部分,可以清晰地看到背景中祈年殿的蓝色圆顶和红色柱廊。 画面中存在明显的 AI 生成缺陷:首先,卡片中心的汉字并非真实的汉字,笔画断裂且逻辑混乱,无法正常辨认。其次,手持卡片的手指比例略显僵硬,指甲边缘处理不够自然。此外,背景中祈年殿的细节与真实建筑相比有所简化,且卡片边缘与背景的透视衔接略显生硬,数字“2026”的刻痕深度在金属表面分布不均。整体色调明亮,呈现出一种超现实的创意摄影风格。

图中展示了一只右手拿着一张长方形金属镂空卡片,背景是北京天坛祈年殿。画面构图以卡片为中心,背景在蓝天白云下显得十分宏伟。金属卡片表面有拉丝质感,中心镂空了一个巨大的汉字,其轮廓试图模仿“梦”字,但笔画结构并不标准。卡片右下角刻有数字“2026”和一个小马形状的剪影。透过卡片的镂空部分,可以清晰地看到背景中祈年殿的蓝色圆顶和红色柱廊。

画面中存在明显的 AI 生成缺陷:首先,卡片中心的汉字并非真实的汉字,笔画断裂且逻辑混乱,无法正常辨认。其次,手持卡片的手指比例略显僵硬,指甲边缘处理不够自然。此外,背景中祈年殿的细节与真实建筑相比有所简化,且卡片边缘与背景的透视衔接略显生硬,数字“2026”的刻痕深度在金属表面分布不均。整体色调明亮,呈现出一种超现实的创意摄影风格。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在整体创意构图和材质表现上完成度较高,手持金属卡片透视祈年殿的视觉概念得到有效实现,景深效果和材质细节均属上乘。然而最致命的问题是镂空汉字字形错误——呈现的是「多」字而非提示词要求的「岁」字,这一核心元素的失误直接影响了主体元素完整性评分。此外电影级调色特征不够突出,整体更接近高质量摄影合成而非电影级调色风格。综合来看,图像在技术执行层面表现良好,但在关键文字元素的准确性上存在明显缺陷。 【GEMINI】这是一张典型的「初看尚可,细看崩坏」的AI生成图。虽然在构图布局和整体色调上达到了提示词的基本要求,但在最核心的细节处理上——特别是汉字结构和材质表现——表现出了明显的模型短板。汉字「岁」的完全不可读是致命伤,使得图像失去了原本的设计意图。金属质感的缺失也让画面显得缺乏高级感。 【KIMI】该图像在材质表现与基础构图上具备一定完成度,但存在致命性的字形错误——将「岁」字生成为「多」字,直接导致核心创意「岁字镂空与天坛呼应」完全失效。这一错误并非细节瑕疵,而是对提示词核心语义的根本性背离。构图上,错误的字形结构进一步引发祈年殿被金属遮挡的连锁问题。综合判定为「部分完成要求,有多处需要改进」,主要扣分集中于主体元素的准确性缺陷。

困难难度评测结果

  • 得分:69.9 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只左手握着一块长方形金属镂空板,背景是北京天坛祈年殿。金属板表面呈现拉丝质感,中心镂空出一个巨大的汉字,其形状介于“岁”与“步”之间,结构并不标准。板子右下角刻有数字“2026”和一匹奔马的剪影。背景中的天坛建筑被虚化,蓝天白云清晰可见,阳光从侧面照射,在手上留下阴影。画面存在明显的 AI 生成缺陷:首先,手部结构异常,大拇指过长且关节僵硬,食指缺失,其余手指的排列与握持姿势不符合人体解剖学;其次,金属板中心的汉字笔画断裂且逻辑混乱,无法辨认确切含义;最后,背景天坛的细节模糊且透视略显扭曲,与前景金属板的边缘衔接不够自然。

图中展示了一只左手握着一块长方形金属镂空板,背景是北京天坛祈年殿。金属板表面呈现拉丝质感,中心镂空出一个巨大的汉字,其形状介于“岁”与“步”之间,结构并不标准。板子右下角刻有数字“2026”和一匹奔马的剪影。背景中的天坛建筑被虚化,蓝天白云清晰可见,阳光从侧面照射,在手上留下阴影。画面存在明显的 AI 生成缺陷:首先,手部结构异常,大拇指过长且关节僵硬,食指缺失,其余手指的排列与握持姿势不符合人体解剖学;其次,金属板中心的汉字笔画断裂且逻辑混乱,无法辨认确切含义;最后,背景天坛的细节模糊且透视略显扭曲,与前景金属板的边缘衔接不够自然。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在材质表现和整体视觉风格上完成度较高,拉丝金属质感和冷蓝色调电影风格是明显亮点。然而,两个核心要求存在严重偏差:其一,镂空汉字字形疑似为「梦」而非「岁」,这是对提示词最关键元素的失误;其二,视角并非严格第一人称,且「框中框」对称构图的精准度不足,祈年殿未能居中于镂空区域。综合来看,图像具备一定的商业视觉品质,但在文字准确性和构图精准度这两个核心考察点上未能达标。 【GEMINI】这是一张典型的「初看尚可,细看崩坏」的 AI 生成图。虽然在整体氛围、色调和金属质感上达到了一定的视觉水准,但在核心的「文字准确性」和「构图精准度」上表现极差。特别是「岁」字的书法处理和奔马剪影的形态,完全没有达到设计稿应有的严谨度,手部的畸形也进一步拉低了图像的专业品质。作为一张文创产品宣传图,它目前处于无法直接使用的状态。 【KIMI】该图像在核心构图要求上存在致命失误——「框中框」对称构图因祈年殿宝顶错位而名存实亡,同时手指穿透镂空的空间逻辑错误直接暴露了 AI 生成对物理关系的理解缺陷。材质表现方面,拉丝金属的塑料化处理与激光雕刻的质感缺失,使得「高端文创」定位沦为空谈。电影级调色方向偏离,冷暖对比过于强烈而缺乏克制。整体而言,模型未能完成提示词的关键要求,尤其在空间逻辑与材质真实感方面表现薄弱,属于「部分完成要求,有多处需要改进」的档次。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...