qwen-image-plus-2026-01-09 在「敦煌月牙泉镂空幻字卡片生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:qwen-image-plus-2026-01-09
  • 用例名称:敦煌月牙泉镂空幻字卡片生成
  • 测试类型:图像生成
  • 评测维度:VG-FramedPerspective

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张写实摄影风格的图像:一只手拿着一张土黄色卡片,卡片中心镂空刻有汉字「幻」,透过镂空部分可以看到远处的月牙泉,背景是连绵的沙丘。

任务要求

AI 模型需要满足以下要求:

  1. 画面中有一只手持卡片的构图
  2. 卡片呈土黄色,中心有镂空汉字「幻」
  3. 透过镂空部分可见月牙泉景观
  4. 背景为沙漠沙丘场景
  5. 整体风格为写实摄影

评测结果

综合得分

该模型在此用例的得分为:76.9 分(满分 100 分),已通过

基础难度评测结果

  • 得分:76.9 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只左手捏着一张土黄色硬纸板,背景是广袤的沙漠绿洲。纸板中心被镂空刻出了一个汉字“幻”,透过镂空处,可以看到远方沙漠中一抹碧蓝的泉水和点点绿植,构图巧妙地将文字与实景结合。背景中的沙丘起伏平缓,色调温暖,呈现出一种静谧的荒漠美感。然而,画面中存在明显的 AI 生成缺陷:最显著的是左下角的手部,大拇指的指甲形状异常且边缘模糊,食指与中指的连接处透视关系混乱,显得不够自然。此外,纸板镂空的“幻”字笔画结构虽然可辨,但边缘线条略显生硬,且纸板左侧边缘有不自然的断裂感。整体色调统一为土黄色与天蓝色的对比,营造出一种超现实的视觉氛围。

图中展示了一只左手捏着一张土黄色硬纸板,背景是广袤的沙漠绿洲。纸板中心被镂空刻出了一个汉字“幻”,透过镂空处,可以看到远方沙漠中一抹碧蓝的泉水和点点绿植,构图巧妙地将文字与实景结合。背景中的沙丘起伏平缓,色调温暖,呈现出一种静谧的荒漠美感。然而,画面中存在明显的 AI 生成缺陷:最显著的是左下角的手部,大拇指的指甲形状异常且边缘模糊,食指与中指的连接处透视关系混乱,显得不够自然。此外,纸板镂空的“幻”字笔画结构虽然可辨,但边缘线条略显生硬,且纸板左侧边缘有不自然的断裂感。整体色调统一为土黄色与天蓝色的对比,营造出一种超现实的视觉氛围。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像较好地完成了提示词的核心要求:手持土黄色镂空卡片、「幻」字镂空透视月牙泉、沙漠背景、写实摄影风格均有体现。主要不足在于「幻」字字形准确度有所欠缺,以及月牙泉的标志性形态辨识度不足(弯月形水体特征不明显)。整体属于基本完成要求但存在若干可识别瑕疵的水准。 【GEMINI】这张图像在整体氛围和写实风格上表现尚可,成功捕捉了沙漠摄影的视觉基调。然而,作为核心视觉焦点的汉字「幻」出现了严重的结构性错误,这在视觉设计中是致命的。此外,卡片的材质感和镂空透视的物理真实性还有待提升,未能达到专业摄影作品的严谨度。 【KIMI】这是一张「看似完成实则关键失败」的AI图像。模型在表面元素(手、卡片、沙漠背景)上表现合格,但在最核心的「汉字准确性」和「景观识别性」上出现硬伤——「幻」字写错、月牙泉看不出月牙,导致提示词的核心意图落空。这种「形似神不似」的问题正是当前文生图模型的典型短板:能生成合理的视觉元素组合,却无法保证语义精确对应。

进阶难度评测结果

  • 得分:80.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只手拿着一张矩形卡片,背景是模糊的沙漠景观。卡片呈土黄色,质感粗糙,中央有一个巨大的镂空汉字“幻”。卡片底部刻有数字“2026”以及几匹奔跑的马儿剪影。背景中可以看到连绵起伏的沙丘,以及一处形似月牙泉的绿洲,湖水呈淡蓝色。整体色调以温暖的沙漠黄为主,构图采用了前景聚焦、背景虚化的手法。 在 AI 生成的细节方面,存在明显的逻辑缺陷:首先,手持卡片的大拇指指甲形状略显生硬,且手指与卡片接触的边缘处理不够自然。其次,卡片中间镂空的“幻”字结构不符合常规书法或字体逻辑,笔画连接处显得扭曲且不连贯。最明显的缺陷在于背景中的绿洲与沙丘的透视关系,通过镂空处看到的景色与卡片边缘外的背景在空间位置上无法完全吻合,产生了一种视觉上的错位感。此外,卡片底部的马匹剪影线条略显模糊,缺乏精细度。

图中展示了一只手拿着一张矩形卡片,背景是模糊的沙漠景观。卡片呈土黄色,质感粗糙,中央有一个巨大的镂空汉字“幻”。卡片底部刻有数字“2026”以及几匹奔跑的马儿剪影。背景中可以看到连绵起伏的沙丘,以及一处形似月牙泉的绿洲,湖水呈淡蓝色。整体色调以温暖的沙漠黄为主,构图采用了前景聚焦、背景虚化的手法。

在 AI 生成的细节方面,存在明显的逻辑缺陷:首先,手持卡片的大拇指指甲形状略显生硬,且手指与卡片接触的边缘处理不够自然。其次,卡片中间镂空的“幻”字结构不符合常规书法或字体逻辑,笔画连接处显得扭曲且不连贯。最明显的缺陷在于背景中的绿洲与沙丘的透视关系,通过镂空处看到的景色与卡片边缘外的背景在空间位置上无法完全吻合,产生了一种视觉上的错位感。此外,卡片底部的马匹剪影线条略显模糊,缺乏精细度。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像整体上高质量完成了提示词的全部核心要求,第一人称视角、镂空卡片、月牙泉背景、「2026」与马剪影装饰等元素一应俱全,景深处理自然,复古色调统一。主要不足在于镂空边缘精细度有限,以及镂空内外景物清晰度的轻微不一致,但这些均属细节层面的瑕疵,不影响整体创意表达的成功实现。综合评价为优秀水准。 【GEMINI】这张图像在材质表现和整体氛围营造上表现尚可,但在核心的逻辑严谨性上存在明显短板。最致命的问题在于「镂空透视」的物理逻辑完全不成立,这使得图像失去了其作为「实景拍摄」的真实感。此外,文字和细节剪影的崩坏也极大地拉低了图像的精致度,属于典型的「一眼假」AI作品。 【KIMI】该图在概念执行层面完成了提示词的基础框架,但核心卖点——镂空透视的物理真实感——彻底失败。AI 未能理解「透过镂空看到背景」与「背景本身」必须是同一空间坐标下的同一对象,导致月牙泉出现「双重曝光」式的错位。这暴露了当前模型在处理复杂空间遮挡关系时的结构性缺陷。此外,材质与色调的「塑料感」表明模型对「写实摄影」的理解仍停留在视觉风格模仿,而非光学物理模拟。综合判定:概念及格,执行瑕疵明显,透视关系硬伤拉低整体水准。

困难难度评测结果

  • 得分:74.1 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只左手拿着一张金黄色磨砂质感的卡片,背景是夕阳映照下的连绵沙漠和一处月牙形的绿洲泉水。卡片中心有一个巨大的镂空汉字“幻”,通过镂空处可以看到背景中的绿洲。卡片右下方印有数字“2026”和一匹奔马的浮雕图案。整幅画面色调温暖,呈现出金灿灿的沙漠风情,构图上采用了前景聚焦、背景虚化的手法。 在 AI 生成的细节方面,存在一些明显的逻辑缺陷:首先,手持卡片的手指比例略显不自然,指缝处的阴影处理较为生硬。其次,卡片上的镂空汉字“幻”字形结构存在扭曲,笔画边缘的雕刻纹理不连贯,且镂空边缘与背景的透视衔接略显漂浮。此外,背景中绿洲的水面反光与整体环境的光影方向不完全一致,给人一种拼贴感。

图中展示了一只左手拿着一张金黄色磨砂质感的卡片,背景是夕阳映照下的连绵沙漠和一处月牙形的绿洲泉水。卡片中心有一个巨大的镂空汉字“幻”,通过镂空处可以看到背景中的绿洲。卡片右下方印有数字“2026”和一匹奔马的浮雕图案。整幅画面色调温暖,呈现出金灿灿的沙漠风情,构图上采用了前景聚焦、背景虚化的手法。

在 AI 生成的细节方面,存在一些明显的逻辑缺陷:首先,手持卡片的手指比例略显不自然,指缝处的阴影处理较为生硬。其次,卡片上的镂空汉字“幻”字形结构存在扭曲,笔画边缘的雕刻纹理不连贯,且镂空边缘与背景的透视衔接略显漂浮。此外,背景中绿洲的水面反光与整体环境的光影方向不完全一致,给人一种拼贴感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在整体构图、视角建立和色调氛围方面完成度较高,成功营造了黄昏沙漠手持纪念卡片的场景感。然而最核心的「镂空透视精准呈现月牙泉新月形水面」这一关键要求未能达成,透过「幻」字镂空仅能看到模糊的绿色水域,月牙泉的标志性形态完全丢失,削弱了整张图像的核心叙事价值。卡片材质与手部光影表现属于中上水平,复古胶片风格有基本呈现但深度不足。综合来看,图像在氛围营造上较为成功,但在最关键的镂空透视技术细节上存在明显短板。 【GEMINI】这幅作品在氛围营造和构图上达到了基本要求,但在核心的「镂空透视」逻辑和微观细节处理上表现平庸。AI 在处理文字和复杂镂空结构时,依然无法摆脱「贴图感」,导致作品缺乏摄影作品应有的物理真实性。如果作为一张氛围图尚可,但作为一张强调「镂空透视」的摄影作品,它是不合格的。 【KIMI】这是一张概念正确但执行失败的AI生成图像。模型理解了「手持镂空卡片拍摄月牙泉」的基本创意,但在最核心的「镂空精准呈现月牙泉」这一要求上彻底失败——透过「幻」字看到的景物与月牙泉的实际形态毫无对应关系,空间透视与景深控制混乱。卡片材质、光影逻辑、复古风格等维度均停留在表面模仿,缺乏物理真实感与工艺细节。整体呈现为典型的AI「形似神不似」:构图框架存在,但关键视觉信息错误,无法作为合格的旅行纪念影像使用。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...