qwen-image-2.0 在「大理洱海苍山镂空顺字卡片生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:qwen-image-2.0
  • 用例名称:大理洱海苍山镂空顺字卡片生成
  • 测试类型:图像生成
  • 评测维度:VG-FramedPerspective

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张写实摄影风格的图像:第一人称视角,一只手拿着一张淡蓝色卡片,卡片中心镂空刻有汉字「顺」,透过镂空部分可以看到远处的洱海湖面与苍山。背景阳光明媚,清新风格。

任务要求

AI 模型需要满足以下要求:

  1. 画面呈现第一人称视角,可见持卡的手
  2. 卡片为淡蓝色,中心有镂空汉字「顺」
  3. 透过镂空部分能看到洱海湖面与苍山
  4. 整体画面清晰,光线明亮,风格清新写实

评测结果

综合得分

该模型在此用例的得分为:81.3 分(满分 100 分),已通过

基础难度评测结果

  • 得分:81.3 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一双人手在户外美景前举起一张浅蓝色正方形纸片的场景。背景是波光粼粼的蓝色湖泊和远方连绵的淡蓝色山脉,阳光明媚,水面闪烁着白色的光点。纸片中心被镂空剪出了一个汉字“顺”,光线透过镂空处,使字体显得明亮。画面构图对称,双手分别从左右两侧捏住纸片的下角。 在 AI 生成的细节方面,存在明显的逻辑缺陷:首先,镂空的汉字“顺”在物理上是不成立的,字体的封闭区域(如“页”字部首的内部)在没有连接点的情况下竟然悬浮在空中,不符合剪纸的常识。其次,手部细节略显生硬,左侧大拇指的指甲形状不够自然,且纸片的边缘切割痕迹显得有些杂乱且不连贯。整体色调清新,但光影逻辑在镂空边缘处略显模糊。

图中展示了一双人手在户外美景前举起一张浅蓝色正方形纸片的场景。背景是波光粼粼的蓝色湖泊和远方连绵的淡蓝色山脉,阳光明媚,水面闪烁着白色的光点。纸片中心被镂空剪出了一个汉字“顺”,光线透过镂空处,使字体显得明亮。画面构图对称,双手分别从左右两侧捏住纸片的下角。

在 AI 生成的细节方面,存在明显的逻辑缺陷:首先,镂空的汉字“顺”在物理上是不成立的,字体的封闭区域(如“页”字部首的内部)在没有连接点的情况下竟然悬浮在空中,不符合剪纸的常识。其次,手部细节略显生硬,左侧大拇指的指甲形状不够自然,且纸片的边缘切割痕迹显得有些杂乱且不连贯。整体色调清新,但光影逻辑在镂空边缘处略显模糊。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】图像在镂空透视效果和整体画面质量上表现优秀,汉字「顺」的镂空造型准确,透过镂空看到洱海苍山的空间穿透感真实自然,色调清新符合提示词要求。主要扣分点在于视角处理:提示词要求第一人称主观视角且「一只手」持卡,但图像呈现的是双手从下方举起卡片的展示性构图,偏离了提示词的沉浸式第一视角意图。综合来看,图像完成度较高,核心视觉效果出色,视角偏差是主要瑕疵。 【GEMINI】这是一张典型的 AI 生成图像,初看构图符合要求,但细看之下经不起推敲。最大的问题在于对「镂空透视」这一物理现象的理解不足,导致背景与前景完全割裂,缺乏真实的光影融合。手部结构的崩坏也是目前 AI 生成的常见通病,严重影响了写实摄影的沉浸感。 【KIMI】该图像在概念层面完成了提示词要求,但「镂空透视」这一核心创意点的执行存在显著物理逻辑缺陷。AI似乎将「镂空」理解为一种「装饰性描边效果」而非真实的空间穿透,导致最关键的视觉魔法失效。这反映了当前模型对「透明/镂空材质的光学行为」理解仍停留在表面样式模仿,缺乏对真实世界光线传播的物理模拟能力。整体属于「看起来对但经不起推敲」的典型AI生成特征。

进阶难度评测结果

  • 得分:75.5 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一双人手正举着一张浅蓝色布质纹理的卡片,背景是波光粼粼的湖面和远处的淡蓝色山峦。卡片中心镂空刻有一个巨大的简体汉字「顺」,镂空边缘带有轻微的焦灼感。卡片底部印有数字「2026」和一匹奔马的黑色剪影。阳光从左侧照射,使湖面泛起密集的白色光斑,整体色调清新明亮。 在 AI 生成的细节方面,存在明显的逻辑缺陷:首先是手部处理,左侧大拇指的指甲形状异常且指节纹路生硬,右侧手掌与卡片接触的位置透视不合理,手指显得过于粗短且比例失调。其次,镂空的「顺」字结构存在问题,左侧「川」字部首与右侧「页」字部首之间有不自然的细线连接,且「页」字内部的笔画镂空并不完整,不符合物理切割逻辑。此外,2026 年在农历中并非马年(应为马年的前一年),这里的元素组合在文化逻辑上存在偏差。

图中展示了一双人手正举着一张浅蓝色布质纹理的卡片,背景是波光粼粼的湖面和远处的淡蓝色山峦。卡片中心镂空刻有一个巨大的简体汉字「顺」,镂空边缘带有轻微的焦灼感。卡片底部印有数字「2026」和一匹奔马的黑色剪影。阳光从左侧照射,使湖面泛起密集的白色光斑,整体色调清新明亮。

在 AI 生成的细节方面,存在明显的逻辑缺陷:首先是手部处理,左侧大拇指的指甲形状异常且指节纹路生硬,右侧手掌与卡片接触的位置透视不合理,手指显得过于粗短且比例失调。其次,镂空的「顺」字结构存在问题,左侧「川」字部首与右侧「页」字部首之间有不自然的细线连接,且「页」字内部的笔画镂空并不完整,不符合物理切割逻辑。此外,2026 年在农历中并非马年(应为马年的前一年),这里的元素组合在文化逻辑上存在偏差。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】图像在材质质感、背景虚化和装饰细节方面表现良好,但在最核心的「镂空透视效果」上存在根本性失败——「顺」字被渲染为白色实体而非透明镂空,导致透过字形看洱海苍山的核心创意完全无法实现。此外视角处理也与提示词的第一人称要求存在偏差。综合来看,图像完成了约60-70%的提示词要求,核心创意点的缺失是最大硬伤。 【GEMINI】这是一张典型的「初看尚可,细看崩坏」的 AI 生成作品。虽然在材质纹理和色调氛围上达到了要求,但作为写实摄影风格,手部解剖结构的严重失误和镂空透视逻辑的错位是致命的硬伤,极大地破坏了图像的真实性。 【KIMI】该图像在核心元素完整性上表现良好,基本实现了提示词的主要要求,但在关键的「镂空透视」这一技术难点上存在明显不足——镂空区域缺乏真实的布料纤维边缘处理,且前后景的空间层次关系未能有效建立。材质表现停留在「看起来像亚麻布」的层面,未能深入刻画厚度、形变等物理属性。整体属于「基本完成要求但缺乏精致度」的AI生成水准,适合作为概念示意但经不起专业审视。

困难难度评测结果

  • 得分:75.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中,一双手正举着一张浅蓝色布质纹理的卡片,背景是波光粼粼的湖面和远处的淡蓝色山脉。卡片中心被镂空雕刻出一个汉字“顺”,通过字体的缝隙可以看到后方闪烁的湖水,寓意生活顺遂。卡片底部印有数字“2026”和一匹奔马的剪影。整体色调清新明亮,阳光在水面上形成耀眼的白色光斑。 然而,这张 AI 生成的图片存在明显的逻辑缺陷:首先,卡片中心的“顺”字在物理结构上是不合理的,许多笔画(如右侧的“页”字部分)完全悬空,没有任何连接点支撑却能固定在框架内,违背了现实中的剪纸或镂空原理。其次,持卡人的手指细节略显生硬,指甲边缘与卡片的接触位置存在轻微的透视重叠异常。此外,卡片边缘的布料纤维感在放大后显得有些杂乱且不自然。

画面中,一双手正举着一张浅蓝色布质纹理的卡片,背景是波光粼粼的湖面和远处的淡蓝色山脉。卡片中心被镂空雕刻出一个汉字“顺”,通过字体的缝隙可以看到后方闪烁的湖水,寓意生活顺遂。卡片底部印有数字“2026”和一匹奔马的剪影。整体色调清新明亮,阳光在水面上形成耀眼的白色光斑。

然而,这张 AI 生成的图片存在明显的逻辑缺陷:首先,卡片中心的“顺”字在物理结构上是不合理的,许多笔画(如右侧的“页”字部分)完全悬空,没有任何连接点支撑却能固定在框架内,违背了现实中的剪纸或镂空原理。其次,持卡人的手指细节略显生硬,指甲边缘与卡片的接触位置存在轻微的透视重叠异常。此外,卡片边缘的布料纤维感在放大后显得有些杂乱且不自然。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张AI生成图像整体完成度较高,成功呈现了第一人称视角手持镂空汉字卡片、透视洱海景观的核心构想,色调清新,构图自然,背景虚化效果出色。主要短板集中在水面倒影的物理真实性上——苍山倒影随水波扭曲的效果基本缺失,这是提示词明确要求的核心细节;此外镂空边缘的切割立体感和亚麻布的侧光质感也有提升空间。综合来看,图像在视觉美观度和整体氛围上表现优秀,但在部分技术细节的物理真实性上存在明显不足。 【GEMINI】这是一张典型的『初看尚可,细看全是破绽』的AI生成图。模型在构图和色彩把控上表现合格,但在处理复杂的物理透视、光影反射(倒影)以及材质融合度上显得力不从心。镂空透视的逻辑错误直接破坏了写实摄影的沉浸感,使其更像是一张拼贴感明显的合成图。 【KIMI】该图像在概念层面完成了提示词的基本框架,但在核心物理真实性上存在致命缺陷——镂空透视区域完全缺失倒影这一关键元素,使得「透过镂空看洱海苍山」的设计意图沦为简单的图层叠加。光源逻辑混乱与材质质感浮于表面进一步削弱了写实摄影的可信度。作为AI生成图像,其色彩与构图具备商业美观度,但作为严格遵循提示词的技术测试,未能满足「倒影随水波扭曲」与「切割质感真实」等硬性要求。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...