qwen-image-max 在「敦煌月牙泉镂空幻字卡片生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:qwen-image-max
- 用例名称:敦煌月牙泉镂空幻字卡片生成
- 测试类型:图像生成
- 评测维度:VG-FramedPerspective
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张写实摄影风格的图像:一只手拿着一张土黄色卡片,卡片中心镂空刻有汉字「幻」,透过镂空部分可以看到远处的月牙泉,背景是连绵的沙丘。
任务要求
AI 模型需要满足以下要求:
- 画面中有一只手持卡片的构图
- 卡片呈土黄色,中心有镂空汉字「幻」
- 透过镂空部分可见月牙泉景观
- 背景为沙漠沙丘场景
- 整体风格为写实摄影
评测结果
综合得分
该模型在此用例的得分为:77.4 分(满分 100 分),已通过
基础难度评测结果
- 得分:77.4 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只手拿着一块土黄色的方形泥板,背景是广袤的沙漠景观。泥板中心被镂空刻出了一个汉字,透过镂空部分可以看到远处的绿洲和一潭碧蓝的泉水,呈现出一种“画中画”的视觉效果。远景的沙丘起伏平缓,色调温暖,与近处泥板的粗糙质感形成对比。然而,画面中存在明显的 AI 生成缺陷:首先,泥板上的镂空汉字结构混乱,虽然看起来像“幻”字,但笔画断裂且不符合常规书写逻辑,中间有不自然的连接点;其次,左下角拿板子的手部细节异常,大拇指的指甲形状不够自然,指关节的纹路略显模糊且比例失调;最后,透过镂空看到的绿洲边缘与泥板边缘的透视关系略显生硬,缺乏真实的光影遮挡感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像较好地完成了提示词的核心要求:手持土黄色镂空「幻」字卡片、透过镂空可见月牙泉、沙漠背景、写实摄影风格,五项关键要求均基本满足。最大亮点是卡片材质质感的真实表现和整体摄影氛围的营造。主要不足集中在镂空透视效果的精细度上——边缘融合略显生硬,月牙泉的标志性弯月形态辨识度不够突出。综合来看是一张完成度较高的AI生成图像,但在镂空透视的精细处理上仍有提升空间。 【GEMINI】图像在摄影风格和环境渲染上表现出色,但作为核心视觉焦点的汉字「幻」生成彻底失败,这在很大程度上削弱了作品的叙事能力。对于需要精准文字呈现的创作需求,该模型表现尚需提升。 【KIMI】该图像在概念层面完成了「手持镂空卡片框景月牙泉」的创意构图,但执行层面暴露出AI生成文本镂空结构的典型缺陷——汉字笔画的空间拓扑关系理解失败。作为以「幻」字为核心视觉锚点的图像,文字形态的崩解直接削弱了主题表达力。建议优先修复汉字结构准确性,其次优化镂空透视的物理真实感。
进阶难度评测结果
- 得分:82.0 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只手拿着一张棕褐色的硬纸卡片,背景是广袤起伏的沙漠景观。卡片中央有一个巨大的镂空汉字“幻”,透过这个镂空处,可以看到远处沙漠中一处形似月牙泉的绿洲湖泊。卡片右下角印有数字“2026”和一匹奔马的黑色剪影。背景的沙丘呈现出温暖的土黄色,阳光从左上方照射,形成了柔和的光影对比。 在 AI 生成的细节方面,存在明显的逻辑和透视缺陷:首先,手持卡片的手指比例失调,大拇指的指甲形状异常,且手指与卡片接触的边缘显得模糊。其次,卡片上的镂空汉字“幻”字结构不规范,笔画连接处显得生硬且不符合书法逻辑。此外,背景中的绿洲边缘与卡片边缘的衔接处存在透视错位,远景的建筑和植被细节显得杂乱且缺乏清晰的结构感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张高质量的AI生成图像,几乎完整地实现了提示词的所有要求。第一人称视角、镂空「幻」字、月牙泉透视、「2026」马剪影、沙丘虚化、复古暖黄色调六项核心要求均得到满足。图像的整体视觉叙事完整,「幻」字与月牙泉的组合寓意深刻,沙漠奇观的异域风情表达到位。主要不足在于镂空边缘的合成感和背景虚化程度略显不足,但这些属于细节层面的瑕疵,不影响整体高完成度的评价。综合加权得分约为89分,属于优秀级别。 【GEMINI】这是一张在氛围营造和材质表现上非常出色的作品,但在细节处理和逻辑严密性上暴露了 AI 绘图的典型短板。卡片底部的文字和图形处理显得非常草率,严重影响了作品的精致度。此外,镂空透视的物理逻辑缺失,使得画面在写实感上大打折扣。如果能修复文字和图形的清晰度,并优化透视关系,这将是一张高质量的摄影风格作品。 【KIMI】该图像完成了提示词的核心叙事框架——手持镂空卡片框取月牙泉的创意构图——但在物理真实性与光学逻辑层面存在AI生成的典型破绽。镂空透视的空间关系错误、实体厚度感的缺失、以及色调统一性的瑕疵,表明模型在处理「复杂空间层次+特定材质+精确文字图形」的组合任务时仍有局限。作为旅游纪念风格的视觉素材可用,但作为写实摄影作品则经不起专业审视。
困难难度评测结果
- 得分:73.9 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只左手拿着一张黄色磨砂质感的镂空卡片,背景是阳光照耀下的广袤沙漠和一处绿洲湖泊。卡片中心镂空了一个巨大的汉字,形状介于“幻”与“勿”之间,笔画边缘带有木质纹理。卡片右下角印有数字“2026”和一匹奔跑的骏马剪影。背景中的沙漠呈现出柔和的金黄色褶皱,远处的绿洲隐约可见青翠的植被和一潭碧水,整体构图采用了浅景深效果,使焦点集中在手持的卡片上。在 AI 生成细节方面,镂空的汉字结构并不标准,笔画连接处显得生硬且不符合常规书写逻辑;手部的大拇指指甲形状略显扁平,且手指与卡片接触的边缘光影处理不够自然,卡片右下角的马匹剪影前腿线条也略显模糊,呈现出典型的 AI 生成痕迹。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像基本完成了提示词的核心框架要求:第一人称视角、手持土黄色砂砾卡片、「幻」字镂空、底部「2026」与奔马图案、沙漠背景。但在精细度上存在多处不足:最关键的镂空透视效果未能精准呈现月牙泉新月形水面,三层景深层次感弱;复古胶片调色仅完成暖黄主调,暗角、高光过曝、阴影橙褐等细节缺失;烫金质感未能体现。整体属于「框架达标、细节欠缺」的水平,完成度约七成。 【GEMINI】这张图像在氛围营造和材质表现上展现了不错的潜力,但在物理逻辑和细节精度上暴露了AI生成的典型弱点。最核心的「镂空透视」功能未能实现,导致画面失去了预期的「借景」艺术感,反而产生了一种拼贴画的廉价感。对于细节(如文字和剪影)的处理过于模糊,缺乏专业设计应有的严谨性。 【KIMI】这是一张在核心创意点上完全失败的AI生成图像。提示词最具挑战性的要求——「透过『幻』字镂空精准呈现月牙泉」——被彻底忽略,镂空内的内容成为无法辨识的模糊色块,使整张图像的叙事逻辑崩塌。卡片细节与光影存在多处物理性错误,手部姿态与光源方向不一致进一步削弱真实感。模型似乎无法理解「镂空透视」作为空间装置的艺术意图,将其简化为「卡片上有个洞,洞里随便塞个背景」的表层处理。复古胶片风格流于表面数字滤镜,缺乏胶片媒介的物质性特征。综合评分:66分(加权计算),主要扣分集中于镂空透视的彻底失败与光影物理真实性的多处硬伤。
相关链接
您可以通过以下链接查看更多相关内容: