GLM-Image 在「黄山迎客松镂空寿字卡片生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:GLM-Image
- 用例名称:黄山迎客松镂空寿字卡片生成
- 测试类型:图像生成
- 评测维度:VG-FramedPerspective
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张写实风格的图像:一只手拿着一张深灰色岩石质感的卡片,卡片中心镂空刻有汉字「寿」,透过镂空部分可以看到远处的黄山迎客松与云海。背景云雾缭绕,整体氛围大气磅礴。
任务要求
AI 模型需要满足以下要求:
- 画面中有一只手持有深灰色岩石质感卡片
- 卡片中心有镂空的汉字「寿」
- 透过镂空部分可见黄山迎客松
- 背景有云海或云雾元素
- 整体风格为写实摄影风格
评测结果
综合得分
该模型在此用例的得分为:66.1 分(满分 100 分),已通过
基础难度评测结果
- 得分:66.1 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中,一只手正举着一张深灰色的长方形磨砂卡片,背景是壮丽的高山云海。卡片中心采用了镂空设计,透过镂空部分可以看到远处的蓝天、白云和翠绿的松树。构图上,卡片占据了视觉中心,远景的群山在云雾中若隐若现,整体色调清新自然。然而,这张图片存在明显的 AI 生成缺陷:最突出的问题是卡片上的镂空文字,它看起来试图模仿汉字“春”或“泰”,但笔画结构完全错误,是一组没有任何实际意义的乱码线条。此外,持卡人的手指细节也显得不自然,大拇指的指甲形状略显生硬,且手指与卡片边缘的接触位置缺乏真实的物理压痕。右下角虽然标有“AI生成”字样,但镂空处透出的背景树木与卡片边缘的衔接也略显生硬,缺乏真实的透视深度感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【GEMINI】这是一张典型的「远看不错,细看崩坏」的AI作品。虽然在材质渲染和背景氛围上表现尚可,但作为核心任务的「汉字镂空」完全失败,模型未能正确绘制汉字结构,导致作品失去了核心意义。此外,镂空透视关系的缺失使得画面缺乏真实感,难以达到专业摄影作品的水平。 【KIMI】该图像在概念执行层面基本合格,但细节完成度不足。核心问题在于「寿」字本身的结构错误——这既是文字识别失误,也导致提示词核心要求落空;其次镂空透视的多处逻辑断裂暴露了AI对三维空间关系的理解缺陷。作为「第一人称手持镂空卡片」这一特定场景的测试,模型未能处理好「前景遮挡物-镂空区域-背景景物」的三层空间叠加关系。整体处于「能看懂意图但经不起细看」的水平,与专业摄影或设计交付标准存在明显差距。
进阶难度评测结果
- 得分:55.0 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只手正举着一块深灰色、质感粗糙的长方形石牌,背景是壮丽的高山云海。石牌占据了画面中心,上方深深刻有一个巨大的汉字,其字形介于“寿”与“春”之间,笔画圆润且有明显的下凹立体感;石牌下方刻有两匹并排奔跑的马的轮廓,以及数字“2020”。背景中,连绵的青翠山峦在浓厚的白云中若隐若现,天空呈现出阴天特有的灰白色。 作为一张 AI 生成的图片,画面存在几处明显的逻辑缺陷:首先,石牌上方的汉字并非标准字体,其下半部分的结构属于生造,无法准确辨认;其次,下方的两匹马在重叠处线条混乱,马腿的数量和位置显得模糊不清,缺乏合理的透视关系;此外,手持石牌的指尖边缘与石块结合处过于平滑,缺乏自然的压痕与物理接触感,整体光影略显生硬。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【GEMINI】这是一次失败的生成。模型未能理解「镂空」这一核心视觉指令,导致画面失去了预期的空间交互感。此外,对于具体文字内容的控制力较弱,出现了明显的年份错误。虽然岩石质感尚可,但作为一张功能性构图的图像,其核心逻辑的缺失使其无法达到及格水平。 【KIMI】该图像在核心创意「镂空透视」上完全失败,将关键的「镂空」误解为「阴刻」,导致提示词最具特色的视觉要求未能实现。年份错误(2020/2026)与迎客松缺失进一步拉低完成度。尽管表面质感与背景氛围有一定表现,但根本性概念误解使其无法达到合格标准。
困难难度评测结果
- 得分:63.5 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只左手拿着一张灰色花岗岩质感的矩形薄片,背景是模糊的高山云海与松树。薄片上采用了镂空设计,左侧是一个复杂的松树图案,下方似乎还带有一个类似动物的轮廓;右侧上方是一个巨大的汉字“寿”,下方刻有数字“2026”。整体构图以手持卡片为中心,色调偏冷,营造出一种在山巅祈福的氛围。 画面中存在明显的 AI 生成缺陷:首先,汉字“寿”的笔画结构异常,顶部多出了不自然的横划,且整体间架结构不符合常规书法或字体逻辑;其次,左侧的松树镂空图案线条杂乱,缺乏合理的植物生长逻辑,下方的动物形象也模糊不清,难以辨认具体物种;最后,拿卡片的手指边缘略显生硬,与卡片的接触面透视关系不够自然。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【GEMINI】该图像在背景氛围渲染上表现尚可,但在核心的「镂空透视」与「物理真实感」上表现较差。作为一张强调镂空透视的图像,其未能处理好前景卡片与远景的视觉逻辑,导致画面整体缺乏空间深度,且手部细节的崩坏进一步降低了写实摄影的真实感。 【KIMI】该图像在核心创意「镂空框景」上完全失败,是最严重的功能性缺陷。提示词将「透过镂空『寿』字可见迎客松」作为核心难点与视觉亮点,但生成结果中镂空区域仅为白色空洞,与背景无真实空间关联,导致整个构图逻辑崩塌。此外,「寿」字书法质量低劣、镂空与景物位置错位、色调平淡等问题叠加,使图像从「大气磅礴的文化意境」降级为「手持劣质纪念品的游客照」。仅手部细节与基础岩石纹理勉强及格,整体属于提示词理解严重偏差的案例。
相关链接
您可以通过以下链接查看更多相关内容: