混元生图 3.0 在「天坛祈年殿镂空岁字卡片生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:混元生图 3.0
- 用例名称:天坛祈年殿镂空岁字卡片生成
- 测试类型:图像生成
- 评测维度:VG-FramedPerspective
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张图像:一只手拿着一张银色金属质感的长方形卡片,卡片中心镂空刻有汉字「岁」,透过镂空部分可以看到远处的北京天坛祈年殿,背景是湛蓝的天空。
任务要求
AI 模型需要满足以下要求:
- 画面中有一只手持银色金属长方形卡片
- 卡片中心有镂空的汉字「岁」
- 透过「岁」字镂空可见北京天坛祈年殿
- 背景为湛蓝天空
- 整体画面清晰,构图完整
评测结果
综合得分
该模型在此用例的得分为:76.5 分(满分 100 分),已通过
基础难度评测结果
- 得分:76.5 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只右手拿着一个银灰色金属边框,正对着背景中蓝天下的北京天坛祈年殿。这个金属框中心镂空,中间悬浮着一个同样材质的简体汉字「岁」。背景的天空湛蓝清澈,祈年殿的蓝色琉璃瓦顶和红色墙体在阳光下清晰可见。构图上,手部占据了画面的右侧和底部,金属框位于中心,形成了一种「画中画」的视觉效果。然而,画面中存在明显的 AI 生成缺陷:最显著的是手部结构异常,大拇指的指甲形状不自然,且食指与中指的连接处逻辑混乱,看起来像是多根手指融合在了一起;此外,金属框中间的「岁」字完全悬浮在空中,没有任何支撑点连接到外框,违背了物理常识;天坛建筑的细节也略显模糊,与真实建筑结构存在细微偏差。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】图像在元素完整性和画面质量上表现尚可,四个核心元素均有呈现,材质渲染较为真实。但最关键的「镂空」创意效果未能实现——「岁」字以实体金属字叠加而非镂空透视的方式呈现,导致提示词的核心视觉概念(透过镂空字形看到远景建筑)完全落空。空间层次从「穿透感」退化为「相框+叠字」的平面合成,是本图最大的失分点。 【GEMINI】这是一张典型的 AI 生成图像,在宏观构图上完成了任务要求,但在微观细节和物理逻辑上经不起推敲。手部结构的崩坏和透视关系的错位是其主要短板,导致图像缺乏真实摄影的质感。 【KIMI】该图像在概念执行上完成了提示词的基本要求,但作为「挑剔评审员」必须指出:这是一张典型的「AI 合成感」明显的作品——元素堆砌完整,但空间逻辑与物理真实感薄弱。核心败笔在于「岁」字镂空与祈年殿的构图冲突:设计师(或模型)过于追求字形完整,牺牲了建筑可视性,导致「透过镂空可见祈年殿」这一关键意图大打折扣。透视关系的失调进一步削弱了场景可信度。建议优化方向:缩小「岁」字笔画宽度、调整卡片与建筑的虚拟距离、增强镂空边缘的光学真实感。
进阶难度评测结果
- 得分:79.5 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只左手拿着一块银色金属镂空书签,背景是北京天坛祈年殿。书签呈长方形框状,中心镂空出一个巨大的简体中文“岁”字,下方刻有数字“2026”和一匹奔马的剪影。背景的天坛建筑处于虚化状态,蓝天清晰,阳光充足。画面构图以手中的书签为视觉中心,呈现出一种旅行打卡的氛围。 在 AI 生成的细节方面,存在明显的逻辑和图形错误:首先,2026 年在农历中应为马年,但书签上的“岁”字结构异常,其上半部分的“山”字与下半部分连接方式生硬,且笔画边缘有不自然的锯齿感。其次,持物的手部比例略显僵硬,大拇指的指甲形状不够自然。最明显的错误在于背景的天坛建筑,其层数和瓦片的透视关系模糊,且天空中出现了几处不明原因的黑色虚化斑点,属于典型的 AI 渲染噪点。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像较好地完成了提示词的核心要求,六项关键要求基本满足。手持金属卡片、镂空「岁」字、祈年殿、「2026」与马剪影等元素齐全,材质细节表现优秀。主要不足在于祈年殿与镂空的对称居中精准度不够,以及电影级调色的深度处理不足,整体更接近高质量摄影风格而非真正的电影级色调。综合来看是一张完成度较高的作品,但在构图精准性和调色深度上仍有提升空间。 【GEMINI】这是一张在构图和氛围营造上表现优秀的 AI 生成图,但在微观细节处理上暴露了模型对复杂解剖结构(手部)和物理材质(激光雕刻)理解的局限性。手部结构的失误严重影响了第一人称视角的沉浸感,是目前最大的扣分项。 【KIMI】该图像完成了提示词的基础要求,但在核心构图对称性上存在不可忽视的偏差——祈年殿与「岁」字镂空的居中关系是测试重点,模型未能精准把控这一空间对齐。材质表现达到及格线,但「激光雕刻」的工艺特征未被准确还原。整体属于「能看懂意图但执行有瑕」的AI生成水平,距离电影级质感仍有明显差距。
困难难度评测结果
- 得分:71.8 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只手拿着一张银色金属质感的长方形卡片,背景是北京天坛祈年殿。画面构图以卡片为视觉中心,背景建筑呈现出柔和的虚化效果。卡片中心镂空刻有一个巨大的简体中文“岁”字,下方印有一匹奔跑的黑马图案以及数字“2026”。背景的天坛建筑在蓝天白云下显得宏伟,色彩以青砖蓝瓦和朱红墙面为主。然而,这张 AI 生成的图片存在明显的逻辑和细节缺陷:首先,2026 年在中国传统生肖中应为马年,但卡片上的“岁”字笔画结构生硬,且镂空边缘缺乏真实的物理厚度感;其次,背景天坛祈年殿顶部的牌匾文字模糊不清,无法辨认;最明显的错误在于手部,捏住卡片的手指比例略显不自然,且卡片仿佛凭空悬浮在指尖,缺乏合理的受力点和阴影遮挡,透视关系显得不够真实。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】图像基本完成了手持金属卡片与祈年殿背景的场景构建,第一人称视角、景深效果和金属材质均有较好表现。但核心创意亮点「框中框」精准对称构图未能实现,「岁」字书法字形存在明显变形,电影级冷蓝色调处理不足,整体视觉品质距高端文创宣传图标准仍有差距。综合评分约71分,属于部分完成提示词要求的水平。 【GEMINI】图像在材质表现和氛围营造上达到了较高水准,但在严谨的构图对齐和细节(尤其是文字与手部解剖)处理上暴露了 AI 生成的短板。作为一张文创宣传图,其视觉冲击力尚可,但缺乏经得起推敲的工业设计精度。 【KIMI】该图像在核心构图要求上存在严重失误,「框中框」对称构图的偏离是致命缺陷,直接违背提示词的核心意图。材质表现层面,金属质感与光学效果的缺失使卡片失去高端文创应有的精致感。整体完成度处于「部分完成要求」的下游水平,模型对空间对齐、书法美学与物理材质的综合处理能力明显不足。建议优先修正构图对齐问题,并强化金属材质的环境反射与纹理细节。
相关链接
您可以通过以下链接查看更多相关内容: