MiniMax image-01 在「黄山迎客松镂空寿字卡片生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:MiniMax image-01
- 用例名称:黄山迎客松镂空寿字卡片生成
- 测试类型:图像生成
- 评测维度:VG-FramedPerspective
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张写实风格的图像:一只手拿着一张深灰色岩石质感的卡片,卡片中心镂空刻有汉字「寿」,透过镂空部分可以看到远处的黄山迎客松与云海。背景云雾缭绕,整体氛围大气磅礴。
任务要求
AI 模型需要满足以下要求:
- 画面中有一只手持有深灰色岩石质感卡片
- 卡片中心有镂空的汉字「寿」
- 透过镂空部分可见黄山迎客松
- 背景有云海或云雾元素
- 整体风格为写实摄影风格
评测结果
综合得分
该模型在此用例的得分为:59.8 分(满分 100 分),未通过
基础难度评测结果
- 得分:59.8 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只左手捏着一张深灰色磨砂质感的长方形卡片,背景是云雾缭绕的山峦。卡片中心有一个不规则的镂空洞口,洞口中央悬浮着一个黑色的、类似汉字但并非真实文字的符号,其形状结合了“末”与“市”的特征。背景中的山峰若隐若现,右侧远处的山顶上有一个模糊的十字形结构。整体色调偏冷,呈现出一种静谧、神秘的氛围。 在 AI 生成的细节方面,存在明显的逻辑缺陷:首先,卡片中心的黑色符号完全悬浮在镂空处,没有任何支撑物连接到卡片边缘,违背了物理常识。其次,捏住卡片的手部比例略显失调,大拇指的长度和关节弯曲角度不够自然。此外,背景中十字架所在的建筑轮廓模糊不清,与卡片的锐利边缘形成了不自然的对比。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在写实摄影风格和云雾意境营造上有一定水准,但在最核心的两项要求上严重失败:镂空内的汉字并非「寿」字,且透过镂空完全看不到黄山迎客松。这两项是提示词最具辨识度的核心要素,缺失后图像与提示词的契合度大幅下降。镂空形状也呈云朵状而非汉字轮廓,进一步偏离了「镂空刻字」的设计意图。整体属于部分完成要求、存在多处关键偏差的情况。 【GEMINI】这是一次典型的「形似神不似」的生成尝试。虽然模型在摄影构图和氛围渲染上表现出了一定的水准,但在关键的语义理解(汉字书写)和特定地标元素(迎客松)的捕捉上表现极差。对于需要精确表达汉字和特定景观的场景,该模型目前尚无法达到商业级应用的要求。 【KIMI】这是一次明显的提示词执行失败。模型在最关键的文化符号(「寿」字)与场景地标(迎客松)上双重失守,生成的伪汉字与十字架元素暴露出训练数据中的概念混淆问题。镂空透视与材质表现亦未达写实标准,整体意境从「大气磅礴的黄山云海」滑向「阴郁神秘的宗教隐喻」,属于需要重新生成的严重偏差案例。
进阶难度评测结果
- 得分:64.4 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只手在云雾缭绕的山峰背景前,举着一块深灰色的石质长方形卡片。卡片中心有一个不规则的破碎圆洞,透过圆洞可以看到一个黑色的书法字体,其形状介于“奉”与“奔”之间,笔触带有水墨感。背景是典型的中式山水画风格,淡蓝色的远山在浓厚的白云中若隐若现,构图采用了中心对称的视觉焦点。 在 AI 生成的细节方面,存在明显的逻辑缺陷:首先,黑色的汉字悬浮在卡片中央的空洞中,没有任何支撑物却能固定在半空,违背了物理常识。其次,持卡的手部细节不够自然,大拇指的指甲形状略显生硬,且手指与卡片接触的边缘处理得过于平滑,缺乏真实的压迫感。此外,卡片底部的浮雕数字模糊不清,无法辨认具体含义。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在摄影风格、景深处理和材质质感方面表现尚可,但在提示词核心要求的落实上存在严重失误:最关键的镂空汉字生成为「奉」而非「寿」,透过镂空看到的是普通山景而非黄山迎客松,底部「2026」与马剪影装饰也未能清晰呈现。这些均属于对提示词核心意图的偏离,导致整体评分较低。图像的视觉质量本身尚可,但内容准确性严重不足。 【GEMINI】这是一张典型的「形似神不似」的AI生成作品。虽然在材质渲染、景深控制和整体氛围营造上表现出了一定的水准,但在关键的语义理解和细节执行上严重失分。特别是汉字识别与特定文字/图案的嵌入能力,是当前模型明显的短板。对于需要精确传达信息的视觉设计需求,该图像目前无法直接使用。 【KIMI】这是一张典型的「AI半成品」——在质感渲染和氛围营造上有表面功夫,但在核心语义理解上彻底失败。模型未能正确生成「寿」字这一关键文化符号,取而代之的是结构崩坏的伪汉字;同时遗漏了迎客松、2026数字、马剪影等明确要求的元素。镂空透视的逻辑断裂暴露了AI对三维空间关系的薄弱理解。整体而言,图像在视觉表层及格,在语义完成度上严重不合格,属于「看起来还行但完全不对题」的失败案例。
困难难度评测结果
- 得分:57.8 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只左手拿着一块长方形灰色石板,背景是雄伟的群山和翻腾的云海。石板中央有一个不规则的圆形镂空,镂空处神奇地悬浮着一个黑色的书法汉字,其笔画与石板边缘并无物理连接,呈现出超现实的视觉效果。石板左上角刻有模糊的文字,右下角刻有数字“2026”。背景中的山峦在晨光或暮色中呈现出深蓝色调,云雾缭绕,意境深远。 画面中存在明显的 AI 生成缺陷:首先,石板中心的汉字结构扭曲,并非标准的汉字,看起来像是“柜”或“枢”的变形体,且笔画末端凭空消失或与背景杂草融合。其次,手持石板的左手大拇指指关节处透视异常,显得过于粗大且与手掌的连接不够自然。此外,石板左上角的刻字模糊不清,无法辨认,且石板边缘的厚度感在不同位置表现得不一致,缺乏真实的物理逻辑。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在构图框架和材质表现上有一定基础,但在最核心的内容要求上出现了严重偏差:镂空汉字错误(「拒」代替「寿」)、背景缺失黄山迎客松、镂空形状不符合字形要求、奔马剪影缺失。这些均属于提示词明确要求的关键元素,失分严重。整体图像呈现的是一张持有刻有「拒」字石卡对准普通山景的画面,与提示词描述的「寿」字镂空对准黄山迎客松的意境相去甚远,综合完成度较低。 【GEMINI】该图像在执行复杂指令时表现出明显的模型局限性。虽然基本构图框架(手持卡片)得以保留,但在核心的「镂空透视」、「文字准确性」及「特定元素植入」方面完全失败。图像更像是一次失败的后期合成,而非一次成功的写实摄影生成。 【KIMI】这是一张在核心诉求上严重失败的AI生成图像。模型未能理解「镂空对准迎客松」这一关键构图任务,导致后方景物完全错误;「寿」字形畸变、奔马剪影缺失、景深效果失败等多重问题叠加,使图像从「文化底蕴与视觉冲击力兼具」的诉求跌落为一张元素错乱的平庸风景照。仅在基础材质与光线色调上有及格表现,整体与提示词要求存在显著偏差。
相关链接
您可以通过以下链接查看更多相关内容: