MiniMax image-01 在「敦煌月牙泉镂空幻字卡片生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:MiniMax image-01
- 用例名称:敦煌月牙泉镂空幻字卡片生成
- 测试类型:图像生成
- 评测维度:VG-FramedPerspective
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张写实摄影风格的图像:一只手拿着一张土黄色卡片,卡片中心镂空刻有汉字「幻」,透过镂空部分可以看到远处的月牙泉,背景是连绵的沙丘。
任务要求
AI 模型需要满足以下要求:
- 画面中有一只手持卡片的构图
- 卡片呈土黄色,中心有镂空汉字「幻」
- 透过镂空部分可见月牙泉景观
- 背景为沙漠沙丘场景
- 整体风格为写实摄影
评测结果
综合得分
该模型在此用例的得分为:57.9 分(满分 100 分),未通过
基础难度评测结果
- 得分:57.9 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展现了一只左手拿着一张黄色卡片,背景是广袤的沙漠。卡片中心有一个不规则的圆形镂空,形状酷似一个逗号或卷曲的叶片。透过这个孔洞,可以看到远方沙漠中站着一个渺小的黑色人影,这种“画中画”的构图营造出一种孤独而深邃的意境。整幅画面以暖黄色和沙土色为主调,光线柔和。然而,画面中存在明显的 AI 生成缺陷:首先,卡片左侧的文字并非真实的汉字,而是扭曲且无意义的符号组合;其次,持卡的手部细节异常,大拇指的指甲形状不自然,指关节的纹路过于杂乱且缺乏逻辑;最后,卡片边缘与背景沙漠的衔接处略显生硬,透视关系在镂空边缘处显得不够真实。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在写实摄影风格和基本构图上表现尚可,但在最核心的两个要求上严重失败:镂空汉字应为「幻」却呈现为不规则圆弧形,透过镂空应见月牙泉却只有普通沙漠。模型似乎将「月牙泉」的「月牙」概念错误映射到了镂空形状上,同时在卡片上生成了无关的汉字内容。这是典型的AI对复杂语义理解失败的案例,核心创意完全未能实现。 【GEMINI】这是一次执行失败的生成任务。模型完全忽略了提示词中关于「镂空汉字『幻』」这一核心视觉锚点,将其替换为了无法识别的乱码和抽象形状。虽然在摄影风格和光影质感上表现尚可,但作为设计类图像,未能准确传达文字信息是致命的缺陷。模型在处理复杂语义(如镂空文字)与特定地理景观(月牙泉)的结合上能力不足。 【KIMI】这是一次典型的「概念混淆」型失败:模型理解了「沙漠」「卡片」「镂空」的表层元素,却未能准确还原「幻」字与「月牙泉」这两个核心文化符号。镂空图形更接近月牙的抽象符号而非汉字,而月牙泉的缺失使得整个创意概念崩塌——用户要的是透过「幻」字看见月牙泉的禅意,而非透过随机形状看见沙漠剪影。建议在提示词中强化汉字结构描述与月牙泉地标特征。
进阶难度评测结果
- 得分:63.5 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只左手拿着一张黄色磨砂质感的镂空卡片,背景是广袤起伏的金色沙漠。画面色调温暖,阳光感强烈。卡片中心被镂空成一个类似汉字“山”或某种象形符号的形状,透过镂空处可以看到远处模糊的沙漠景观。卡片的右下角印有黑色的书法字体和红色的印章。构图上,手部和卡片位于左侧近景,背景的沙丘呈现出柔和的虚化效果。 在 AI 生成缺陷方面,画面存在明显的逻辑错误:首先,卡片镂空部分的中间有几段“悬浮”的黄色笔画,它们没有与卡片边缘连接,在现实物理世界中是无法固定在空中的。其次,手部持握卡片的姿势略显生硬,手指的边缘与卡片的衔接处处理得不够自然。最后,卡片右下角的黑色文字和红色印章虽然看起来像书法,但仔细观察会发现它们是杂乱无意义的符号,并非真实的汉字。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在摄影质感和氛围营造上表现不错,景深处理和色调统一度较高。然而,提示词中最核心、最具挑战性的要求几乎全部落空:镂空文字不是「幻」字、透过镂空看不到月牙泉、缺少「2026」字样和马剪影。图像更像是一张沙漠中手持软木装饰卡片的普通照片,而非提示词所要求的「月牙泉镂空纪念卡」创意摄影。模型在处理复杂的镂空透视+特定景观呈现+精确文字生成等综合任务时明显力不从心,完成度约为40%。 【GEMINI】这是一次失败的 AI 生成尝试。虽然模型在构图和基础景深处理上表现尚可,但在核心语义理解(汉字镂空)和细节指令执行(特定文字与剪影)上出现了重大偏差。图像中的「幻」字完全不可读,且关键装饰元素缺失,导致作品失去了原本的设计意图,无法作为合格的成品使用。 【KIMI】该图像在氛围营造和基础构图上有一定水准,但在核心语义理解上存在严重缺陷。模型未能正确生成指定的「幻」字镂空,而是产生了抽象的有机形态;同时完全遗漏了「2026」和马剪影两个关键元素。月牙泉的呈现也无法确认。这些并非细节瑕疵,而是对提示词核心要求的根本性偏离。作为「测试模型对镂空文字与地标景观表达能力」的任务,该结果属于明显失败。
困难难度评测结果
- 得分:67.5 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只左手拿着一张土黄色卡片的近景。背景是广袤起伏的沙漠,在夕阳的照射下呈现出温暖的金橙色。这张卡片中心有一个圆形的镂空,透过这个圆孔,可以看到远方沙漠中一处清澈的淡绿色湖泊,形成了“画中画”的视觉效果。卡片下方印有金色的艺术字体和数字“2026”及“1-10”。 画面中存在明显的 AI 生成缺陷:首先,卡片上的汉字并非真实的文字,而是扭曲、无法辨认的笔画堆砌,属于典型的 AI 乱码。其次,手部细节处理不自然,尤其是大拇指与食指捏住卡片的姿势显得僵硬,指甲形状略有畸形。此外,透过圆孔看到的湖泊景色与背景沙漠的衔接在透视上略显生硬,卡片边缘也过于锋利,缺乏与环境光的自然融合感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在整体氛围营造和摄影风格上表现尚可,复古胶片调色和第一人称视角是主要亮点。然而,最核心的创意要素——「幻」字镂空——完全未实现,被替换为普通圆形镂空,这是根本性的失败。卡片上的文字与图案(「赤狐」、飞鸟)与提示词要求(「2026」烫金、奔马剪影)明显不符,且月牙泉的新月形特征未能精准呈现。图像更像是一张普通的沙漠旅游卡片照,而非提示词所描述的具有精细镂空汉字的特色纪念卡。综合来看,完成度约在60-70分区间,氛围感有余而细节精度不足。 【GEMINI】这是一张典型的「氛围感强但逻辑崩坏」的 AI 图像。虽然在色调和光影氛围上达到了复古胶片的要求,但在核心指令(镂空文字、特定景观透视)上完全未能执行。作为一张旅行纪念卡片,它丢失了最重要的「信息载体」功能,导致图像失去了叙事逻辑。 【KIMI】这是一张在核心设计要素上严重失败的AI生成图像。最致命的问题在于「幻」字镂空的完全缺失——提示词明确要求的汉字镂空被替换为毫无意义的圆形,直接导致「透过镂空精准呈现月牙泉」的设计意图彻底落空。文字渲染的混乱(乱码、错字、数字错误)进一步暴露了模型对复杂汉字与排版逻辑的无力。尽管手部姿态与基础色调尚可,但这些无法弥补核心概念的崩塌。作为「旅行纪念卡片」的设计表达,此图像在信息传达层面完全失效。
相关链接
您可以通过以下链接查看更多相关内容: