MiniMax image-01 在「复杂多层场景」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:MiniMax image-01
- 用例名称:复杂多层场景
- 测试类型:图像生成
- 评测维度:场景构建
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张图片:现代办公室内部,前景是一张木质办公桌和电脑显示器,中景是落地窗和绿植,背景是城市天际线,下午阳光透过窗户洒进室内。
任务要求
AI 模型需要满足以下要求:
- 图像成功生成,画面完整无截断,无明显技术性错误(如大面积噪点、图像损坏、内容与提示词完全无关)
- 画面呈现清晰的三段式空间构图:前景为办公桌与显示器,中景为落地窗与绿植,背景为室外城市天际线,各层次通过遮挡关系或景深加以区分
- 前景中木质办公桌(具备木质色调或纹理特征)与电脑显示器均清晰可见,无严重变形或遮挡
- 中景中落地窗(大型竖向窗户,高度显著)与绿植(叶片轮廓可辨)可被识别
- 背景中城市天际线清晰存在,可见至少2栋以上建筑轮廓,呈现室外城市环境
- 下午阳光效果得到体现:画面整体色温偏暖,且存在来自落地窗方向的自然光感(如光线方向性、窗户投影或暖色光斑),符合下午室内采光的视觉特征
评测结果
综合得分
该模型在此用例的得分为:77.4 分(满分 100 分),已通过
基础难度评测结果
- 得分:77.4 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一个现代化的开放式办公室场景,正值清晨或傍晚,温暖强烈的阳光透过巨大的落地窗洒入室内。画面前景是一张木质办公桌的边角,上面放着一台电脑显示器的背面,金属支架细节清晰。中景处可以看到几张办公桌椅和一盆茂盛的绿色植物。背景通过透明玻璃窗呈现出模糊的城市天际线,高楼林立,阳光在左上角形成了明显的放射状光晕,整体色调以温馨的橙黄色和深蓝色为主,光影对比强烈。 在 AI 生成的细节方面,存在一些明显的逻辑缺陷:天花板上的灯具形状怪异且排列杂乱,看起来像是悬浮的碎片而非真实的照明设备;窗外的建筑轮廓过于模糊且结构不合理,缺乏现实建筑的逻辑感;此外,前景显示器的支架连接处显得有些生硬,缺乏真实的物理衔接细节。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张图像在光影氛围营造上表现出色,下午阳光透窗的视觉效果令人信服,三段式空间构图框架完整。然而,最核心的前景元素——电脑显示器——被逆光完全剪影化,这是一个不可忽视的失误:提示词明确要求显示器作为前景主体,但图像中它仅以黑色轮廓存在,细节全失。这反映出AI在处理「强逆光+前景细节」的矛盾时选择了牺牲元素还原度来换取光影戏剧性,是一种典型的「氛围优先、元素次之」的生成倾向。整体而言,图像视觉吸引力较高,但对提示词的忠实度存在明显缺口。 【GEMINI】这张图像在氛围营造上非常出色,精准捕捉了下午阳光的色温与质感。然而,作为一张测试「复杂空间层次」的图片,它在严谨的物理结构和透视逻辑上表现欠佳。显示器的工业设计错误、天花板灯具的透视崩坏以及物体悬浮问题,暴露出模型在处理物体间物理接触关系和全局透视统一性上的短板。 【KIMI】该图像在氛围营造上具备AI生成图像的典型优势——即快速建立整体色调与模糊美感,但在提示词要求的具体元素执行上存在多处硬伤。空间层次的失败是最核心的问题:落地窗作为连接内外的关键结构元素被虚化消解,导致「现代办公室」的空间特征大打折扣。光影处理上过度依赖眩光特效,牺牲了材质细节与物理合理性。综合而言,这是一张「看起来舒服但经不起审视」的AI生成图像,距离提示词的精确要求仍有显著差距。
进阶难度评测结果
- 得分:76.9 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展现了一幅充满禅意的日式园林景观,色彩以粉色、翠绿色和深灰色为主。画面中央是一个平静的池塘,几条红白相间的锦鲤在清澈的水中游弋,水面上散落着些许粉色花瓣。池塘周围环绕着错落有致的灰色岩石和修剪整齐的绿色灌木。一条蜿蜒的砂石小径通向一座木质拱桥,远方坐落着一座传统的日式木质凉亭。背景是漫山遍野盛开的粉色樱花树,在柔和的阳光下显得格外绚烂。构图采用了左右对称的树木作为前景框架,增强了空间深远感。 在 AI 生成的细节方面,存在一些明显的逻辑缺陷:画面前方的锦鲤形态略显僵硬,其中一条鱼的尾部与水面融合得不够自然;左侧小径旁的石灯笼结构模糊,缺乏真实的雕刻质感;远处的木桥与小径的连接处透视关系稍显生硬,且部分樱花树的分支结构过于密集且重复,呈现出一种超现实的人工合成感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张图像在元素完整性上表现较好,提示词要求的主要元素均已呈现,构图层次基本清晰,锦鲤描绘是最大亮点。然而图像整体呈现出「游戏场景插画」的风格倾向,过于饱和、过于整洁,缺乏真实日式庭园的材质质感与岁月感。最突出的问题是石灯笼造型失真和光线特征不符合提示词要求,这两点直接影响了日式庭园美学的真实性。空间层次虽然存在但纵深感略显不足,整体是一张「看起来不错但经不起细看」的AI生成图像。 【GEMINI】这张图像虽然在宏观构图和色彩上较好地还原了提示词描述的意境,但在微观结构和物理逻辑上表现欠佳。特别是建筑结构(茶室、木桥)的严谨性严重不足,这是 AI 生成复杂场景时的典型通病。材质表现力平庸,缺乏真实摄影或精细插画应有的质感细节,整体观感更接近于低精度的 3D 渲染图。 【KIMI】该图像作为「日式庭园」主题的快速视觉呈现尚可接受,但经不起专业审视。核心问题在于AI对「空间逻辑」的理解停留在符号拼贴层面——木桥、茶室、池塘等元素物理上并置,却未构建合理的三维空间关系。水面倒影与光源方向的系统性错误,暴露出模型对物理世界光学规律的学习不足。材质表现方面,「清澈池水」与「木质纹理」等提示词关键要求被表面化执行,通过色彩欺骗替代真实质感渲染。综合而言,这是一张「看起来像」但「经不起看」的AI生成图像,适合缩略图浏览,放大后破绽百出。
困难难度评测结果
- 得分:57.3 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中展现了一个充满科幻感的未来城市夜景。构图采用俯视视角,前景是一个巨大的透明玻璃平台,下方隐约可见复杂的机械结构和流动的橙色光束,仿佛是某种能源传输系统。中景是一座多层的现代化建筑,带有露天走廊和扶梯,许多黑色剪影般的人物在其中穿行。背景是高耸入云的摩天大楼,闪烁着冷蓝色的灯光,天空中还悬浮着一架造型奇特的深色飞行器。整体色调以冷峻的青蓝色为主,辅以少量的橙色光效,营造出一种赛博朋克的氛围。在 AI 生成的细节方面,存在一些明显的逻辑缺陷:左侧扶梯的结构与楼层连接处显得模糊且不合常理;建筑玻璃窗内的人物形态扭曲,缺乏清晰的肢体轮廓;右侧飞行器的造型缺乏对称性,且悬停位置与周围建筑的透视关系略显生硬,部分栏杆的线条在交汇处也出现了断裂或重叠。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在视觉风格上具有一定的赛博朋克美感,但对提示词的核心要求完成度极低。最关键的「透明玻璃地板下可见地铁列车高速通过」这一核心概念完全未能实现,玻璃地板仅是发光装饰平面。四层立体交通枢纽的空间结构严重缺失,磁悬浮轨道层不存在,飞行汽车造型失当。图像更像是一个「发光地板的未来建筑外观」而非「多层立体交通枢纽」,与提示词的复杂空间层次测试目标相去甚远。 【GEMINI】这张图像在氛围渲染上表现尚可,但在执行复杂的「立体交通枢纽」逻辑时出现了明显的偷工减料。最致命的问题在于对提示词核心元素——「玻璃下的地铁列车」的具象化失败,将其简化为了抽象的线条,导致空间叙事性大打折扣。人物细节的缺失和材质表现的单一,使其更像是一张概念草图而非高质量的成品图。 【KIMI】该图像在「复杂空间层次」测试上表现不佳。模型未能正确处理四层垂直空间的物理逻辑,导致地下隧道、中层平台、上层轨道的空间关系严重混淆。提示词核心元素——地铁列车、磁悬浮轨道、飞行汽车起降平台——或缺失或形态失败,仅保留了「夜景」「玻璃」「未来建筑」等表层视觉标签。光源与材质表现平庸,未达到「多重光源交织」「丰富反射折射」的要求。整体呈现为AI对提示词的碎片化理解,而非完整的空间叙事。
相关链接
您可以通过以下链接查看更多相关内容: