MiniMax image-01 在「丝绸之路幻想风绿洲集市生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:MiniMax image-01
  • 用例名称:丝绸之路幻想风绿洲集市生成
  • 测试类型:图像生成
  • 评测维度:游戏概念图

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张丝绸之路风格的绿洲集市场景。 场景要求: - 画面中有波斯风格的拱门建筑 - 集市中摆放着香料和珠宝 - 悬挂着彩色手工地毯 - 有不同种族的商人在进行交易

任务要求

AI 模型需要满足以下要求:

  1. 画面中存在明显的波斯风格拱门建筑
  2. 集市中可见香料、珠宝等商品陈列
  3. 画面中有悬挂的彩色地毯
  4. 画面中有至少两名外貌不同的商人角色
  5. 整体画面构图清晰,具有集市氛围

评测结果

综合得分

该模型在此用例的得分为:78.9 分(满分 100 分),已通过

基础难度评测结果

  • 得分:78.9 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中展现了一个充满异域风情的繁华中东风格露天集市。街道两旁是高大的浅黄色石质建筑,带有精美的拱门和石柱。阳光从建筑缝隙中洒下,照亮了铺满石板的地面。街道上方悬挂着大量色彩斑斓的织物和地毯,以红色、橙色和蓝色为主,上面印有复杂的传统花纹。许多身着长袍、头戴头巾的人们在街上行走或在摊位前驻足。摊位上整齐地摆放着各种香料、干果和手工艺品,色彩丰富且鲜艳。 然而,画面中存在明显的 AI 生成缺陷:首先,天空中横跨街道的电线或绳索分布极其混乱,交织方式不符合物理逻辑,且部分线条在空中凭空消失或断裂。其次,远景处的人物身形模糊且比例失调,部分肢体与背景建筑融合。右侧前景的地毯悬挂方式显得不自然,仿佛漂浮在空中,缺乏明确的支撑结构。此外,街道深处的建筑透视关系略显扭曲,给人一种空间错乱的感觉。

画面中展现了一个充满异域风情的繁华中东风格露天集市。街道两旁是高大的浅黄色石质建筑,带有精美的拱门和石柱。阳光从建筑缝隙中洒下,照亮了铺满石板的地面。街道上方悬挂着大量色彩斑斓的织物和地毯,以红色、橙色和蓝色为主,上面印有复杂的传统花纹。许多身着长袍、头戴头巾的人们在街上行走或在摊位前驻足。摊位上整齐地摆放着各种香料、干果和手工艺品,色彩丰富且鲜艳。

然而,画面中存在明显的 AI 生成缺陷:首先,天空中横跨街道的电线或绳索分布极其混乱,交织方式不符合物理逻辑,且部分线条在空中凭空消失或断裂。其次,远景处的人物身形模糊且比例失调,部分肢体与背景建筑融合。右侧前景的地毯悬挂方式显得不自然,仿佛漂浮在空中,缺乏明确的支撑结构。此外,街道深处的建筑透视关系略显扭曲,给人一种空间错乱的感觉。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像整体较好地还原了丝绸之路集市的异域氛围,拱门建筑、彩色地毯、香料摊位等核心元素基本齐全,色彩表现和构图具有较强的视觉冲击力。主要不足在于:珠宝商品几乎缺失、多民族商人的种族差异化表现不足、人物面部细节模糊,以及建筑风格存在轻微的欧式混入。综合来看属于「基本完成要求但存在若干明显瑕疵」的水平。 【GEMINI】这张图像在宏观构图和氛围营造上非常成功,准确捕捉了丝绸之路集市的异域神韵。然而,作为一名挑剔的评审员,我无法忽视其在微观细节上的崩坏:混乱的空中线条、缺失的珠宝细节以及人物肢体的结构性错误,使其只能作为一张远观的氛围图,经不起细节推敲。 【KIMI】该图像完成了提示词的基础框架搭建,但在「珠宝」这一明确要求的元素上存在实质性遗漏,且地毯纹样暴露出AI生成装饰图案的系统性短板——擅长氛围而弱于工艺细节。整体属于「形似而神不似」的orientalist视觉套路,对于丝绸之路主题的深度还原仍有显著差距。

进阶难度评测结果

  • 得分:68.4 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展现了一个充满中东风情的繁华露天集市。画面采用中心透视构图,一条土黄色的街道向远方延伸,尽头是一座宏伟的伊斯兰风格拱门,上方可见蔚蓝的天空。街道两旁的建筑挂满了色彩斑斓的挂毯和地毯,以深红、明黄和宝蓝色为主,上面布满了复杂的几何纹样。街道右侧堆放着如小山般的香料粉末,呈现出鲜艳的橙色、黄色和红色,旁边摆放着精致的金属器皿。一名身穿浅灰色长袍、围着棕色头巾的男子正迎面走来,神情肃穆。 画面中存在明显的 AI 生成缺陷:首先,前景右侧的香料堆和器皿在透视上显得有些漂浮,缺乏真实的重力感;其次,左侧货架上的小物件细节模糊,呈现出无意义的杂乱色块;最明显的是,背景中远处的行人和建筑细节出现了扭曲,拱门上方的装饰物左右不对称,且部分挂毯的边缘与建筑墙体融合得极不自然,缺乏真实的物理衔接。

图中展现了一个充满中东风情的繁华露天集市。画面采用中心透视构图,一条土黄色的街道向远方延伸,尽头是一座宏伟的伊斯兰风格拱门,上方可见蔚蓝的天空。街道两旁的建筑挂满了色彩斑斓的挂毯和地毯,以深红、明黄和宝蓝色为主,上面布满了复杂的几何纹样。街道右侧堆放着如小山般的香料粉末,呈现出鲜艳的橙色、黄色和红色,旁边摆放着精致的金属器皿。一名身穿浅灰色长袍、围着棕色头巾的男子正迎面走来,神情肃穆。

画面中存在明显的 AI 生成缺陷:首先,前景右侧的香料堆和器皿在透视上显得有些漂浮,缺乏真实的重力感;其次,左侧货架上的小物件细节模糊,呈现出无意义的杂乱色块;最明显的是,背景中远处的行人和建筑细节出现了扭曲,拱门上方的装饰物左右不对称,且部分挂毯的边缘与建筑墙体融合得极不自然,缺乏真实的物理衔接。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在异域氛围营造和香料陈列方面表现出色,光影处理具有专业水准。然而在提示词最核心的叙事要素上存在严重缺失:多民族商人互动场景几乎完全缺失(仅1名可辨人物,无互动行为),地毯花纹清晰度不达标。这两项均属提示词明确要求的关键元素,导致场景元素完整性维度大幅失分。图像更像是一张精美的异域市集环境渲染图,而非包含多民族人物互动叙事的原画场景。 【GEMINI】这是一张视觉效果华丽但未能完全履行指令的图像。在建筑环境和静态氛围的营造上非常出色,但在「人物互动」这一核心叙事要求上完全失败。材质表现上,织物与香料表现优异,但金属质感的缺失拉低了整体的材质对比度。作为原画,其叙事性不足,更像是一张空旷的场景概念图。 【KIMI】该图像为典型的AI「氛围图」——色彩饱和、构图对称、光影柔和,但经不起提示词要求的逐项核验。核心失败在于人物数量与互动性的缺失,以及材质真实感的严重不足。模型擅长生成「看起来像」的异域风情,却无法落实「三名商人交易互动」「金属反光」「织物纹理」等具体指令。评分需严格压低以区分真正完成要求的模型。

困难难度评测结果

  • 得分:69.7 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一个充满异域风情的繁华古代集市街道,整体色调呈现温暖的土黄色和金橙色。画面采用纵深透视构图,两旁是高耸且带有精美雕刻的伊斯兰风格拱门建筑,阳光穿过拱顶洒下几道清晰的丁达尔光柱,照亮了空气中的尘埃。街道两侧摆满了成堆的彩色香料,如红色的辣椒粉和黄色的姜黄粉,墙上挂着图案复杂的挂毯。许多身着长袍的行人正背对着镜头向街道深处走去。 在 AI 生成的细节方面,存在一些明显的逻辑缺陷:左侧悬挂的挂毯上出现了无法辨认的乱码文字;街道远景处的人群轮廓变得模糊且结构混乱,部分人物的肢体与背景建筑产生了不自然的融合;前景左侧散落的金色碎片在光影逻辑上显得有些突兀,像是凭空漂浮。此外,建筑的雕刻纹理在放大后显得重复且缺乏真实的结构合理性。

图中展示了一个充满异域风情的繁华古代集市街道,整体色调呈现温暖的土黄色和金橙色。画面采用纵深透视构图,两旁是高耸且带有精美雕刻的伊斯兰风格拱门建筑,阳光穿过拱顶洒下几道清晰的丁达尔光柱,照亮了空气中的尘埃。街道两侧摆满了成堆的彩色香料,如红色的辣椒粉和黄色的姜黄粉,墙上挂着图案复杂的挂毯。许多身着长袍的行人正背对着镜头向街道深处走去。

在 AI 生成的细节方面,存在一些明显的逻辑缺陷:左侧悬挂的挂毯上出现了无法辨认的乱码文字;街道远景处的人群轮廓变得模糊且结构混乱,部分人物的肢体与背景建筑产生了不自然的融合;前景左侧散落的金色碎片在光影逻辑上显得有些突兀,像是凭空漂浮。此外,建筑的雕刻纹理在放大后显得重复且缺乏真实的结构合理性。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在光效氛围和整体色调上表现较为出色,丁达尔光效是最大亮点,史诗感的视觉基调也基本建立。然而在提示词的核心要求上存在多处明显缺失:多民族商人的互动叙事完全未能实现(所有人物为无法辨认种族的背影),金银珠宝商品缺失,地毯花纹精细度不足,金属器皿强反光效果薄弱。图像更像是一张氛围渲染图而非「史诗级原画」所要求的细节丰富的场景插画。综合权重计算,整体得分约为67分,属于「部分完成要求,有多处需要改进」的区间。 【GEMINI】这是一张在光影氛围和空间构图上表现优异,但在叙事细节和材质逻辑上存在明显短板的作品。模型成功捕捉了丝绸之路的宏大视觉符号(拱门、光影、香料),但在处理复杂的人文互动和精细材质对比时显得力不从心,尤其是未能完成「多民族商人交易」这一核心叙事要求,使其更像是一张空旷的场景概念图而非生动的集市原画。 【KIMI】该图像属于典型的「AI氛围图」——远看光影唬人,近看细节崩塌。模型在「制造视觉冲击力」与「执行精确要求」之间存在严重失衡:建筑框架与光效氛围尚可,但提示词中所有需要「精细刻画」的要素(人物种族、地毯纹样、材质对比)均告失败。最致命的是人物处理,四名不同种族商人的要求被简化为无面剪影,交易互动叙事完全落空。材质层面,三种核心材质(粉末、金属、织物)无一达到提示词标准,金属反光与地毯丝绒质感为明显短板。评分需严格拉开差距:该图像在「完成提示词要求」这一核心任务上表现不佳,不应因「氛围感」而获得宽容。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...