MiniMax image-01 在「柴油朋克移动要塞概念图生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:MiniMax image-01
- 用例名称:柴油朋克移动要塞概念图生成
- 测试类型:图像生成
- 评测维度:游戏概念图
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一座在荒原上行驶的巨型柴油朋克移动要塞。 要求: - 要塞由厚重钢板铆接而成 - 拥有巨大的履带 - 烟囱冒着黑烟 - 整体呈现柴油朋克工业风格
任务要求
AI 模型需要满足以下要求:
- 画面中有一座巨型移动要塞主体
- 要塞具有明显的厚重钢板铆接外观
- 可见巨大履带结构
- 烟囱有黑烟排放效果
- 整体风格符合柴油朋克工业美学
评测结果
综合得分
该模型在此用例的得分为:81.2 分(满分 100 分),已通过
基础难度评测结果
- 得分:81.2 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一辆巨大的、具有蒸汽朋克风格的墨绿色重型履带式战车,正行驶在广袤的沙漠之中。战车的主体呈巨大的长方形箱体状,表面布满了粗糙的铆钉和锈迹,顶部伸出多根类似烟囱的管道,其中一根正向右侧喷出浓厚的黑烟。车身四周装配了多门大小不一的机枪塔和炮管。底部的履带结构异常复杂且庞大,在沙地上扬起阵阵尘土。 画面中存在明显的 AI 生成缺陷:首先是物理逻辑异常,战车右侧悬挂着一个巨大的齿轮状圆轮,却没有任何支撑结构,仿佛悬浮在空中;其次,底部的履带和轮轴结构极其混乱,左侧和右侧的履带形状、数量完全不对称,且部分轮子相互重叠或凭空消失;车顶的炮管指向杂乱,缺乏合理的机械连接。整体构图虽然宏伟,但机械细节经不起推敲。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张图像高质量地完成了提示词的全部核心要求,移动要塞的钢铁质感、履带规模、黑烟排放与柴油朋克工业风格均得到出色呈现。渲染精度高,细节丰富,场景氛围强烈。存在的轻微问题(顶部风格混淆、右侧构件突兀)不影响整体高水准表现,是一张接近优秀的AI生成图像。 【GEMINI】这是一张在视觉风格上非常成功的柴油朋克作品,但在硬核机械逻辑上经不起推敲。模型很好地理解了「铆接钢板」和「黑烟」的视觉符号,但在处理复杂的「履带机械结构」时出现了典型的 AI 逻辑坍塌,导致要塞底座看起来像是一堆无法运转的废铁。作为专业评审,这种结构性错误严重削弱了画面的说服力。 【KIMI】这是一张『看起来正确』但经不起审视的AI生成图。模型成功拼凑了柴油朋克的视觉符号——铆钉、黑烟、履带——却未理解其背后的工业逻辑。最致命的是履带系统的双重失败:既未满足『巨大』的尺度承诺,又创造了工程上不可能的驱动结构。作为移动要塞,它无法回答『如何移动』这一基本问题。
进阶难度评测结果
- 得分:79.9 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一辆体型极其巨大的、具有蒸汽朋克风格的重型坦克,正行驶在荒凉的红色沙漠中。这辆坦克呈现出灰色的金属质感,表面布满了密集的铆钉,顶部有三根烟囱正向天空喷出浓厚的黑烟。坦克前方伸出多根粗壮的炮管,两侧履带巨大且带有锈迹。在坦克左前方,有一辆极小的灰色越野车作为参照,突显出坦克的宏伟体量。背景是淡蓝色的天空和远处的岩石山脉,整体色调偏向土黄色和铁灰色。 画面中存在明显的 AI 生成缺陷:首先,坦克的结构逻辑混乱,炮管的排列和连接处缺乏机械合理性,左侧炮管似乎悬浮在车体旁;其次,履带内部的轮轴结构极其复杂且杂乱,呈现出无意义的机械堆砌感;最后,坦克底部与地面的接触处光影衔接不自然,且左侧履带下方的阴影中出现了一个模糊、比例失调的红色不明人形物体。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在钢铁质感、材质细节和整体风格氛围上表现优秀,荒原背景与参照物设置也较为到位。但核心缺陷在于「密集炮塔群」几乎缺失,仅有一两根炮管远不足以满足提示词要求;同时地面车辙痕迹的缺失削弱了履带碾压的重量感。这两处关键要求的未完成导致主体还原度无法达到高分区间。综合而言,图像质量较高但与提示词的完整还原仍有明显差距。 【GEMINI】这是一张视觉冲击力极强但经不起细节推敲的作品。模型在宏观比例和材质纹理上表现卓越,但在复杂的机械结构逻辑(尤其是履带和武器系统)上出现了明显的 AI 生成通病。烟雾的处理略显生硬,未能完全模拟出重工业排烟的体积扩散感。 【KIMI】该图像在概念层面抓住了柴油朋克移动要塞的视觉锚点,但在核心工业元素的执行上存在结构性失误——履带系统的简化与炮塔群的缺失直接违背提示词要求,烟雾与材质的体积感渲染暴露AI生成器的典型短板。作为「概念图」尚可接受,作为「严格按提示词生成」的技术测试则未达标。
困难难度评测结果
- 得分:70.2 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中呈现了一个充满废土工业风格的壮观场景。主体是一座巨大的、如堡垒般的移动工厂,它坐落在巨大的履带之上,正行驶在荒芜的平原上。工厂顶部矗立着多根烟囱,正向昏黄的天空排放着浓厚的黑烟。背景是夕阳西下的景象,金红色的余晖穿透云层,营造出一种压抑而宏大的氛围。地面上散布着许多渺小的人影,有的在行走,有的席地而坐,与庞大的机械形成鲜明对比。 作为一张 AI 生成的图片,画面存在一些明显的逻辑缺陷:首先,移动工厂顶部的烟囱排列显得杂乱且缺乏合理的结构支撑,部分烟雾的流动方向与风向逻辑不完全一致;其次,工厂底部的履带结构呈现出不自然的三角形支撑,且履带纹理在细节处显得模糊且重复;画面左侧的人影轮廓较为生硬,部分人物的肢体细节缺失,且工厂侧面延伸出的炮管或杆状物位置随机,缺乏实际的功能逻辑。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在整体氛围和光线方向上有基本的完成度,黄昏逆光构图和末日荒原基调是其主要优势。然而,针对提示词中最核心的「柴油朋克移动要塞」设计要求,图像存在多处关键缺失:炮塔群几乎不存在、烟囱数量和颜色不符、地面破坏效果为零、丁达尔效应缺失。要塞更接近一座移动工厂的形态,而非武装到牙齿的战争堡垒。提示词中约60%的具体设计要求未能有效实现,整体完成度偏低。 【GEMINI】这是一张氛围感极佳但细节执行力严重不足的作品。模型在处理宏观光影和色彩氛围上表现出色,但在工业结构的逻辑性(如炮塔、铆钉)以及环境交互叙事(如车辙、地面沉降)上出现了明显的偷懒行为。特别是地面细节的缺失,直接削弱了提示词中强调的「工业霸权压迫感」。 【KIMI】该图像是一幅典型的「氛围优先于结构」的AI概念艺术输出,擅长用光影与烟尘掩盖机械结构的复杂性。对于提示词中明确要求的履带细节、地面车辙、炮塔指向等硬核工业元素,采取了视觉欺骗式的回避策略——以「艺术化剪影」替代「可验证的结构还原」。若作为氛围参考图尚可接受,但作为柴油朋克移动要塞的技术概念图,其核心机械结构的缺失构成严重失信。评分需拉开与真正完成结构还原的作品的差距。
相关链接
您可以通过以下链接查看更多相关内容: