MiniMax image-01 在「热带海岛日落镂空旺字卡片生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:MiniMax image-01
  • 用例名称:热带海岛日落镂空旺字卡片生成
  • 测试类型:图像生成
  • 评测维度:VG-FramedPerspective

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张写实摄影风格的图像:第一人称视角,一只手拿着一张半透明磨砂亚克力卡片,卡片中心镂空刻有汉字「旺」。透过镂空部分可以看到远处的椰林、沙滩和紫色日落海景。整体色彩高饱和度。

任务要求

AI 模型需要满足以下要求:

  1. 画面呈现第一人称视角,有手持卡片的构图
  2. 卡片材质体现半透明磨砂亚克力质感
  3. 卡片中心有清晰可辨的镂空汉字「旺」
  4. 透过镂空部分可见椰林、沙滩与日落海景
  5. 整体色彩饱和度高,画面清晰

评测结果

综合得分

该模型在此用例的得分为:67.7 分(满分 100 分),已通过

基础难度评测结果

  • 得分:67.7 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一幅在热带海滩日落时分的特写画面。一只左手捏着一张半透明的长方形磨砂卡片,卡片中心镂空刻有一个复杂的圆形符号,夕阳的余晖穿过镂空处,散发出温暖的橙红色光芒。背景是宁静的海滩,天空呈现出迷人的紫色与粉色渐变,远处有模糊的椰子树剪影。画面构图以手中的卡片为视觉中心,利用逆光营造出唯美、梦幻的氛围。在 AI 生成的细节方面,存在明显的逻辑缺陷:持卡的手部结构异常,大拇指的生长位置与角度不符合人体解剖学,显得扭曲且僵硬;食指指尖与卡片的接触点模糊,仿佛融合在了一起;此外,卡片中心的镂空符号形状杂乱,并非真实的文字或具有明确意义的标志,边缘也显得不够平整。

图中展示了一幅在热带海滩日落时分的特写画面。一只左手捏着一张半透明的长方形磨砂卡片,卡片中心镂空刻有一个复杂的圆形符号,夕阳的余晖穿过镂空处,散发出温暖的橙红色光芒。背景是宁静的海滩,天空呈现出迷人的紫色与粉色渐变,远处有模糊的椰子树剪影。画面构图以手中的卡片为视觉中心,利用逆光营造出唯美、梦幻的氛围。在 AI 生成的细节方面,存在明显的逻辑缺陷:持卡的手部结构异常,大拇指的生长位置与角度不符合人体解剖学,显得扭曲且僵硬;食指指尖与卡片的接触点模糊,仿佛融合在了一起;此外,卡片中心的镂空符号形状杂乱,并非真实的文字或具有明确意义的标志,边缘也显得不够平整。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在场景氛围和构图上完成度尚可,手持卡片的第一人称视角、高饱和度的紫橙日落背景都基本符合提示词要求。然而,图像存在一个致命缺陷:镂空汉字「旺」完全生成失败,呈现为无法辨认的混乱符号,这是对提示词核心要求的直接违背。此外,磨砂亚克力的材质细节不够精准,镂空边缘处理粗糙。综合来看,场景色彩表现是最强项,材质表现中等偏下,镂空透视效果因汉字错误而严重失分。 【GEMINI】图像在氛围营造和材质基础表现上达到了较好的水准,但作为核心任务的「汉字镂空」完全失败。模型未能处理好文字的几何结构,导致镂空部分看起来像是一块破碎的污渍,严重影响了作品的专业度。 【KIMI】该图像在核心要求上存在致命失败:镂空汉字完全不是「旺」字,这是一个结构混乱的抽象符号,直接导致任务失败。材质表现方面,亚克力的半透明磨砂质感被简化为平面滤镜效果,缺乏真实材料的光学深度。场景色彩虽达到高饱和度要求,但椰树和沙滩的处理暴露合成痕迹。综合而言,模型在文字生成这一关键能力上表现极差,且材质理解停留在表面模拟,未能深入物理光学特性。

进阶难度评测结果

  • 得分:66.3 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只手正捏着一张半透明的粉紫色磨砂质感卡片。背景是模糊的紫色调,点缀着些许梦幻的白色光斑。卡片中央有一个圆形镂空窗口,透出一幅美丽的夕阳海滩风景图:紫色晚霞映衬着海浪、沙滩和几棵挺拔的椰子树。圆窗中心叠加了一个白色的汉字“午”,卡片右下方印有数字“2026”和一个马的剪影,左下方则有一些类似文字的符号。 画面中存在明显的 AI 生成缺陷:首先,左侧持卡的手部结构异常,大拇指的关节连接显得生硬且不符合解剖学,手指边缘与卡片的接触处有些模糊。其次,卡片左下角的文字并非真实语言,而是杂乱无章、无法辨认的乱码符号。此外,卡片右下角的马剪影线条略显僵硬,与整体精致的风格略有出入。整张图片色彩柔和,构图平衡,营造出一种未来感与怀旧感交织的氛围。

图中展示了一只手正捏着一张半透明的粉紫色磨砂质感卡片。背景是模糊的紫色调,点缀着些许梦幻的白色光斑。卡片中央有一个圆形镂空窗口,透出一幅美丽的夕阳海滩风景图:紫色晚霞映衬着海浪、沙滩和几棵挺拔的椰子树。圆窗中心叠加了一个白色的汉字“午”,卡片右下方印有数字“2026”和一个马的剪影,左下方则有一些类似文字的符号。

画面中存在明显的 AI 生成缺陷:首先,左侧持卡的手部结构异常,大拇指的关节连接显得生硬且不符合解剖学,手指边缘与卡片的接触处有些模糊。其次,卡片左下角的文字并非真实语言,而是杂乱无章、无法辨认的乱码符号。此外,卡片右下角的马剪影线条略显僵硬,与整体精致的风格略有出入。整张图片色彩柔和,构图平衡,营造出一种未来感与怀旧感交织的氛围。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在构图框架和氛围营造上有一定完成度,手持半透明磨砂卡片的第一人称视角基本实现,背景光斑和日落色调也较为到位。但存在两个核心失误:其一,镂空汉字「旺」被错误生成为「千/干」类字形,这是提示词最核心的要求之一;其二,卡片底部出现大量AI幻觉乱码文字,严重破坏了卡片的整洁感和专业性。此外,镂空透视效果并非真正意义上的「透过字形看到海景」,而是圆形图案叠加字符的简化处理。综合来看,图像在关键细节上存在明显偏差,属于部分完成提示词要求的水平。 【GEMINI】该图像在视觉氛围和材质表现上表现优异,但在语义理解和文字生成方面存在严重缺陷。尤其是核心镂空汉字与提示词要求的「旺」字完全不符,且卡片底部的乱码严重影响了成品的专业度。 【KIMI】该图像在核心语义理解上出现重大失败:「旺」字错为「丰」字,底部文字完全崩溃为乱码,这两项直接违背提示词明确要求。材质表现与氛围营造虽有基础,但无法弥补关键内容的错误。作为测试模型对「镂空汉字」与「印刷文字」生成能力的任务,此图表现不合格,属于「部分完成要求,有多处需要改进」的层级,但核心错误过于严重,整体倾向40-59分档。

困难难度评测结果

  • 得分:63.9 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中,一只左手在夕阳下的海滩背景中,捏着一张透明的长方形卡片。背景是温暖的粉紫色调,落日余晖洒在海面上,波光粼粼,远处有模糊的棕榈树影。透明卡片上雕刻着精美的图案:一匹正在奔跑的骏马,左侧有一个复杂的类似汉字的艺术符号,下方左右两端均印有数字“2026”。卡片透过了背景的光线,呈现出一种晶莹剔透的质感,整体构图充满了梦幻与希望的氛围。 然而,画面中存在明显的 AI 生成缺陷。首先,手部结构异常,大拇指与食指捏住卡片的位置显得生硬,且手指的关节连接处不够自然,阴影处理略显混乱。其次,卡片上的文字存在逻辑错误:左侧的符号并非真实的汉字,而是由无意义线条组成的伪文字;此外,2026年在中国生肖中应为马年,虽然图案契合,但卡片底部边缘有一行极小的、扭曲模糊且无法辨认的虚假字母。最后,卡片内部折射出的夕阳位置与背景中的实际太阳位置略有偏移,存在透视上的不一致。

画面中,一只左手在夕阳下的海滩背景中,捏着一张透明的长方形卡片。背景是温暖的粉紫色调,落日余晖洒在海面上,波光粼粼,远处有模糊的棕榈树影。透明卡片上雕刻着精美的图案:一匹正在奔跑的骏马,左侧有一个复杂的类似汉字的艺术符号,下方左右两端均印有数字“2026”。卡片透过了背景的光线,呈现出一种晶莹剔透的质感,整体构图充满了梦幻与希望的氛围。

然而,画面中存在明显的 AI 生成缺陷。首先,手部结构异常,大拇指与食指捏住卡片的位置显得生硬,且手指的关节连接处不够自然,阴影处理略显混乱。其次,卡片上的文字存在逻辑错误:左侧的符号并非真实的汉字,而是由无意义线条组成的伪文字;此外,2026年在中国生肖中应为马年,虽然图案契合,但卡片底部边缘有一行极小的、扭曲模糊且无法辨认的虚假字母。最后,卡片内部折射出的夕阳位置与背景中的实际太阳位置略有偏移,存在透视上的不一致。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在整体摄影氛围和色彩表现上表现出色,但在最核心的技术要求——镂空「旺」字透视效果上完全失败。模型将提示词中「镂空透明区域透视背景」的概念错误理解为「在卡片上印刷场景图案」,这是根本性的概念偏差。磨砂亚克力的材质细节也不够精准,颗粒感缺失。图文准确性方面存在字符模糊和排版偏差。综合来看,这张图像更像是一张「印有海边场景的亚克力卡片」而非「可透视海边场景的镂空磨砂亚克力卡片」,核心创意概念的实现度严重不足。 【GEMINI】这是一张『背景满分,主体不及格』的图像。背景的日落氛围和摄影质感非常出色,但模型在处理复杂的『材质+镂空+文字』组合任务时彻底失败。最核心的镂空要求完全被忽略,且汉字生成出现了严重的幻觉(乱码),卡片上的文字排版逻辑混乱。作为一张设计素材,其主体卡片部分完全无法使用,需要大幅重绘。 【KIMI】该图像在核心设计元素——镂空「旺」字——上出现根本性偏差,导致提示词的核心创意意图(框景构图)完全失效。材质表现停留在「半透明物体」层面,未触及「磨砂亚克力」的细腻质感。透视连续性的断裂使得卡片与背景的视觉对齐成为伪命题。整体属于「氛围尚可、执行失败」的典型案例,模型对复杂材质与精确图文控制的综合能力不足。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...