MiniMax image-01 在「静夜思诗意与行书书法融合生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:MiniMax image-01
  • 用例名称:静夜思诗意与行书书法融合生成
  • 测试类型:图像生成
  • 评测维度:书法艺术表现

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一幅中国古典风格画面: - 画面中有一位身着唐代长袍的诗人立于窗前 - 窗外可见明亮的圆月 - 画面右侧以行书纵向书写李白的《静夜思》全诗(床前明月光,疑是地上霜。举头望明月,低头思故乡。) - 整体风格为中国水墨画风

任务要求

AI 模型需要满足以下要求:

  1. 画面中有身着唐代长袍的诗人形象
  2. 窗外有明亮的圆月
  3. 画面右侧有纵向排列的行书文字
  4. 书法内容为《静夜思》全诗,文字可辨认
  5. 整体呈现中国水墨画风格

评测结果

综合得分

该模型在此用例的得分为:51.5 分(满分 100 分),未通过

基础难度评测结果

  • 得分:51.5 分
  • 通过状态:未通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展现了一幅具有中国传统工笔画风格的艺术作品。画面左侧,一位挽着高发髻、身着浅灰色与橘红色交叠古装的女子正倚窗而立,她神情恬静,目光略微向下凝视。窗外是深蓝色的夜空,一轮明圆的皓月高悬,云层在月光下若隐若现。画面右侧留有大面积的米白色空白,并配有两列竖排的黑色草书文字。整体色调古朴典雅,构图呈现出一种静谧的意境。在 AI 生成的细节方面,存在明显的逻辑缺陷:女子交叠在腹部的手部线条杂乱,手指数量和结构模糊不清,无法辨认出正常的手形;右侧的草书文字虽然笔触流畅,但字迹扭曲且并非真实的汉字,属于典型的 AI 伪造文字;此外,窗框的木质纹理和交接处也显得不够严谨。

图中展现了一幅具有中国传统工笔画风格的艺术作品。画面左侧,一位挽着高发髻、身着浅灰色与橘红色交叠古装的女子正倚窗而立,她神情恬静,目光略微向下凝视。窗外是深蓝色的夜空,一轮明圆的皓月高悬,云层在月光下若隐若现。画面右侧留有大面积的米白色空白,并配有两列竖排的黑色草书文字。整体色调古朴典雅,构图呈现出一种静谧的意境。在 AI 生成的细节方面,存在明显的逻辑缺陷:女子交叠在腹部的手部线条杂乱,手指数量和结构模糊不清,无法辨认出正常的手形;右侧的草书文字虽然笔触流畅,但字迹扭曲且并非真实的汉字,属于典型的 AI 伪造文字;此外,窗框的木质纹理和交接处也显得不够严谨。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在场景构成上有基本框架(窗前人物+圆月+右侧文字),但在三个核心维度上均存在明显问题。最致命的失败是书法文字内容——《静夜思》全诗完全无法辨认,这是提示词最核心的要求之一。其次,整体风格呈现为日式浮世绘而非中国水墨画风,人物也是仕女而非男性诗人。综合来看,该图像仅完成了提示词的表面框架,未能实现中国古典诗词意境的准确视觉化表达。 【GEMINI】该图像在构图和基础氛围营造上表现尚可,但在核心任务——文字生成和艺术风格还原上表现欠佳。尤其是书法部分完全失效,严重影响了作品的文化内涵表达。画风更倾向于现代商业插画,而非传统水墨,未能达到预期的艺术效果。 【KIMI】此图在核心要求上双重失败:人物性别与身份完全偏离「诗人」设定,书法内容不可辨认导致《静夜思》主题落空。风格层面混淆中国水墨与日式浮世绘,窗格、配色、构图均偏向后者。仅月光氛围与衣褶线条略有可取,但不足以弥补根本缺陷。作为古典诗词视觉化测试,模型在文字生成与历史常识(诗人性别)上暴露严重短板。

进阶难度评测结果

  • 得分:58.4 分
  • 通过状态:未通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展现了一幅具有中国风意境的雪夜景观。画面左侧是一座古朴的木质凉亭,亭檐挂着薄霜。一位身着深蓝色古装长袍、头束发髻的年轻男子站在亭边台阶上,他怀抱一把长剑,正侧头望向远方,神情略显忧郁。画面中央偏上位置有一轮硕大而圆润的明月,散发出柔和的白光,映照着下方翻腾的云海或积雪。整体色调以冷青色和白色为主,营造出一种清冷、孤寂的氛围。右侧纵向排列着几行黑色书法字体,并配有红色印章。在 AI 生成细节方面,存在明显的逻辑缺陷:男子的右手手指显得模糊且结构混乱,与剑柄的握持关系不自然;右侧的书法文字虽然形似汉字,但实际上是无法辨认的乱码字符;此外,凉亭的木柱与地面衔接处略显生硬,背景的云雾纹理在精细度上分布不均。

图中展现了一幅具有中国风意境的雪夜景观。画面左侧是一座古朴的木质凉亭,亭檐挂着薄霜。一位身着深蓝色古装长袍、头束发髻的年轻男子站在亭边台阶上,他怀抱一把长剑,正侧头望向远方,神情略显忧郁。画面中央偏上位置有一轮硕大而圆润的明月,散发出柔和的白光,映照着下方翻腾的云海或积雪。整体色调以冷青色和白色为主,营造出一种清冷、孤寂的氛围。右侧纵向排列着几行黑色书法字体,并配有红色印章。在 AI 生成细节方面,存在明显的逻辑缺陷:男子的右手手指显得模糊且结构混乱,与剑柄的握持关系不自然;右侧的书法文字虽然形似汉字,但实际上是无法辨认的乱码字符;此外,凉亭的木柱与地面衔接处略显生硬,背景的云雾纹理在精细度上分布不均。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在场景氛围营造上有一定成效,月色、霜地、清冷色调基本符合《静夜思》的意境要求。然而,占权重40%的书法维度出现了根本性失败——右侧所谓「行书《静夜思》」实为AI生成的无意义伪汉字,完全不可辨读,这是对提示词最核心要求的严重违背。一幅以「诗词意境与书法融合」为主题的作品,若书法内容本身是乱码,则整体创作意图已经崩塌。此外,整体风格更接近影视宣传海报而非传统水墨文人画,笔墨韵味缺失。综合来看,这是一张场景部分尚可但核心书法要求严重失败的作品。 【GEMINI】该图像在视觉氛围营造上表现优异,成功捕捉了清冷孤寂的古典意境。然而,在涉及文字处理这一核心任务上,模型表现出了严重的逻辑缺陷,生成的乱码文字完全无法满足用户需求,导致作品在文化内涵层面大打折扣。 【KIMI】此图在氛围色调上有初步把控,但核心要求——书写《静夜思》全诗——完全失败,伪书法问题属于根本性内容错误,而非风格瑕疵。人物情感表达与霜降质感亦有明显不足。作为「中国古典诗词意境视觉化」的测试,模型在最关键的文字生成环节暴露出严重缺陷,整体未能达成提示词目标。

困难难度评测结果

  • 得分:60.5 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中呈现出一幅充满古风意境的月夜图。场景设在室内,一名身着深色宽大古装长袍、头挽发髻的男子正侧身伫立在巨大的落地窗前,抬头仰望夜空。窗外是一轮明亮的圆月,悬挂在带有淡淡云层的深蓝色夜空中,窗下隐约可见被月光照亮的白色树丛或霜雪。画面整体色调偏冷,以青蓝色和白色为主,营造出一种宁静、思索的氛围。构图上,人物位于左侧,右侧留有大量空白,并配有黑色的毛笔书法字体。 在 AI 生成的细节方面,存在一些明显的逻辑与视觉缺陷:首先,画面右侧的书法文字并非真实的汉字,而是由杂乱线条组成的拟态字符,无法辨认。其次,男子的手部结构模糊不清,手指交叠处显得生硬且缺乏细节。此外,室内地面的质感与窗外的雪景界限模糊,光影投射在地面上的纹理显得有些杂乱,不符合自然的透视规律。人物的侧脸轮廓也略显僵硬,缺乏真实皮肤的质感。

画面中呈现出一幅充满古风意境的月夜图。场景设在室内,一名身着深色宽大古装长袍、头挽发髻的男子正侧身伫立在巨大的落地窗前,抬头仰望夜空。窗外是一轮明亮的圆月,悬挂在带有淡淡云层的深蓝色夜空中,窗下隐约可见被月光照亮的白色树丛或霜雪。画面整体色调偏冷,以青蓝色和白色为主,营造出一种宁静、思索的氛围。构图上,人物位于左侧,右侧留有大量空白,并配有黑色的毛笔书法字体。

在 AI 生成的细节方面,存在一些明显的逻辑与视觉缺陷:首先,画面右侧的书法文字并非真实的汉字,而是由杂乱线条组成的拟态字符,无法辨认。其次,男子的手部结构模糊不清,手指交叠处显得生硬且缺乏细节。此外,室内地面的质感与窗外的雪景界限模糊,光影投射在地面上的纹理显得有些杂乱,不符合自然的透视规律。人物的侧脸轮廓也略显僵硬,缺乏真实皮肤的质感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在氛围营造和基本场景构建上有一定水准,月夜清冷意境、人物仰望姿态、霜白地面等核心视觉元素基本到位。然而,权重最高(40%)的书法维度出现了灾难性失败——右侧文字完全不是《静夜思》诗文,内容错误且不可辨,墨色变化、行书笔势等所有书法相关要求均未实现。这一致命缺陷严重拉低了整体得分。此外,整体风格偏向现代摄影合成而非高古文人画,与提示词的风格定位存在明显偏差。综合评估,该图像仅部分完成了提示词要求,核心书法任务严重失败。 【GEMINI】图像在视觉氛围营造上表现尚可,成功捕捉了《静夜思》的清冷基调。然而,在涉及「书法深度要求」的硬性指标上完全失败,文字不仅内容错误,且缺乏书法艺术性,导致作品无法达到文人画的审美高度。 【KIMI】该图像在氛围色调和基础构图上有一定水准,但书法维度的彻底失败使其无法达到提示词的核心要求。作为《静夜思》诗意视觉化作品,书法不仅是装饰元素,更是「诗境与书法深度融合」的关键载体——而此处书法呈现为不可读的AI伪文字,导致「墨色随诗意变化」「行书笔势」等要求完全落空。人物姿态和地面霜白质感也存在可辨识的偏差。整体而言,模型对中国古典诗词的视觉转译能力有限,尤其在文字生成方面暴露明显短板,属于「氛围似而细节败」的典型AI生成案例。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...