MiniMax image-01 在「浮世绘风格日文假名书法图像生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：MiniMax image-01
用例名称：浮世绘风格日文假名书法图像生成
测试类型：图像生成
评测维度：书法艺术表现

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

请生成一幅以葛饰北斋《神奈川冲浪里》为参考风格的浮世绘图像，画面中包含日文平假名文字。要求： - 整体画面呈现浮世绘木版画风格，色调以靛蓝、白色为主 - 画面留白处书写数行日文平假名，内容为关于大海的简短文字 - 假名字体具有手写感与流动感

任务要求

AI 模型需要满足以下要求：

画面整体呈现浮世绘木版画风格，色调以靛蓝、白色为主
画面中有可辨识的日文平假名文字
文字内容与「大海」主题相关
假名字体具有手写感，线条流畅
文字与画面背景在视觉上不产生明显冲突

评测结果

综合得分

该模型在此用例的得分为：55.7 分（满分 100 分），未通过

基础难度评测结果

得分：55.7 分
通过状态：未通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一幅模仿日本著名浮世绘《神奈川冲浪里》风格的画作。画面左侧是一道巨大的、呈深蓝色的卷曲巨浪，浪尖带着如爪状的白色浪花，占据了视觉重心。远景处可以看到一座白雪皑皑的山峰，形似富士山，位于波涛的缝隙之中。画面右侧是一片留白的背景，上面排列着多行灰色的文字。整体色调以深蓝、浅蓝、米白和土褐色为主，构图动感强烈。然而，画面中存在明显的 AI 生成缺陷：最显著的是右侧的文字，虽然看起来像汉字或日文，但实际上全是无法辨认、笔画混乱的虚假字符，没有任何实际含义。此外，原版画作中标志性的木船在图中完全缺失，取而代之的是一些结构模糊的褐色色块，与海浪的融合显得生硬且不合逻辑。浪花的边缘线条也略显杂乱，缺乏传统木版画的细腻感。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】本图在浮世绘画面风格的视觉还原上表现尚可，构图与色调基本达标。然而，提示词的核心测试目标——「日文平假名文字的生成质量」——出现了严重失败：图中所有文字均为不可辨识的伪字符，无一能被识别为真实的日文平假名，更无法判断内容相关性。这是AI图像生成中典型的文字幻觉问题，直接导致「假名文字质量」维度得分极低，拉低整体表现。综合加权后，本图整体质量处于中低水平，主要因文字生成能力的根本性缺陷所致。【GEMINI】这是一幅在视觉风格上还原度尚可，但在核心指令（生成日文平假名）上彻底失败的作品。模型在处理复杂字符生成时表现出明显的逻辑缺陷，导致画面虽然看起来像浮世绘，但文字部分显得极其突兀且违和，严重影响了作品的完整性。【KIMI】这是一幅「形似神非」的AI生成图像。模型在视觉风格的表层模仿上勉强及格，但在核心要求——日文平假名文字的生成——上遭遇灾难性失败。伪文字问题不仅是技术缺陷，更暴露了当前扩散模型在处理结构化文字系统时的根本局限：能模仿文字的「外观纹理」，却无法生成具有语言学意义的真实字符。对于要求「可辨识平假名」的提示词而言，这属于未完成任务。文字与画面的整合也缺乏浮世绘特有的诗画交融意识，仅作简单的图层叠加。建议评分向低分段倾斜，以严格区分能/不能生成真实文字的模型能力边界。

进阶难度评测结果

得分：58.8 分
通过状态：未通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一幅模仿日本著名浮世绘《神奈川冲浪里》风格的画作。画面左侧是一道巨大的、呈鹰爪状翻滚的深蓝色巨浪，浪尖带有白色的泡沫，占据了视觉重心。远景中心处可以看见一座小巧的雪山，模仿富士山的轮廓。背景为淡雅的米白色，右上角配有黑色的草书文字和一枚红色的方形印章。整幅图采用了经典的蓝、白、米黄三色调，构图具有极强的动感。然而，作为 AI 生成的图像，画面中存在明显的逻辑缺陷：首先，原作中至关重要的三艘木制快船在图中完全缺失，导致巨浪失去了比例参照物；其次，右上角的书法文字并非真实的汉字或假名，而是扭曲且无意义的线条堆砌，印章内的纹样也模糊不清；此外，浪花的边缘处理显得过于圆润且重复感强，缺乏传统木版画的锐利线条感，水流的透视关系在右侧衔接处也略显生硬。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】本图在浮世绘风格还原方面表现尚可，主体构图和色调基本达标。然而核心考察点「万叶假名书法」的呈现是彻底的失败——AI将书法内容生成为汉字楷书而非平假名连绵体，完全背离了提示词对书法风格、线条美感和水波形态的明确要求。这一核心缺陷导致整体评分大幅下拉，图像仅完成了「浮世绘背景」部分的任务，而「书法与画面融合」这一核心测试目标几乎未能实现。【GEMINI】这是一幅构图优秀但细节崩坏的作品。模型在处理复杂的艺术风格（浮世绘）时表现尚可，但在需要精确生成特定文字内容（万叶假名）时表现出明显的短板。书法部分不仅未能起到画龙点睛的作用，反而因其乱码般的形态严重拉低了整体艺术水准。【KIMI】这是一次典型的「风格形似、核心神似失败」的AI生成案例。模型捕捉到了《神奈川冲浪里》的视觉符号（巨浪、富士山、蓝白色调），但在最关键的「万叶假名书法」维度完全失控——不仅字体类型、数量、内容全部错误，更丧失了提示词反复强调的「水波流动感」这一美学核心。书法与绘画的融合是此提示词的最高难度要求，而模型显然缺乏对日本书体演变（万叶假名vs现代假名vs汉字）的准确知识，也未实现跨模态的「文字形态模仿自然形态」的抽象能力。建议分数：62/100（加权后约61分），主要扣分集中在书法维度的全面失败。

困难难度评测结果

得分：62.2 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一幅模仿日本著名浮世绘《神奈川冲浪里》风格的画作。画面主体是巨大的深蓝色巨浪，浪尖翻滚着如碎云般的白色浪花，占据了左侧大部分空间。远景中心是白雪皑皑的富士山，背景为简洁的米白色。画面右上方有黑色的书法落款和红色的印章。然而，作为 AI 生成的图像，画面存在明显的逻辑缺陷：原作中在波涛中穿行的三艘木质长船在图中完全缺失，取而代之的是一些与波浪纹理混淆、结构模糊的灰色块状物，看起来像是木头残骸或岩石，缺乏船只的形态。此外，右上角的文字并非真实的汉字或假名，而是由杂乱线条组成的伪文字，笔画结构扭曲且无法辨认。整体构图虽然捕捉到了原作的神韵，但在细节表现和元素完整性上存在典型的 AI 生成痕迹。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】本图在浮世绘风格还原的视觉框架上有一定基础，构图、色调大方向正确，但在最核心的「假名书法」维度上出现了根本性失败——文字内容为无法识读的伪字符，和歌内容、书法美感、动势呼应三项核心要求均未实现。这一致命缺陷严重拖累了整体评分。此外，原作标志性小船的缺失和「爪波」造型的不够精准也是明显扣分点。综合来看，图像完成了提示词约40%的要求，属于「部分完成」层级。【GEMINI】该图像在视觉构图上完成了基础的模仿，但在核心的「书法融合」任务上彻底失败。AI生成的伪文字不仅破坏了画面的艺术完整性，也未能满足提示词中关于书法动势与美感的具体要求。这是一次典型的『形似神不似』的生成，未能达到专业级艺术创作的标准。【KIMI】该图像在浮世绘风格的表层模仿上达到一定水准，但提示词最核心的「万叶假名书法与巨浪动势呼应」要求遭遇结构性失败。书法内容不可读、笔势与画面动势冲突、贴图质感明显，这三重缺陷使其无法被视为合格的「风格融合」作品。模型显然缺乏对「万叶假名」这一特定历史书写系统的知识，也无法理解「笔势呼应」这一高级视觉指令，仅生成了形似假名的符号堆砌。建议重新训练日文古文字数据集，并引入动势向量分析以改善书法与画面的动态关联。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

进阶难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

困难难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

相关链接

反馈评测问题