MiniMax image-01 在「浮世绘风格日文假名书法图像生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:MiniMax image-01
- 用例名称:浮世绘风格日文假名书法图像生成
- 测试类型:图像生成
- 评测维度:书法艺术表现
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
请生成一幅以葛饰北斋《神奈川冲浪里》为参考风格的浮世绘图像,画面中包含日文平假名文字。 要求: - 整体画面呈现浮世绘木版画风格,色调以靛蓝、白色为主 - 画面留白处书写数行日文平假名,内容为关于大海的简短文字 - 假名字体具有手写感与流动感
任务要求
AI 模型需要满足以下要求:
- 画面整体呈现浮世绘木版画风格,色调以靛蓝、白色为主
- 画面中有可辨识的日文平假名文字
- 文字内容与「大海」主题相关
- 假名字体具有手写感,线条流畅
- 文字与画面背景在视觉上不产生明显冲突
评测结果
综合得分
该模型在此用例的得分为:55.7 分(满分 100 分),未通过
基础难度评测结果
- 得分:55.7 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一幅模仿日本著名浮世绘《神奈川冲浪里》风格的画作。画面左侧是一道巨大的、呈深蓝色的卷曲巨浪,浪尖带着如爪状的白色浪花,占据了视觉重心。远景处可以看到一座白雪皑皑的山峰,形似富士山,位于波涛的缝隙之中。画面右侧是一片留白的背景,上面排列着多行灰色的文字。整体色调以深蓝、浅蓝、米白和土褐色为主,构图动感强烈。 然而,画面中存在明显的 AI 生成缺陷:最显著的是右侧的文字,虽然看起来像汉字或日文,但实际上全是无法辨认、笔画混乱的虚假字符,没有任何实际含义。此外,原版画作中标志性的木船在图中完全缺失,取而代之的是一些结构模糊的褐色色块,与海浪的融合显得生硬且不合逻辑。浪花的边缘线条也略显杂乱,缺乏传统木版画的细腻感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】本图在浮世绘画面风格的视觉还原上表现尚可,构图与色调基本达标。然而,提示词的核心测试目标——「日文平假名文字的生成质量」——出现了严重失败:图中所有文字均为不可辨识的伪字符,无一能被识别为真实的日文平假名,更无法判断内容相关性。这是AI图像生成中典型的文字幻觉问题,直接导致「假名文字质量」维度得分极低,拉低整体表现。综合加权后,本图整体质量处于中低水平,主要因文字生成能力的根本性缺陷所致。 【GEMINI】这是一幅在视觉风格上还原度尚可,但在核心指令(生成日文平假名)上彻底失败的作品。模型在处理复杂字符生成时表现出明显的逻辑缺陷,导致画面虽然看起来像浮世绘,但文字部分显得极其突兀且违和,严重影响了作品的完整性。 【KIMI】这是一幅「形似神非」的AI生成图像。模型在视觉风格的表层模仿上勉强及格,但在核心要求——日文平假名文字的生成——上遭遇灾难性失败。伪文字问题不仅是技术缺陷,更暴露了当前扩散模型在处理结构化文字系统时的根本局限:能模仿文字的「外观纹理」,却无法生成具有语言学意义的真实字符。对于要求「可辨识平假名」的提示词而言,这属于未完成任务。文字与画面的整合也缺乏浮世绘特有的诗画交融意识,仅作简单的图层叠加。建议评分向低分段倾斜,以严格区分能/不能生成真实文字的模型能力边界。
进阶难度评测结果
- 得分:58.8 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一幅模仿日本著名浮世绘《神奈川冲浪里》风格的画作。画面左侧是一道巨大的、呈鹰爪状翻滚的深蓝色巨浪,浪尖带有白色的泡沫,占据了视觉重心。远景中心处可以看见一座小巧的雪山,模仿富士山的轮廓。背景为淡雅的米白色,右上角配有黑色的草书文字和一枚红色的方形印章。整幅图采用了经典的蓝、白、米黄三色调,构图具有极强的动感。 然而,作为 AI 生成的图像,画面中存在明显的逻辑缺陷:首先,原作中至关重要的三艘木制快船在图中完全缺失,导致巨浪失去了比例参照物;其次,右上角的书法文字并非真实的汉字或假名,而是扭曲且无意义的线条堆砌,印章内的纹样也模糊不清;此外,浪花的边缘处理显得过于圆润且重复感强,缺乏传统木版画的锐利线条感,水流的透视关系在右侧衔接处也略显生硬。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】本图在浮世绘风格还原方面表现尚可,主体构图和色调基本达标。然而核心考察点「万叶假名书法」的呈现是彻底的失败——AI将书法内容生成为汉字楷书而非平假名连绵体,完全背离了提示词对书法风格、线条美感和水波形态的明确要求。这一核心缺陷导致整体评分大幅下拉,图像仅完成了「浮世绘背景」部分的任务,而「书法与画面融合」这一核心测试目标几乎未能实现。 【GEMINI】这是一幅构图优秀但细节崩坏的作品。模型在处理复杂的艺术风格(浮世绘)时表现尚可,但在需要精确生成特定文字内容(万叶假名)时表现出明显的短板。书法部分不仅未能起到画龙点睛的作用,反而因其乱码般的形态严重拉低了整体艺术水准。 【KIMI】这是一次典型的「风格形似、核心神似失败」的AI生成案例。模型捕捉到了《神奈川冲浪里》的视觉符号(巨浪、富士山、蓝白色调),但在最关键的「万叶假名书法」维度完全失控——不仅字体类型、数量、内容全部错误,更丧失了提示词反复强调的「水波流动感」这一美学核心。书法与绘画的融合是此提示词的最高难度要求,而模型显然缺乏对日本书体演变(万叶假名vs现代假名vs汉字)的准确知识,也未实现跨模态的「文字形态模仿自然形态」的抽象能力。建议分数:62/100(加权后约61分),主要扣分集中在书法维度的全面失败。
困难难度评测结果
- 得分:62.2 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一幅模仿日本著名浮世绘《神奈川冲浪里》风格的画作。画面主体是巨大的深蓝色巨浪,浪尖翻滚着如碎云般的白色浪花,占据了左侧大部分空间。远景中心是白雪皑皑的富士山,背景为简洁的米白色。画面右上方有黑色的书法落款和红色的印章。然而,作为 AI 生成的图像,画面存在明显的逻辑缺陷:原作中在波涛中穿行的三艘木质长船在图中完全缺失,取而代之的是一些与波浪纹理混淆、结构模糊的灰色块状物,看起来像是木头残骸或岩石,缺乏船只的形态。此外,右上角的文字并非真实的汉字或假名,而是由杂乱线条组成的伪文字,笔画结构扭曲且无法辨认。整体构图虽然捕捉到了原作的神韵,但在细节表现和元素完整性上存在典型的 AI 生成痕迹。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】本图在浮世绘风格还原的视觉框架上有一定基础,构图、色调大方向正确,但在最核心的「假名书法」维度上出现了根本性失败——文字内容为无法识读的伪字符,和歌内容、书法美感、动势呼应三项核心要求均未实现。这一致命缺陷严重拖累了整体评分。此外,原作标志性小船的缺失和「爪波」造型的不够精准也是明显扣分点。综合来看,图像完成了提示词约40%的要求,属于「部分完成」层级。 【GEMINI】该图像在视觉构图上完成了基础的模仿,但在核心的「书法融合」任务上彻底失败。AI生成的伪文字不仅破坏了画面的艺术完整性,也未能满足提示词中关于书法动势与美感的具体要求。这是一次典型的『形似神不似』的生成,未能达到专业级艺术创作的标准。 【KIMI】该图像在浮世绘风格的表层模仿上达到一定水准,但提示词最核心的「万叶假名书法与巨浪动势呼应」要求遭遇结构性失败。书法内容不可读、笔势与画面动势冲突、贴图质感明显,这三重缺陷使其无法被视为合格的「风格融合」作品。模型显然缺乏对「万叶假名」这一特定历史书写系统的知识,也无法理解「笔势呼应」这一高级视觉指令,仅生成了形似假名的符号堆砌。建议重新训练日文古文字数据集,并引入动势向量分析以改善书法与画面的动态关联。
相关链接
您可以通过以下链接查看更多相关内容: