MiniMax image-01 在「京都枫叶季瘦金体俳句图像生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:MiniMax image-01
- 用例名称:京都枫叶季瘦金体俳句图像生成
- 测试类型:图像生成
- 评测维度:书法艺术表现
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一幅以京都秋日枫叶为背景的装饰性画面,画面一角书写松尾芭蕉的俳句「古池や」,文字采用瘦金体风格,笔画瘦硬挺拔。
任务要求
AI 模型需要满足以下要求:
- 画面中有红色或橙红色枫叶背景,体现京都秋日氛围
- 画面一角有日文俳句「古池や」的文字呈现
- 文字笔画整体纤细、挺拔,具有瘦金体的基本特征
- 整体画面清晰,构图完整
评测结果
综合得分
该模型在此用例的得分为:56.0 分(满分 100 分),未通过
基础难度评测结果
- 得分:56.0 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中描绘了一幅充满诗意的秋季湖景水彩画,整体色调以温暖的橙红色和淡雅的米白色为主。画面左侧前景是一棵苍劲有力的古树,繁茂的红枫叶如云霞般铺展开来,树干纹理清晰,根部错落着几块灰色的岩石。湖水平静如镜,倒映着岸边连绵的橙色树林和远方朦胧的淡灰色山峦。天空留白较多,零星的落叶随风飘零,营造出宁静深远的意境。画面右上角模仿中国传统书画,添加了黑色书法字体和两枚红色印章。然而,作为 AI 生成的图像,画面存在明显的逻辑缺陷:右上角的文字并非真实的汉字,而是由杂乱线条组成的伪字符,完全无法辨识;部分树枝的生长方向与透视关系略显生硬,与背景山影的交汇处显得不够自然。此外,水面的倒影在细节上与实物并不完全对应,呈现出一种超现实的模糊感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在场景色彩和整体氛围上有一定表现,但在最核心的任务要求上彻底失败:既未能正确书写日文俳句「古池や」,也未能体现任何瘦金体的笔画风格特征。文字区域呈现的是混乱无意义的汉字堆砌,这是对提示词核心意图的根本性偏离。场景虽有秋叶氛围但缺乏京都地域特征。综合来看,这张图像仅完成了「秋叶背景」这一基础要求,跨文化书法风格迁移的核心任务完全未能实现。 【GEMINI】这是一幅视觉效果尚可的风景画,但在核心任务——文字风格迁移与内容准确性上表现极差。模型完全忽略了具体的文本指令,导致作品在文化表达上彻底脱节。作为装饰画尚可,但作为书法与绘画结合的命题创作,属于不及格作品。 【KIMI】此图在场景氛围营造上有一定基础,但核心任务——瘦金体书写「古池や」——完全失败。文字内容错误、风格偏离、构图失衡三重缺陷叠加,使得跨文化视觉迁移的测试目的落空。模型似乎将「日式书法」「中文题跋」「秋日意象」等关键词机械拼接,却未理解瘦金体的具体笔法特征与俳句的文本准确性要求。建议重新训练中日书法风格的区分能力,以及短文本生成的准确性。
进阶难度评测结果
- 得分:53.1 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展现了一幅充满禅意的中式或日式秋季园林景观。画面左侧是一棵巨大的枫树,枝叶呈现出鲜艳夺目的火红色,树下矗立着一座红白相间、拥有青瓦飞檐的多层古建筑。建筑坐落在湖畔的乱石堆上,倒影清晰地映在平静的湖面。画面右侧是一座朱红色的木质长桥,横跨在水雾缭绕的湖面上,远景则是层峦叠嶂的淡雅山脉,整体色调以暖橙、深红和米黄色为主,营造出宁静深远的意境。 画面右侧边缘有一行竖排的黑色书法字体,但仔细观察可以发现明显的 AI 生成缺陷:这些文字并非真实的汉字,而是由扭曲、无意义的笔画组成的“伪文字”,完全无法辨认。此外,湖面上漂浮的几片绿色叶片透视略显生硬,与水面的融合感不够自然,远处的山峦线条也略显模糊,带有典型的 AI 绘画滤镜感。尽管如此,整幅画作在构图和色彩搭配上依然具有很强的视觉冲击力。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】本图在场景营造方面有一定基础,枫叶、古寺、红桥、山峦等元素均有呈现,秋日氛围尚可。但本次评测的核心考察点——将瘦金体笔意融入「古池や」俳句书写——彻底失败。右侧文字区域呈现为无法辨认的乱字堆叠,既无目标字符,也无任何书法风格特征,且大面积占据画面严重破坏构图。这是一次在核心任务上的重大失败,场景部分的合格表现无法弥补文字渲染的根本性缺陷。 【GEMINI】这是一幅典型的「金玉其外」的 AI 作品。在场景构建上,模型表现出了极高的审美水准,色彩与构图均达到了装饰画的高标准。然而,在涉及核心任务——「跨文化文字风格迁移」时,模型表现出了严重的逻辑缺陷,生成的文字不仅不是要求的俳句,甚至连基本的汉字结构都未能正确构建,直接导致了作品在文化内涵表达上的彻底失败。 【KIMI】这是一幅在场景渲染上表现优异、却因文字生成失败而严重偏离提示词要求的典型案例。模型在「古池や」这一核心指令上完全失控,呈现出AI图像生成中常见的「文字幻觉」问题——看似有书法、实则无意义。尽管枫叶、古寺、红桥等视觉元素质量上乘,但文字内容的彻底错误使得「跨文化视觉表现力」的测试目标未能达成。建议重新生成时单独处理文字层,或采用后期合成确保俳句准确性。
困难难度评测结果
- 得分:44.8 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中描绘了一幅充满诗意的中式秋景图。画面左侧一棵巨大的枫树拔地而起,火红的枫叶繁茂地向右上方延伸,遮盖了部分天空。树下是一座古色古香的红柱黑瓦凉亭,临水而建,倒映在平静如镜的湖面上。湖泊向远方延伸,两岸布满了橙红色的树林,远景是朦胧的淡黄色山峦,整体色调以暖红、金黄和米色为主,营造出宁静深远的意境。画面右侧有大字书法和红色印章,增添了传统水墨画的质感。 在 AI 生成缺陷方面,右侧的书法文字并非真实的汉字,而是由扭曲的线条组成的伪文字,无法辨认具体含义。凉亭的结构存在透视异常,支撑凉亭的木桩在水中的倒影与实物位置不完全对应,显得有些漂浮。此外,枫树的叶片细节在边缘处显得过于细碎且重复,缺乏自然生长的随机性,水面上散落的红叶形状也较为单一。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这幅AI生成图像在场景氛围营造上有一定基础,秋日色调和构图具备东方美学的基本框架。然而,提示词的核心任务——将瘦金体笔意融入日文俳句书写的跨文化视觉表现——彻底失败。文字内容完全错误,既非指定俳句,也非任何真实文字;瘦金体风格特征完全缺失;光影效果与提示词要求相差甚远。这幅图像本质上是一幅尚可的中式秋景插画,配上了无意义的伪文字装饰,与提示词的核心意图严重偏离。 【GEMINI】这是一幅视觉表现力尚可,但核心任务(文字书写与跨文化融合)严重失败的作品。图像在环境渲染方面表现出高水准,但在处理复杂文字指令时,模型表现出明显的逻辑缺失。文字不仅未能实现风格迁移,甚至无法输出正确的字符内容,这使得作品在文化内涵层面完全脱节。 【KIMI】这是一幅「形式尚可、内容溃败」的典型AI生成图像。场景的光影与色彩营造具备一定装饰性,但文字内容的完全错误使其在核心任务上彻底失败——提示词明确要求书写特定俳句,而模型输出了毫无关联的字符组合。瘦金体的风格迁移停留在表面模仿,未能把握其「瘦硬通神」的精髓;跨文化融合更是无从谈起,画面沦为中日元素的生硬拼贴而非有机统一。作为「测试模型跨文化视觉表现力」的任务,此图在最关键的文字维度上完全未达标,属于需要大幅返工的质量水平。
相关链接
您可以通过以下链接查看更多相关内容: