Google: Gemini 2.5 Flash Image (Nano Banana) 在「赤壁赋苏轼神韵与江月场景生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:Google: Gemini 2.5 Flash Image (Nano Banana)
- 用例名称:赤壁赋苏轼神韵与江月场景生成
- 测试类型:图像生成
- 评测维度:书法艺术表现
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一幅以《赤壁赋》为主题的水墨风格图像。 场景要求: - 深夜长江上一叶扁舟漂浮于平静水面 - 远处可见陡峭的赤壁山崖 - 天空中悬挂一轮明月 文字要求: - 在画面空白处书写《赤壁赋》中的片段「壬戌之秋,七月既望,苏子与客泛舟游于赤壁之下」 - 字体为行书风格
任务要求
AI 模型需要满足以下要求:
- 画面中有一叶扁舟漂浮在长江水面上
- 远景可见赤壁山崖
- 天空中有一轮明月
- 画面空白处有《赤壁赋》文字片段
- 整体呈现水墨或古典国画风格
评测结果
综合得分
该模型在此用例的得分为:68.7 分(满分 100 分),已通过
基础难度评测结果
- 得分:68.7 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中描绘了一幅仿中国传统水墨画风格的月夜江景图。画面构图开阔,近景是一水平静的江面,一只带有顶棚的小木船孤零零地漂浮在水中央,船尾坐着一位身着白衣的垂钓者或行舟人。中景是连绵起伏、怪石嶙峋的山峦,山体呈现出淡红与深灰交织的色调,展现出一种苍劲的质感。远景的天空中挂着一轮圆润的明月,四周点缀着点点繁星和横向舒展的淡灰色云层。画面右上角有仿古的书法题字和红色印章,增添了文人画的意境。 在 AI 生成的缺陷方面,最明显的是右上角的书法文字,虽然字形模仿了汉字结构,但实际上是无法辨认的乱码,缺乏真实的语义。此外,船尾延伸出的一条细线在水中生硬地折断,逻辑不通;山体边缘的部分线条过于生硬,缺乏传统水墨画中自然晕染的笔触感。整体色调虽然和谐,但云层的分布略显机械重复。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】本图在场景意境和水墨风格上表现较为出色,三大核心视觉元素(扁舟、明月、山崖)均有呈现,整体国画风格统一且具有古典美感。然而,提示词中权重30%的「文字呈现」维度出现了根本性失败——图中题字内容与《赤壁赋》原文完全不符,既非「壬戌之秋,七月既望,苏子与客泛舟游于赤壁之下」,也无法辨识为任何有意义的古文片段,属于严重的内容错误。这一致命缺陷大幅拉低了整体评分。 【GEMINI】这是一幅视觉意境尚可的作品,成功捕捉了《赤壁赋》的文学氛围,但在AI最薄弱的「文字生成」环节表现糟糕。文字不仅无法辨认,且严重破坏了画面的文化内涵,导致整体作品在人文深度上大打折扣。 【KIMI】该图像在视觉风格层面具备一定国画意趣,但文字呈现维度出现灾难级失误——题写内容完全偏离《赤壁赋》原文,属于提示词核心要求的彻底落空。山崖地貌的地理准确性、人物叙事的可读性亦存在明显短板。整体呈现「形似而神失」的状态:作为装饰画勉强可观,作为文学场景的忠实还原则不合格。
进阶难度评测结果
- 得分:59.8 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中是一幅模仿中国传统水墨画风格的山水图。画面左侧是陡峭的青灰色山峦,山石纹理细腻,倒映在平静的湖面上。湖中心有几叶扁舟,其中最前方的小船上坐着一个模糊的人影。天空中悬挂着一轮圆月,月光在水面上投射出一道垂直的亮白色波光。画面右上方有大片黑色的行书题字和几枚红色的印章。整体色调以灰、黑、白为主,局部山石带有淡淡的赭石色,营造出一种宁静深远的意境。 作为 AI 生成的图片,画面存在明显的逻辑缺陷:右上方的书法文字虽然笔画酷似汉字,但实际上是无法辨认的“伪汉字”,字形结构混乱且没有实际含义。此外,水面上的月亮倒影呈现为长条状的强光束,这更符合现代摄影中路灯或强光源的反射特征,与传统水墨画中柔和、写意的倒影处理方式不符。左侧山体与水面的交界处线条略显生硬,缺乏传统绘画中水墨自然晕染的过渡感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在场景意境营造上有一定水准,月夜江景的静谧氛围基本符合《赤壁赋》的文学意境。然而,最核心的书法要求出现了根本性失误——书写内容并非提示词指定的《赤壁赋》文字,且书法风格与苏轼「石压蛤蟆」书风相去甚远。这一失误直接影响了图文融合的深层意境呼应。综合来看,图像在视觉美感上尚可,但对提示词核心要求(书法内容与风格)的完成度严重不足。 【GEMINI】这是一幅典型的「金玉其外」之作。在场景氛围营造上,模型表现出了不错的审美水准,光影与构图均可圈可点。然而,在涉及核心文化要素(书法)时,模型表现出极大的局限性,不仅未能还原指定的苏轼书风,甚至连基本的汉字书写都未能完成,导致整幅作品在文化表达上彻底失败。 【KIMI】本图在视觉表层模仿了传统水墨山水的外观,但在核心要求上全面溃败。书法维度堪称灾难:不仅书风完全背离「石压蛤蟆」特征,更致命的是文字内容为不可辨识的AI乱码,导致《赤壁赋》主题彻底落空。场景意境方面,「水波不兴」与「赤壁」两个关键元素均未准确呈现。图文融合因书法的完全失效而丧失意义。整体而言,这是一幅「形似而神散」的AI生成图,对文学经典与书法传统的理解停留在表面符号的拼凑,缺乏人文内涵的深度还原。
困难难度评测结果
- 得分:— 分
- 通过状态:未通过
模型生成产物
以下是该模型针对此任务的实际生成内容:
系统报错(阶段=模型生成; 模块=app.services.inference.call_text_model; provider=openrouter; model=google/gemini-2.5-flash-image):模型返回成功但未包含图像内容
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】本次评测的候选输出为「图像生成失败,无法评分」,模型未能完成图像生成任务,所有评分维度均得0分。任务要求高度综合的古典水墨长卷创作能力,包括场景意境营造、苏轼书风还原、诗书画一体融合及人物气质表现,但由于生成失败,上述要求均未得到任何响应,整体评分为0。 【GEMINI】由于模型返回「图像生成失败」,无法执行任何视觉内容的评估。该次任务未能完成,评测结果为零分。 【KIMI】候选输出明确标注「图像生成失败,无法评分」,未产生任何可视图像内容。根据评测输入包中的唯一事实来源,所有评分维度均因缺乏实际生成结果而无法进行评估,各维度均计0分。此为技术执行层面的完全失败,不涉及任何艺术表现或风格还原的质量问题。
相关链接
您可以通过以下链接查看更多相关内容: