Google: Gemini 2.5 Flash Image (Nano Banana) 在「日式枯山水场景书道汉字生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:Google: Gemini 2.5 Flash Image (Nano Banana)
  • 用例名称:日式枯山水场景书道汉字生成
  • 测试类型:图像生成
  • 评测维度:书法艺术表现

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张图像:京都枯山水庭院风格的场景中,木质长廊上铺着一张宣纸,纸上用浓墨书写着日文汉字「和敬清寂」。

任务要求

AI 模型需要满足以下要求:

  1. 画面中可见枯山水庭院背景(细沙或石组元素)
  2. 前景有木质长廊与宣纸
  3. 宣纸上清晰呈现「和敬清寂」四个汉字
  4. 文字为墨色书写风格
  5. 整体画面构图清晰,主体突出

评测结果

综合得分

该模型在此用例的得分为:67.5 分(满分 100 分),已通过

基础难度评测结果

  • 得分:67.5 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一个宁静的日式枯山水庭院场景。画面前景是一条深棕色的木质走廊,阳光斜射在木板上,纹理清晰可见。走廊上铺展着一幅白色的长条书法卷轴,上面写有四个黑色的毛笔大字。背景是典型的日式园林,地面铺满了细密的灰色碎石,并耙出整齐的波纹,其间点缀着几块错落有致的大石头、绿色的苔藓和修剪整齐的小树,远处隐约可见木质结构的传统建筑和石灯笼。 画面中存在明显的 AI 生成缺陷:卷轴上的书法字体虽然具有水墨质感,但并非真实的汉字,笔画结构混乱,无法辨认具体含义,属于典型的 AI 模拟文字错误。此外,卷轴左侧边缘与木地板交界处存在透视异常,纸张似乎部分“嵌入”了木板缝隙中。背景中的石灯笼结构略显模糊,与周围环境的衔接不够自然。整体色调偏向沉稳的木质棕色与灰白色,营造出一种禅意氛围。

图中展示了一个宁静的日式枯山水庭院场景。画面前景是一条深棕色的木质走廊,阳光斜射在木板上,纹理清晰可见。走廊上铺展着一幅白色的长条书法卷轴,上面写有四个黑色的毛笔大字。背景是典型的日式园林,地面铺满了细密的灰色碎石,并耙出整齐的波纹,其间点缀着几块错落有致的大石头、绿色的苔藓和修剪整齐的小树,远处隐约可见木质结构的传统建筑和石灯笼。

画面中存在明显的 AI 生成缺陷:卷轴上的书法字体虽然具有水墨质感,但并非真实的汉字,笔画结构混乱,无法辨认具体含义,属于典型的 AI 模拟文字错误。此外,卷轴左侧边缘与木地板交界处存在透视异常,纸张似乎部分“嵌入”了木板缝隙中。背景中的石灯笼结构略显模糊,与周围环境的衔接不够自然。整体色调偏向沉稳的木质棕色与灰白色,营造出一种禅意氛围。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在场景营造方面表现出色,京都枯山水庭院的氛围还原度高,木质长廊与宣纸的材质表现令人满意。然而,作为本次测试的核心考察点——「和敬清寂」四字的文字渲染——存在严重失败:四字中仅「和」字勉强可辨,其余三字均出现不同程度的字形错误和笔画混乱,这是AI在汉字/日文生成上的典型短板。由于文字准确性权重高达45%,此维度的严重失分直接拉低了整体评分。场景美则美矣,但核心任务未能完成。 【GEMINI】这是一张在场景渲染上表现优秀,但在文字生成能力上严重翻车的作品。作为一张要求包含特定文字的图像,文字内容的彻底缺失使其无法满足核心任务需求。虽然环境氛围和材质表现达到了专业摄影级别,但 AI 在处理复杂汉字书写时的局限性在此图中暴露无遗。 【KIMI】本图在场景氛围营造上具备一定水准,但文字准确性出现致命错误——将茶道核心概念「和敬清寂」中的「敬」字错写为「禅」,这不仅是一个笔画失误,更是对提示词核心语义的根本性背离。作为测试「日文汉字书道质感」的生成任务,此错误导致该维度直接不及格。场景还原度与画面质量虽达可用水平,但无法弥补文字内容的失败。建议模型加强汉字字形结构的训练,尤其是形近字的区分能力。

进阶难度评测结果

  • 得分:70.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一个宁静的日式枯山水庭院场景。画面左侧是深棕色的木质走廊,地板纹理清晰可见,其上平铺着一张长方形的白色宣纸,纸上用黑色毛笔书写着四个汉字。画面右侧是一片精心打理的枯山水景观,洁白的细砂被耙制成起伏的波浪纹路,中间点缀着几块带有青苔的深色山石。整体色调以木色、白色和灰色为主,营造出一种禅意深远的氛围。在 AI 生成的细节方面,存在明显的文字错误:纸上的四个汉字并非标准的书法字体,其中第二个字像是“禅”的变体,第三个字接近“清”,而第四个字结构混乱,无法辨认,属于典型的 AI 无法准确还原复杂汉字结构的缺陷。此外,宣纸在木地板上的透视关系略显生硬,缺乏自然的纸张厚度感。

图中展示了一个宁静的日式枯山水庭院场景。画面左侧是深棕色的木质走廊,地板纹理清晰可见,其上平铺着一张长方形的白色宣纸,纸上用黑色毛笔书写着四个汉字。画面右侧是一片精心打理的枯山水景观,洁白的细砂被耙制成起伏的波浪纹路,中间点缀着几块带有青苔的深色山石。整体色调以木色、白色和灰色为主,营造出一种禅意深远的氛围。在 AI 生成的细节方面,存在明显的文字错误:纸上的四个汉字并非标准的书法字体,其中第二个字像是“禅”的变体,第三个字接近“清”,而第四个字结构混乱,无法辨认,属于典型的 AI 无法准确还原复杂汉字结构的缺陷。此外,宣纸在木地板上的透视关系略显生硬,缺乏自然的纸张厚度感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】本图像在场景氛围营造和材质表现方面表现良好,成功构建了具有侘寂美学气质的枯山水庭院场景,木廊、宣纸、白沙等材质质感均有较好体现。然而,作为本次测试的核心考察点——「和敬清寂」四字的准确书写——存在严重失误,字形偏差明显,部分字符难以辨认,这是AI文字生成能力的典型短板。文字准确性的失败直接拉低了整体评分,因为提示词的核心意图(书道文字展示)未能实现。综合加权后,图像属于「部分完成要求」的水平。 【GEMINI】这是一张在场景构建与材质渲染上表现优异,但在核心任务——文字生成上严重失败的图像。模型在处理复杂汉字书法时依然存在明显的幻觉问题,导致画面核心主题缺失,严重影响了作品的完整性。 【KIMI】该图像在场景氛围与材质表现上达到基本可用水平,但核心任务——准确呈现「和敬清寂」四字——出现严重失败:一字完全错误、一字严重变形,直接违背提示词的核心要求。书道质感亦停留在「形似」层面,缺乏禅宗书道应有的笔力与墨色控制。作为测试「AI生成日文汉字书道能力」的图像,文字准确性维度的不及格直接拉低整体评价,暴露出当前模型在复杂汉字结构生成上的显著短板。

困难难度评测结果

  • 得分:59.8 分
  • 通过状态:未通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展现了一个宁静的日式枯山水庭院场景。画面前景是一段深褐色的木质走廊地板,地板上平铺着一张带有折痕的白色宣纸,纸上写有四个黑色的书法大字,左下角盖有一枚红色印章。画面中景是木走廊的边缘和一排整齐的灰色鹅卵石。背景则是铺满细密白色砂石的庭院,砂石被耙制成环绕着石块的波纹状。庭院中心有几块长有绿色苔藓的深色岩石,整体色调以木原色、白色和灰色为主,营造出一种禅意氛围。 在 AI 生成的细节方面,画面存在明显的文字错误。纸上的书法字体虽然模仿了汉字结构,但并非真实的文字,而是由杂乱笔画组成的“伪汉字”,无法辨认具体含义。此外,宣纸的折痕分布略显生硬,与木地板的透视关系在边缘处衔接得不够自然。背景中砂石的纹理在远端逐渐模糊,缺乏真实摄影的景深层次感。

图中展现了一个宁静的日式枯山水庭院场景。画面前景是一段深褐色的木质走廊地板,地板上平铺着一张带有折痕的白色宣纸,纸上写有四个黑色的书法大字,左下角盖有一枚红色印章。画面中景是木走廊的边缘和一排整齐的灰色鹅卵石。背景则是铺满细密白色砂石的庭院,砂石被耙制成环绕着石块的波纹状。庭院中心有几块长有绿色苔藓的深色岩石,整体色调以木原色、白色和灰色为主,营造出一种禅意氛围。

在 AI 生成的细节方面,画面存在明显的文字错误。纸上的书法字体虽然模仿了汉字结构,但并非真实的文字,而是由杂乱笔画组成的“伪汉字”,无法辨认具体含义。此外,宣纸的折痕分布略显生硬,与木地板的透视关系在边缘处衔接得不够自然。背景中砂石的纹理在远端逐渐模糊,缺乏真实摄影的景深层次感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】本图在场景构建与材质表现方面具备一定水准,枯山水、石组、木廊等元素的写实质感基本达标,整体禅意氛围也有所呈现。然而,图像在最核心的任务要求上遭遇了灾难性失败:宣纸上的文字「和敬清寂」严重错误,实际呈现为无意义的错误汉字组合,字序混乱,多字缺失或变形。这一根本性错误直接导致整体评分大幅下滑。飞白书道质感、墨迹光泽对比等细节要求亦未能实现。综合来看,该图像在场景氛围上有一定可取之处,但在文字生成这一核心考察点上彻底失败,无法满足提示词的基本要求。 【GEMINI】这是一次典型的「形似而神不似」的生成。虽然模型捕捉到了枯山水和木质长廊的视觉元素,但在核心任务——书道文字的生成上彻底失败。文字不仅无法辨认,且完全背离了书道艺术的笔触逻辑。材质表现缺乏深度,使得整张图看起来像是一张精美的素材拼贴,而非一个有机的整体。 【KIMI】该图像在日式禅宗场景的「形似」层面有一定基础,但在核心要求上存在严重缺陷。最致命的是文字准确性与墨色光泽的完全失败:「清」「寂」二字字形变形偏离书道规范,且整幅书法缺失「湿墨反光与枯墨哑光」的物理对比,直接违背提示词明确要求的「墨迹光泽反差」。光线方向的前后矛盾、飞白效果的表面化处理、各类材质的机械雷同,均暴露出AI在物理逻辑与精细质感上的局限。整体而言,这是一张「氛围接近但核心要求落空」的图像,评分应体现「未完成关键要求即大幅扣分」的严格标准。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...