Google: Gemini 2.5 Flash Image (Nano Banana) 在「生成式AI入门课程封面图生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:Google: Gemini 2.5 Flash Image (Nano Banana)
- 用例名称:生成式AI入门课程封面图生成
- 测试类型:图像生成
- 评测维度:PPT 设计
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
请生成一张课程封面图,具体要求如下: 画面规格:16:9 比例,4K 分辨率 风格:明亮扁平插画风,色彩鲜明活泼 背景:抽象学习空间,包含书本、灯泡、数据流等元素 文字内容: - 画面中央偏上位置,大号中文标题:「一小时搞懂生成式 AI」 - 标题下方,小号副标题:「从零开始认识大模型、提示词和工作流程」 字体要求:全部使用中文无衬线字体,严禁出现任何英文字符
任务要求
AI 模型需要满足以下要求:
- 画面为 16:9 比例,整体清晰
- 风格为明亮扁平插画风,色彩鲜明
- 背景含有书本、灯泡、数据流等学习相关元素
- 中央偏上有大号中文标题「一小时搞懂生成式 AI」,文字清晰可读
- 标题下方有小号副标题「从零开始认识大模型、提示词和工作流程」
评测结果
综合得分
该模型在此用例的得分为:59.8 分(满分 100 分),未通过
基础难度评测结果
- 得分:59.8 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中是一张以浅蓝色为基调的扁平化风格宣传海报,主题似乎与人工智能教育有关。背景装饰着淡蓝色的波浪色块,四周散布着书籍、发光的黄色灯泡以及带有圆点的流线型线条,营造出一种科技与学习融合的氛围。画面中央是一个深蓝色的圆角矩形横幅,上面印有白色的艺术字。 然而,这张图片存在明显的 AI 生成缺陷,主要体现在文字处理上。横幅上的大字本意可能是“一小时掌握生成式 AI”,但实际显示的文字中,“掌握”被误写为带有偏旁的乱码字符,“生成式”的“成”字结构也存在异常。下方的小字标题更是严重的乱码,由许多无法辨认的伪汉字组成,完全失去了阅读意义。此外,左下角和右下角的书籍在透视和细节上略显生硬,灯泡内部的灯丝线条也显得不够自然。总体而言,这是一张视觉构图尚可,但文字内容完全错误的 AI 生成图像。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在视觉风格和排版结构上具备一定基础,扁平插画风格、色彩搭配和背景元素的呈现基本符合提示词要求。然而,图像最核心的功能——文字内容——出现了灾难性的失败:标题和副标题几乎所有汉字均出现严重错误,生成的文字与提示词要求的内容完全不符,且违反了「严禁英文字符」的约束。作为一张课程封面图,文字准确性是最基本也是最重要的要求,当前结果完全无法实际使用。综合来看,该图像属于「风格尚可但核心功能严重失败」的典型案例。 【GEMINI】这张图像在视觉风格和背景设计上表现优异,准确捕捉了扁平插画的精髓。然而,作为一张以文字信息传递为核心的课程封面,其文字准确性表现是灾难性的。主标题错字连篇,副标题完全不可读,这使得该图像在实际应用中完全失效。模型在处理复杂中文长句时的字符建模能力亟待提升。 【KIMI】这是一张典型的AI图像生成中文文字失败案例。视觉风格与背景元素基本达标,但文字准确性维度出现灾难性错误——标题和副标题的汉字几乎全部被错误生成,导致图像完全无法作为课程封面使用。这种「形似而神不似」的文字生成问题在当前AI模型中较为常见,但对于需要准确传达信息的封面设计场景属于致命缺陷。建议该模型在中文文字生成能力上需要重大改进。
进阶难度评测结果
- 得分:51.5 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中是一张以浅蓝色为背景的扁平化风格海报,整体色调清新,融合了教育与科技元素。左上角堆叠着三本厚书,颜色分别为深蓝、橙色和浅蓝,书本下方延伸出类似电路板的蓝色线条和圆点;右上角有一个发光的黄色灯泡,象征创意或灵感。四周点缀着几何色块和带有圆点的装饰线条。画面中央有两行深蓝色的大号文字,底部左右两侧各有一行小字。 然而,这张图片存在明显的 AI 生成缺陷,主要体现在文字内容上:画面中所有的中文字符均为乱码或生僻字的错误组合,无法组成有意义的词汇,例如标题看起来像“一个访招晒着线弍 AI”,下方的副标题和落款也全是逻辑不通的错别字。此外,左侧书堆下方的电路连线布局略显杂乱,缺乏真实的逻辑结构。总体而言,这是一张视觉构图尚可但文字内容完全错误的演示性图片。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在视觉风格和版式结构上具备一定基础,扁平插画风格、色彩搭配和整体布局框架均有可取之处。然而,作为一张课程封面图,其核心价值在于文字信息的准确传达,而本图四处文字区域无一正确——主标题、副标题、左下角标注、右下角标注全部出现严重错字或乱码字形,完全无法传达正确信息。文字准确性权重高达40%,且本次得分仅18分,导致整体评价极低。这是AI图像生成中文字渲染能力不足的典型失败案例,视觉框架再好也无法弥补文字内容的根本性错误。 【GEMINI】该图像在视觉风格和构图布局上表现尚可,但在核心的文字生成任务上遭遇了毁灭性的失败。文字准确性极低,几乎每一行都存在严重的错别字,且未能遵守「禁用英文字符」的硬性约束。作为一张功能性的课程封面图,其基本信息传递功能完全丧失,属于典型的「画得像但不能用」的 AI 生成案例。 【KIMI】这是一张在视觉风格上勉强及格,但在核心文字任务上彻底失败的AI生成图像。模型完全无法理解并正确渲染中文字符,四处文字区域全部出现严重错字、乱码或语义扭曲,导致作为「课程封面」的功能性完全丧失。尽管插画风格和色彩表现基本符合要求,但文字准确性是此类图像的核心指标,此处失败使得整体图像几乎无法使用。建议优先改进中文字符的生成与渲染能力。
困难难度评测结果
- 得分:47.5 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中是一张长方形的横向海报,背景为明亮的浅蓝色。海报的左右两侧装饰着扁平化风格的几何图形,包括橙色、黄色和绿色的色块,以及代表科技感的齿轮、灯泡、电路连线和书籍图标。这些元素对称分布,营造出一种教育或科技讲座的氛围。画面中心是醒目的白色文字,排版整齐。 然而,这张图片存在明显的 AI 生成缺陷,主要体现在文字内容上。虽然字体清晰,但文字逻辑混乱,出现了大量无法辨识的错别字和乱码组合,例如标题中的“一个时招晒箸线我 AI”以及下方的小字“角正齐合就者大檔判”,这些词汇在中文语境下没有实际意义。此外,部分装饰线条与几何图形的衔接略显生硬,灯泡内部的灯丝结构也过于简化且不符合物理常识。整体构图虽然平衡,但文字信息的完全失真暴露了其 AI 生成的本质。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在视觉风格和排版结构上具备一定基础,色彩方案和布局框架基本符合提示词要求。然而,最核心的文字准确性出现灾难性失败——四处文字区域全部存在严重错字或乱码,主标题和副标题几乎完全无法辨认,角落标注也有明显错误。这使得该图像作为课程封面完全不可用。文字生成能力的严重缺陷是本次评测的最大问题,导致整体评分大幅拉低。 【GEMINI】这是一张在构图框架上合格但在内容执行上严重失败的作品。模型虽然理解了复杂的排版布局指令,但在中文语义理解与字符精准生成方面表现极差,几乎所有文字内容都存在错别字或乱码,且违反了禁止英文字符的关键约束。作为专业课程封面,其文字的不可读性使其完全失去了实用价值。 【KIMI】这是一张在文字生成上出现灾难性失败的 AI 图像。尽管视觉风格与背景元素基本符合提示词要求,但所有文字内容均为不可读的乱码,使得该图像作为「课程封面」完全失去功能价值。从专业评审角度,文字准确性是此类设计图像的核心指标,15% 的得分已属宽容。推测失败原因可能涉及:中文字体渲染机制缺陷、字符编码错误、或模型对复杂中文排版的处理能力不足。建议优先修复文字生成管线,再优化视觉细节。
相关链接
您可以通过以下链接查看更多相关内容: