Google: Gemini 2.5 Flash Image (Nano Banana) 在「地壳物质循环示意图生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:Google: Gemini 2.5 Flash Image (Nano Banana)
- 用例名称:地壳物质循环示意图生成
- 测试类型:图像生成
- 评测维度:教材插图
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张地壳物质循环示意图。 要求包含以下四个核心要素: - 岩浆 - 岩浆岩 - 沉积岩 - 变质岩 用箭头连接四个要素,并在箭头旁标注对应的转化过程名称:「冷却凝固」、「外力作用」、「变质作用」、「重熔再生」。
任务要求
AI 模型需要满足以下要求:
- 图中包含「岩浆」、「岩浆岩」、「沉积岩」、「变质岩」四个节点,文字清晰可读
- 四个节点之间有箭头连接,方向正确
- 箭头旁标注有「冷却凝固」、「外力作用」、「变质作用」、「重熔再生」等转化过程名称
- 整体布局清晰,各要素不重叠
评测结果
综合得分
该模型在此用例的得分为:26.2 分(满分 100 分),未通过
基础难度评测结果
- 得分:26.2 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中展示了一张试图解释地质循环的科学示意图,整体采用米色背景,构图呈现出一种循环流动的过程。画面顶部是一个燃烧着火焰的岩浆池,中间是两座灰色的山脉,底部则是地壳剖面,展示了褶皱岩层和沉积岩块。青蓝色的箭头在这些元素之间连接,形成一个闭环。然而,这张图片具有非常明显的 AI 生成缺陷,主要体现在文字和逻辑上:画面中所有的中文标注均为毫无意义的乱码或臆造字(如“汭嫁房”、“淫徇房”等),完全无法阅读或理解其科学含义。英文单词如“Crust”和“Mantle”虽然拼写正确,但位置排布随意。此外,箭头的指向逻辑混乱,山脉与地层的衔接也缺乏真实的地质学依据,是一张典型的看似专业但内容完全错误的 AI 伪造示意图。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图在视觉构图和图形绘制方面有一定基础,循环结构的框架搭建尚可,图形元素也能对应不同岩石类型。然而,图像最核心的文字标注部分出现了灾难性的乱码问题——所有节点名称和转化过程标注均无法正常显示,完全不符合提示词的明确要求。这是一张在文字信息层面几乎完全失败的图像,尽管图形部分有所努力,但作为一张「地壳物质循环示意图」,其核心功能(信息传达)已完全丧失,综合评分极低。 【GEMINI】这是一张视觉构图合格但内容完全失败的示意图。AI 在处理中文专业术语时产生了严重的幻觉,导致所有关键的科学标注均不可读或错误。作为教学或演示工具,该图像因其文字信息的彻底错误而完全不可用。 【KIMI】这是一张典型的AI生成失败案例,模型在生成中文文本时出现了严重的「幻觉」现象——大量汉字被替换为形近但无意义的乱码字符,导致科学示意图的信息传递功能完全丧失。尽管图形元素的绘制有一定水准,但作为「地壳物质循环示意图」,其核心功能(清晰标注四个岩石类型及转化过程)彻底失败。从提示词符合度来看,四个核心要素名称和四个转化过程名称的准确率接近0%,属于严重不符合要求的生成结果。
进阶难度评测结果
- 得分:42.4 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张模拟地理科学风格的流程图,背景为淡米黄色。画面中心由四个彩色方框组成一个圆环路径,分别代表不同的物质状态:左上方是红色的火焰纹理,右上方是灰色的岩石纹理,右下方是黄色的地层纹理,左下方是蓝色的波浪纹理。方框之间由灰色的双向弧形箭头连接,箭头旁标注了说明文字。右下角有一个图例框,对颜色和名称进行了对应。 这张图片具有明显的 AI 生成缺陷,主要体现在文字逻辑上。画面中所有的中文字符虽然笔画清晰,但大多是无法辨认的“伪汉字”或乱码组合,例如标题和方框内的标注均无实际含义,仅有右侧的“外力作用”字迹较为清晰。此外,流程图的逻辑指向性模糊,箭头与文字的排版略显随意,图例中的文字与上方方框内的文字也无法完全对应,属于典型的 AI 模拟图表视觉效果但缺乏实质内容的生成错误。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图在结构设计上具备地壳物质循环图的基本框架,环形路径、节点颜色区分、图例位置等形式要素均有体现,说明模型理解了图示的整体结构。然而,全图所有文字内容均为严重乱码,标题、节点名称、转化过程标注和图例文字无一可读,导致图像完全丧失了作为地理教学图示的实用价值。这是一张「形似而神失」的失败作品——视觉框架尚可,但核心内容(文字信息)完全错误。综合加权得分约为42分,属于「问题较多,明显与提示词有偏差」的范畴。 【GEMINI】这是一张典型的「形似神散」的 AI 生成图像。虽然在视觉构图、色彩分布和图表框架上模仿了高中地理示意图的样式,但在核心的文字生成和地理科学逻辑上完全失败。所有的文字标注均为无意义的乱码,导致该图完全失去了作为教学工具的实用价值,属于严重的 AI 幻觉产物。 【KIMI】这是一次严重的生成失败。模型在生成中文文本时出现系统性乱码,导致所有关键信息——标题、节点名称、转化标注、图例说明——全部不可读。尽管图像在形式上具备循环示意图的结构框架,但内容完全错误,无法作为教学材料使用。这反映了模型在处理中文地质学术语时的严重缺陷,可能是字符编码、训练数据或生成机制的问题。从教育用途角度,该图价值为零。
困难难度评测结果
- 得分:32.8 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张试图模仿科学流程图或技术原理图的 AI 生成图片。画面构图分为上下两层:上层背景为浅棕色,分布着黄色、蓝色和绿色的矩形方框;下层背景为砖红色,包含圆形图标和椭圆形气泡。各元素之间由实线和虚线箭头连接,右侧附有一个图例说明栏。画面整体色调明亮,逻辑结构看似严谨。然而,这张图片存在严重的 AI 生成缺陷,最显著的问题是文字完全不可读。画面中所有的汉字均为随机笔画组合而成的“伪汉字”,没有任何实际含义,标题、方框内的标签以及右侧的图例均是乱码。此外,部分线条连接逻辑混乱,箭头指向模糊,图例中的颜色圆点与左侧主体图形的颜色并不完全对应,属于典型的缺乏逻辑支撑的视觉模拟。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在结构框架和视觉布局上有一定的设计意图,能够看出分层结构、节点颜色区分、主次箭头区分等设计思路。然而,图像存在灾难性的文字渲染失败问题——全图所有文字均为严重乱码,无一例外。标题、节点名称、路径标注、图例说明、底部文字全部无法正确读取,导致这张图作为「地壳物质循环示意图」完全失去教学价值和信息传达功能。这是AI生成图像中文字处理能力严重不足的典型案例,视觉框架的存在无法弥补文字内容的全面崩溃。综合评分极低。 【GEMINI】这是一张典型的「形似神散」的 AI 生成图。从视觉构图上看,它完美复刻了教科书示意图的排版、分层和元素分布;但在核心功能——即知识传递上,由于 AI 对中文字符生成的严重缺陷,导致所有关键术语和逻辑标注变成了毫无意义的乱码。作为地理教学示意图,它是完全不合格的。 【KIMI】这是一次严重的AI生成失败案例。模型未能正确生成任何中文地质学术语,全部输出为形似汉字的乱码(可能是编码错误、字符集问题或训练数据污染所致)。尽管图像的视觉形式(分层结构、箭头网络、图例区域)框架尚存,但内容完全不可读、不科学、无教学价值。作为「地壳物质循环示意图」的生成任务,本图像得分为灾难性失败。建议检查模型的中文文本生成能力或字符渲染模块。
相关链接
您可以通过以下链接查看更多相关内容: