Google: Gemini 2.5 Flash Image (Nano Banana) 在「地壳物质循环示意图生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：Google: Gemini 2.5 Flash Image (Nano Banana)
用例名称：地壳物质循环示意图生成
测试类型：图像生成
评测维度：教材插图

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一张地壳物质循环示意图。要求包含以下四个核心要素： - 岩浆 - 岩浆岩 - 沉积岩 - 变质岩用箭头连接四个要素，并在箭头旁标注对应的转化过程名称：「冷却凝固」、「外力作用」、「变质作用」、「重熔再生」。

任务要求

AI 模型需要满足以下要求：

图中包含「岩浆」、「岩浆岩」、「沉积岩」、「变质岩」四个节点，文字清晰可读
四个节点之间有箭头连接，方向正确
箭头旁标注有「冷却凝固」、「外力作用」、「变质作用」、「重熔再生」等转化过程名称
整体布局清晰，各要素不重叠

评测结果

综合得分

该模型在此用例的得分为：26.2 分（满分 100 分），未通过

基础难度评测结果

得分：26.2 分
通过状态：未通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

画面中展示了一张试图解释地质循环的科学示意图，整体采用米色背景，构图呈现出一种循环流动的过程。画面顶部是一个燃烧着火焰的岩浆池，中间是两座灰色的山脉，底部则是地壳剖面，展示了褶皱岩层和沉积岩块。青蓝色的箭头在这些元素之间连接，形成一个闭环。然而，这张图片具有非常明显的 AI 生成缺陷，主要体现在文字和逻辑上：画面中所有的中文标注均为毫无意义的乱码或臆造字（如“汭嫁房”、“淫徇房”等），完全无法阅读或理解其科学含义。英文单词如“Crust”和“Mantle”虽然拼写正确，但位置排布随意。此外，箭头的指向逻辑混乱，山脉与地层的衔接也缺乏真实的地质学依据，是一张典型的看似专业但内容完全错误的 AI 伪造示意图。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图在视觉构图和图形绘制方面有一定基础，循环结构的框架搭建尚可，图形元素也能对应不同岩石类型。然而，图像最核心的文字标注部分出现了灾难性的乱码问题——所有节点名称和转化过程标注均无法正常显示，完全不符合提示词的明确要求。这是一张在文字信息层面几乎完全失败的图像，尽管图形部分有所努力，但作为一张「地壳物质循环示意图」，其核心功能（信息传达）已完全丧失，综合评分极低。【GEMINI】这是一张视觉构图合格但内容完全失败的示意图。AI 在处理中文专业术语时产生了严重的幻觉，导致所有关键的科学标注均不可读或错误。作为教学或演示工具，该图像因其文字信息的彻底错误而完全不可用。【KIMI】这是一张典型的AI生成失败案例，模型在生成中文文本时出现了严重的「幻觉」现象——大量汉字被替换为形近但无意义的乱码字符，导致科学示意图的信息传递功能完全丧失。尽管图形元素的绘制有一定水准，但作为「地壳物质循环示意图」，其核心功能（清晰标注四个岩石类型及转化过程）彻底失败。从提示词符合度来看，四个核心要素名称和四个转化过程名称的准确率接近0%，属于严重不符合要求的生成结果。

进阶难度评测结果

得分：42.4 分
通过状态：未通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一张模拟地理科学风格的流程图，背景为淡米黄色。画面中心由四个彩色方框组成一个圆环路径，分别代表不同的物质状态：左上方是红色的火焰纹理，右上方是灰色的岩石纹理，右下方是黄色的地层纹理，左下方是蓝色的波浪纹理。方框之间由灰色的双向弧形箭头连接，箭头旁标注了说明文字。右下角有一个图例框，对颜色和名称进行了对应。这张图片具有明显的 AI 生成缺陷，主要体现在文字逻辑上。画面中所有的中文字符虽然笔画清晰，但大多是无法辨认的“伪汉字”或乱码组合，例如标题和方框内的标注均无实际含义，仅有右侧的“外力作用”字迹较为清晰。此外，流程图的逻辑指向性模糊，箭头与文字的排版略显随意，图例中的文字与上方方框内的文字也无法完全对应，属于典型的 AI 模拟图表视觉效果但缺乏实质内容的生成错误。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图在结构设计上具备地壳物质循环图的基本框架，环形路径、节点颜色区分、图例位置等形式要素均有体现，说明模型理解了图示的整体结构。然而，全图所有文字内容均为严重乱码，标题、节点名称、转化过程标注和图例文字无一可读，导致图像完全丧失了作为地理教学图示的实用价值。这是一张「形似而神失」的失败作品——视觉框架尚可，但核心内容（文字信息）完全错误。综合加权得分约为42分，属于「问题较多，明显与提示词有偏差」的范畴。【GEMINI】这是一张典型的「形似神散」的 AI 生成图像。虽然在视觉构图、色彩分布和图表框架上模仿了高中地理示意图的样式，但在核心的文字生成和地理科学逻辑上完全失败。所有的文字标注均为无意义的乱码，导致该图完全失去了作为教学工具的实用价值，属于严重的 AI 幻觉产物。【KIMI】这是一次严重的生成失败。模型在生成中文文本时出现系统性乱码，导致所有关键信息——标题、节点名称、转化标注、图例说明——全部不可读。尽管图像在形式上具备循环示意图的结构框架，但内容完全错误，无法作为教学材料使用。这反映了模型在处理中文地质学术语时的严重缺陷，可能是字符编码、训练数据或生成机制的问题。从教育用途角度，该图价值为零。

困难难度评测结果

得分：32.8 分
通过状态：未通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一张试图模仿科学流程图或技术原理图的 AI 生成图片。画面构图分为上下两层：上层背景为浅棕色，分布着黄色、蓝色和绿色的矩形方框；下层背景为砖红色，包含圆形图标和椭圆形气泡。各元素之间由实线和虚线箭头连接，右侧附有一个图例说明栏。画面整体色调明亮，逻辑结构看似严谨。然而，这张图片存在严重的 AI 生成缺陷，最显著的问题是文字完全不可读。画面中所有的汉字均为随机笔画组合而成的“伪汉字”，没有任何实际含义，标题、方框内的标签以及右侧的图例均是乱码。此外，部分线条连接逻辑混乱，箭头指向模糊，图例中的颜色圆点与左侧主体图形的颜色并不完全对应，属于典型的缺乏逻辑支撑的视觉模拟。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像在结构框架和视觉布局上有一定的设计意图，能够看出分层结构、节点颜色区分、主次箭头区分等设计思路。然而，图像存在灾难性的文字渲染失败问题——全图所有文字均为严重乱码，无一例外。标题、节点名称、路径标注、图例说明、底部文字全部无法正确读取，导致这张图作为「地壳物质循环示意图」完全失去教学价值和信息传达功能。这是AI生成图像中文字处理能力严重不足的典型案例，视觉框架的存在无法弥补文字内容的全面崩溃。综合评分极低。【GEMINI】这是一张典型的「形似神散」的 AI 生成图。从视觉构图上看，它完美复刻了教科书示意图的排版、分层和元素分布；但在核心功能——即知识传递上，由于 AI 对中文字符生成的严重缺陷，导致所有关键术语和逻辑标注变成了毫无意义的乱码。作为地理教学示意图，它是完全不合格的。【KIMI】这是一次严重的AI生成失败案例。模型未能正确生成任何中文地质学术语，全部输出为形似汉字的乱码（可能是编码错误、字符集问题或训练数据污染所致）。尽管图像的视觉形式（分层结构、箭头网络、图例区域）框架尚存，但内容完全不可读、不科学、无教学价值。作为「地壳物质循环示意图」的生成任务，本图像得分为灾难性失败。建议检查模型的中文文本生成能力或字符渲染模块。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

进阶难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

困难难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

相关链接

反馈评测问题