Google: Gemini 2.5 Flash Image (Nano Banana) 在「初中化学元素周期表局部卡片生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:Google: Gemini 2.5 Flash Image (Nano Banana)
- 用例名称:初中化学元素周期表局部卡片生成
- 测试类型:图像生成
- 评测维度:教材插图
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张初中化学元素周期表局部卡片,展示前10号元素(氢到氖)。 每个元素方格内需包含以下四项信息: - 原子序数(如 1、2、3……) - 元素符号(如 H、He、Li……) - 中文名称(如 氢、氦、锂……) - 相对原子质量(如 1、4、7……) 排版要求: - 各元素方格大小一致,内容居中对齐 - 字符清晰可读,中英文字体规范
任务要求
AI 模型需要满足以下要求:
- 图像中包含第1至第10号元素(H 到 Ne)的方格卡片
- 每个方格内均含有原子序数、元素符号、中文名称、相对原子质量四项信息
- 元素符号拼写正确(H、He、Li、Be、B、C、N、O、F、Ne)
- 中文名称正确(氢、氦、锂、铍、硼、碳、氮、氧、氟、氖)
- 整体排版整齐,字符清晰可读
评测结果
综合得分
该模型在此用例的得分为:50.5 分(满分 100 分),未通过
基础难度评测结果
- 得分:50.5 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在文字准确性方面存在极其严重的问题,是本次评测的核心失败点。中文名称大量错误(氦→钲、碳→披、硼→萌、氖→疠),原子序数与相对原子质量字段混乱,且缺少Be和F两个必要元素,仅展示8个而非10个元素。排版结构基本可辨,字符印刷清晰,但内容错误之严重使得该图像作为化学教育卡片完全不可用。综合评分极低,主要因文字准确性权重50%且得分极差所致。 【GEMINI】作为一张教学性质的化学元素卡片,该图像在核心知识准确性上完全失败。文字内容充满了臆造的字符和错误的科学常识,排版也未能遵循基本的化学表格规范。虽然视觉上模拟了真实的摄影效果,但作为功能性图像,其内容完全不可用。 【KIMI】这是一张「看起来专业但内容灾难」的AI生成图像。模型在视觉呈现上掌握了印刷品的基本质感——清晰的字体、规整的边框、自然的摆放角度——但在核心的化学知识上全面崩溃。10个要求展示的元素缺失1个(氟),剩余9个方格中元素符号、中文名称、原子序数、相对原子质量四项信息几乎全军覆没,错误率高达80%以上。最讽刺的是,字符越清晰,错误越刺眼。这暴露了当前AI在「结构化知识+多字段约束」任务上的致命弱点:它能模仿视觉形式,却无法保证内容准确性。对于教育用途的化学元素周期表,这种错误是毁灭性的。
进阶难度评测结果
- 得分:38.6 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在视觉风格上有一定的周期表外观,配色基本符合教材风格,但在最核心的内容准确性上存在灾难性失败。几乎所有中文元素名称均为AI生成的乱码字符,标题也完全无法识别,原子序数位置出现字母而非数字,多个元素的相对原子质量错误,氩元素完全缺失,氯元素符号拼写错误。这张图像作为教学挂图完全不可用,会严重误导学生。AI模型在处理中文字符渲染和多字段结构化信息方面存在根本性缺陷。 【GEMINI】这是一张视觉上「伪装」成周期表但内容完全荒谬的图像。AI 仅模仿了周期表的宏观构图和配色,但在核心的科学数据、文字准确性以及严谨的逻辑排布上彻底失败。中文渲染依然处于乱码阶段,无法作为教育或参考资料使用。 【KIMI】这是一张典型的「AI幻觉」严重案例——图像在视觉形式上模仿了元素周期表的结构,但核心信息(文字内容)呈现系统性崩坏。模型似乎试图生成「看起来像中文的字符」而非真实的元素名称,导致大量无意义或错误的汉字组合(如「疫度」「贡检」「硕他」等)。周期表的结构骨架部分保留,但细节处充满错位、缺失和混乱。作为化学教学挂图,此图完全无法使用,属于「形式及格、内容失败」的代表性案例。建议重新生成并严格校验文字准确性。
困难难度评测结果
- 得分:38.0 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在整体布局框架和配色方案上有一定的正确思路,但由于AI在渲染中文字符方面存在严重缺陷,导致几乎所有中文内容(元素名称、周期序号、族序号、附注文字)均显示为乱码或错误字符,多个元素符号也出现错误或重复。这使得该图像完全不具备教学使用价值。文字准确性是本次生成最致命的失败点,严重拉低了整体质量。 【GEMINI】这是一张在科学严谨性上完全失败的图像。作为教学挂图,其核心的化学信息(符号、名称、序数、质量)几乎全部错误或为乱码,完全无法使用。模型在处理复杂的结构化文本信息和特定逻辑布局时表现极差,未能理解化学元素的排列规律及提示词中的颜色对应关系,且引入了干扰性的水印,属于严重的生成失败。 【KIMI】这是一张在文字生成方面完全失败的AI图像。模型在处理中文化学术语时表现出严重的「幻觉」现象,大量元素符号和中文名称被替换为形近乱码或无意义字符,周期序号和族序号更是彻底崩坏为无法识别的符号。结构布局上第一周期错位导致连锁错误,元素重复与缺失并存。虽然配色方案部分执行,但元素位置的混乱使得配色分类失去意义。水印干扰和底部乱码附注进一步降低了实用性。作为「适合课堂张贴使用」的化学教学挂图,此图像完全不合格,不仅无法使用,还可能对学生造成严重误导。建议模型在生成严谨科学图表时加强中文字符的约束机制,并增加专业术语的知识库校验。
相关链接
您可以通过以下链接查看更多相关内容: