混元生图 3.0 在「初中化学元素周期表局部卡片生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:混元生图 3.0
- 用例名称:初中化学元素周期表局部卡片生成
- 测试类型:图像生成
- 评测维度:教材插图
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张初中化学元素周期表局部卡片,展示前10号元素(氢到氖)。 每个元素方格内需包含以下四项信息: - 原子序数(如 1、2、3……) - 元素符号(如 H、He、Li……) - 中文名称(如 氢、氦、锂……) - 相对原子质量(如 1、4、7……) 排版要求: - 各元素方格大小一致,内容居中对齐 - 字符清晰可读,中英文字体规范
任务要求
AI 模型需要满足以下要求:
- 图像中包含第1至第10号元素(H 到 Ne)的方格卡片
- 每个方格内均含有原子序数、元素符号、中文名称、相对原子质量四项信息
- 元素符号拼写正确(H、He、Li、Be、B、C、N、O、F、Ne)
- 中文名称正确(氢、氦、锂、铍、硼、碳、氮、氧、氟、氖)
- 整体排版整齐,字符清晰可读
评测结果
综合得分
该模型在此用例的得分为:28.5 分(满分 100 分),未通过
基础难度评测结果
- 得分:28.5 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张具有设计感的图表或指示牌,背景采用了柔和的浅粉色。画面上方有一行醒目的黑色大字,下方则排列着两行类似卡片的白色方块,每个方块内包含数字、字母及符号。整体构图规整,色调清新简洁。然而,这张图片存在明显的 AI 生成缺陷:最上方的黑色汉字虽然形似中文,但实际上是无法辨认的“伪汉字”,笔画扭曲且逻辑混乱。下方的白色卡片中,文字和数字也出现了严重的错误,例如字母“H”、“S”、“B”与模糊的乱码混杂在一起,部分数字如“7-613”排版异常,且出现了两个编号为“3”的卡片,逻辑并不连贯。卡片中间的红色横条内,原本应是说明文字的地方全是不成形的破碎笔画,完全无法阅读。这些特征表明该图片是由 AI 模拟人类排版视觉效果而生成的,并不具备实际的信息传递功能。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像几乎完全未能满足提示词要求。元素符号、中文名称、原子序数、相对原子质量四项核心信息均存在严重错误或乱码,10个元素也未完整呈现。中文字符渲染能力极差,标题内容与主题无关。这是一次严重失败的生成,得分应处于极低区间。 【GEMINI】这是一次严重的生成失败。模型未能理解「化学元素周期表」的逻辑结构,不仅无法输出正确的化学知识,连最基本的字符渲染能力也未达到及格线。图像中的文字呈现为完全不可读的乱码,完全无法用于任何教学或参考场景。 【KIMI】这是一张在文字准确性上彻底失败的AI生成图像。模型似乎对中文字符的语义理解和化学符号的固定搭配完全没有掌握,产生了大量「形似但义非」的幻觉字符。标题、元素符号、中文名称、原子质量四大信息维度几乎全军覆没,唯一正确的只有H元素的符号和序号1。排版上虽有基本的网格意识,但编号逻辑的混乱和元素数量的缺失使其无法满足「展示前10号元素」的基本要求。这张图像若作为教学材料使用,将造成严重的知识误导。建议模型需强化对固定术语(如化学元素名)的记忆约束,以及多语言混合场景下的字符渲染稳定性。
进阶难度评测结果
- 得分:25.4 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张模仿化学元素周期表风格的图表。背景以浅蓝色和白色为主,结构由多行多列的矩形方格组成。每个方格内都包含类似化学符号的英文字母组合,以及上方和下方的文字标注。整体构图规整,色调清冷,给人一种科学或技术文档的视觉印象。 然而,画面中存在明显的 AI 生成缺陷,主要体现在文字内容的逻辑混乱。虽然图表中的字符看起来像汉字、英文和数字,但仔细观察会发现,绝大多数汉字都是由笔画胡乱堆砌而成的“伪汉字”,无法辨认含义;英文单词如“OmniVetus”和方格内的符号(如 Fii、Cis、Bat 等)也并非真实的化学元素。此外,部分线条边缘模糊,数字排列规律不明,且左上角的蓝色色块中文字重叠严重。这些特征表明该图片是 AI 模拟人类图表结构而生成的视觉素材,并不具备实际的阅读或参考价值。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像是一次严重失败的生成尝试。虽然在视觉形式上模仿了周期表的网格布局和配色风格,但核心内容——元素符号、中文名称、原子序数、相对原子质量——全部错误或无法辨认。AI模型显然无法正确渲染化学元素周期表的专业内容,生成了大量虚构的元素符号和乱码汉字。周期表的行列结构也完全不符合标准(第一周期应为2个元素,实际显示约8个)。这张图像作为教学挂图完全不可用,甚至可能误导学生。综合加权得分约为15分,属于严重失败级别。 【GEMINI】这是一次彻底的生成失败。模型完全无法处理需要严谨逻辑和特定知识库(化学元素周期表)的排版任务。图像仅在视觉形式上模仿了表格,但核心内容完全脱离现实,无法作为任何教学或参考用途。 【KIMI】这是一张在化学教育场景下完全失败的AI生成图像。模型似乎完全没有理解「元素周期表」的基本概念,而是生成了一张充满乱码的伪表格。所有20个元素的核心信息(符号、名称、序数、质量)100%错误,周期表结构概念混乱,顶部还出现了明显的训练数据污染痕迹(「柯筌」「OmniViews」)。唯一可称之处是字符本身没有严重模糊,但内容错误使这一优点毫无意义。此图像若用于教学将造成严重误导,建议模型在结构化知识渲染和中文-化学符号对应关系上进行根本性改进。
困难难度评测结果
- 得分:24.8 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张模仿化学元素周期表风格的图表,整体呈现为由多个彩色方格组成的矩形矩阵。色调以柔和的低饱和度色彩为主,包括浅蓝、淡黄、浅绿、粉紫和米白色。构图规整,上方分布着长条状的分类色块,下方则是密集的网格,每个格子内都填充了类似文字和数字的符号。 然而,画面存在明显的 AI 生成缺陷:首先,图表中的文字完全无法辨认,所有的汉字、英文字母和数字都发生了严重的扭曲和变形,呈现出一种似是而非的“乱码”感。其次,表格的逻辑结构混乱,线条交汇处不够严谨,部分数字的排列毫无规律。此外,右下角的文字标签也出现了重叠和模糊现象。整张图虽然在视觉形式上模仿了科学图表,但实际上并不包含任何真实的学术信息或可读内容。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像是一次严重失败的生成结果。AI模型在文字渲染方面出现了灾难性的幻觉问题,所有元素符号、中文名称、原子序数均为无意义的伪字符混合体,完全无法传达正确的化学信息。周期表的结构布局虽有基本的行列形态,但与标准周期表的严格要求差距极大。唯一值得肯定的是整体横版比例和多色背景分类的设计意图。该图像不具备任何教学实用价值,综合得分极低。 【GEMINI】这是一次严重的生成失败。模型完全未能理解化学元素周期表的专业属性,将严谨的科学图表处理成了充满乱码的抽象图形。在文字准确性、结构逻辑和配色规范上均未达到及格线,无法用于任何教学场景。 【KIMI】这是一张典型的AI生成失败案例,模型在严谨表格结构与多字段文字渲染任务上完全失控。图像呈现严重的文本幻觉(gibberish text)现象,所有化学专业信息——元素符号、中文名称、原子序数、族周期序号——均为无意义乱码,导致核心功能完全丧失。周期表结构、排版规范、附注文字同样全面崩溃。该图像不具备任何教学使用价值,若张贴于课堂将造成严重误导。建议模型在结构化表格生成与专业术语准确性方面进行根本性改进。
相关链接
您可以通过以下链接查看更多相关内容: