qwen-image-2.0-pro 在「初中化学元素周期表局部卡片生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:qwen-image-2.0-pro
- 用例名称:初中化学元素周期表局部卡片生成
- 测试类型:图像生成
- 评测维度:教材插图
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张初中化学元素周期表局部卡片,展示前10号元素(氢到氖)。 每个元素方格内需包含以下四项信息: - 原子序数(如 1、2、3……) - 元素符号(如 H、He、Li……) - 中文名称(如 氢、氦、锂……) - 相对原子质量(如 1、4、7……) 排版要求: - 各元素方格大小一致,内容居中对齐 - 字符清晰可读,中英文字体规范
任务要求
AI 模型需要满足以下要求:
- 图像中包含第1至第10号元素(H 到 Ne)的方格卡片
- 每个方格内均含有原子序数、元素符号、中文名称、相对原子质量四项信息
- 元素符号拼写正确(H、He、Li、Be、B、C、N、O、F、Ne)
- 中文名称正确(氢、氦、锂、铍、硼、碳、氮、氧、氟、氖)
- 整体排版整齐,字符清晰可读
评测结果
综合得分
该模型在此用例的得分为:41.3 分(满分 100 分),未通过
基础难度评测结果
- 得分:41.3 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张模仿化学元素周期表风格的网格图,背景呈现出复古的淡黄色羊皮纸质感。画面由 12 个排列整齐的矩形方框组成,分为三行四列。每个方框内都包含黑色的手绘风格线条、拉丁字母符号以及中文文字。 然而,这张图片存在明显的 AI 生成缺陷,主要体现在文字逻辑的混乱与错误。首先,方框上方的中文出现了大量错别字和无意义的组合,如“原子”被误写为“原孑”或“如子”,且后面的数字与化学常识完全不符。其次,中间的化学符号极不规范,出现了如“Rc”、“Hc”等现实中不存在的元素符号,甚至在最后一个方框中直接出现了一个变形的汉字“氘”。底部的中文统一显示为“如氢……”,重复且无实际意义。整体构图虽然规整,但内容完全是随机生成的乱码,不具备任何科学参考价值。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在视觉结构上具备元素周期表卡片的基本框架,但内容准确性极差。大量元素符号错误(Rg、Tn、Rc、Hc、Re等均非前10号元素),中文名称和相对原子质量完全缺失,原子序数标注混乱且使用了错误的占位符文字「如子X……」。四项必要信息中仅元素符号部分正确(且仅3个),其余三项均严重失败。这张图像几乎不符合提示词的核心要求,属于严重失败级别。 【GEMINI】这是一次彻底的失败。模型完全无法理解化学元素周期表的严谨逻辑,不仅未能提供正确的元素符号和中文名称,连最基本的原子序数对应关系都出现了严重偏差。文字渲染充满了 AI 典型的「伪文字」特征,将「原子」误写为各种畸形字符,且完全忽略了相对原子质量这一关键字段的要求。该图像仅在构图形式上模仿了表格,内容毫无参考价值。 【KIMI】这是一张在视觉风格上模仿复古化学卡片、但内容完全崩坏的AI生成图像。模型在手绘质感、纸张纹理等表面特征上表现尚可,但在核心的化学知识准确性上呈现灾难性失败——元素符号、中文名称、原子序数、相对原子质量四项关键信息几乎全部错误。错误模式显示模型对化学元素周期表缺乏基本理解:将「原子」误写为「如子」「㛢子」,用「如氢」批量填充所有元素名称,编造不存在的元素符号,且原子序数序列毫无逻辑。这种「表面像、内核错」的生成结果是AI图像生成在结构化知识任务上的典型失败案例,提示词中的严谨表格要求被完全忽视。
进阶难度评测结果
- 得分:32.2 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张模仿化学元素周期表的图表,整体背景为米白色,元素方格则填充为浅蓝色,并带有深蓝色的边框。每个方格内都包含原子序数、化学符号以及占位性质的中文文本(“中文名称”和“相对原子质量”)。 这张图片存在明显的 AI 生成缺陷,主要体现在科学逻辑和文字排版上。首先,元素符号和原子序数完全错误且随机,例如出现了“Fil”、“Dir”、“Ric”等现实中不存在的符号,且同一个符号(如“K”、“Re”、“Ca”)在不同位置多次重复。其次,数字逻辑混乱,原子序数并非按顺序排列,甚至出现了形状扭曲的数字(如“132”和模糊的“30”)。此外,文字排版存在重叠和错位,部分字母如“Cox”中的字符相互挤压,中文占位符也只是机械重复,缺乏实际内容。整体构图虽然模仿了周期表的阶梯状结构,但完全不具备科学参考价值。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在形式上模仿了元素周期表的外观,但内容几乎完全错误。元素符号、原子序数均为虚构或错误数据,中文名称和相对原子质量栏全部为占位文字未填入实际内容,周期表的行列结构也与标准不符。这是一次严重失败的生成,仅在视觉风格(配色、方格形式)上有极少量可取之处,核心任务要求几乎全部未完成。 【GEMINI】这是一张在科学严谨性上完全失败的生成图像。模型完全无法理解化学元素周期表的逻辑结构,也未能遵循提示词要求填充具体的文字信息,仅仅生成了一个充满占位符和随机错误符号的「表格外壳」。作为教学挂图,其内容具有严重的误导性,属于严重的生成失败。 【KIMI】这是一次严重的AI生成失败案例。模型完全未能理解「元素周期表」的基本科学概念,生成了大量虚构元素符号和混乱的原子序数,同时中文名称和相对原子质量字段完全未填充实际数据。尽管视觉框架(方格、边框、层次)有一定形式感,但核心内容——化学元素的准确性——全面崩溃。此图像若用于教学将产生严重误导,仅字符清晰度一项勉强合格。建议模型在生成科学图表时加强事实核查机制,或明确拒绝无法准确生成的专业内容。
困难难度评测结果
- 得分:32.9 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中展示了一张模仿化学元素周期表的图表,背景呈现出淡淡的米黄色复古纸张质感。图表由多个彩色方格组成,主要使用了浅绿、浅黄、浅蓝和浅紫色来区分不同的区域。每个方格内都包含数字、英文字母缩写以及类似汉字的字符。构图整齐,文字排列看似严谨,左侧和上方标注有“第一周期”、“第IA族”等分类标签。 然而,这张图片存在明显的 AI 生成缺陷,属于典型的“伪科学”逻辑错误。首先,表中的文字内容完全混乱,所谓的“中文名称”大多是无法辨认的乱码或扭曲的错别字;其次,元素符号和原子序数完全不符合现实科学,例如出现了重复的符号或逻辑错误的数字排列;此外,表格的结构也与真实的周期表大相径庭,部分边框线条粗细不一,文字甚至超出了方格边界。整体而言,这是一张视觉上模仿周期表形式,但内容完全错误且无实际意义的 AI 幻觉图像。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在结构框架和视觉设计方面有基本尝试,但核心内容——化学元素信息——几乎全部错误。20个元素的符号、中文名称、原子序数、相对原子质量无一正确,族序号标注格式也存在严重错误。这是一张「形似而神非」的周期表:外观上有周期表的轮廓,但所有实质性的化学信息都是AI生成的错误内容。作为一张用于课堂教学的化学挂图,这样的错误是根本性的、不可接受的。图像完全不具备教学使用价值,甚至可能误导学生。 【GEMINI】这是一张视觉上「像」周期表但内容完全「荒谬」的图像。模型完全无法处理化学学科的严谨逻辑,文字信息准确率为零,结构布局也未遵循提示词中的特定指令。作为教学挂图,该图像具有严重的误导性,属于视觉表现尚可但功能性彻底失败的作品。 【KIMI】这是一张在文字内容层面完全失败的AI生成图像。模型似乎理解了「周期表」「四色方格」「多层文字」的形式要求,但完全未能掌握化学元素的具体知识,导致所有元素符号、中文名称、原子序数均为胡编乱造的乱码或错误信息。对于一张以「初中化学教学挂图」为目标的图像而言,这种程度的错误使其完全丧失使用价值。结构布局、周期数量、族列对齐等基础框架同样崩溃。唯一可取之处仅剩基本的视觉框架(边框、网格、横版比例)。综合评分约24分,属于严重失败级别。
相关链接
您可以通过以下链接查看更多相关内容: