qwen-image-max 在「初中化学元素周期表局部卡片生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:qwen-image-max
- 用例名称:初中化学元素周期表局部卡片生成
- 测试类型:图像生成
- 评测维度:教材插图
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张初中化学元素周期表局部卡片,展示前10号元素(氢到氖)。 每个元素方格内需包含以下四项信息: - 原子序数(如 1、2、3……) - 元素符号(如 H、He、Li……) - 中文名称(如 氢、氦、锂……) - 相对原子质量(如 1、4、7……) 排版要求: - 各元素方格大小一致,内容居中对齐 - 字符清晰可读,中英文字体规范
任务要求
AI 模型需要满足以下要求:
- 图像中包含第1至第10号元素(H 到 Ne)的方格卡片
- 每个方格内均含有原子序数、元素符号、中文名称、相对原子质量四项信息
- 元素符号拼写正确(H、He、Li、Be、B、C、N、O、F、Ne)
- 中文名称正确(氢、氦、锂、铍、硼、碳、氮、氧、氟、氖)
- 整体排版整齐,字符清晰可读
评测结果
综合得分
该模型在此用例的得分为:45.5 分(满分 100 分),未通过
基础难度评测结果
- 得分:45.5 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在文字准确性方面存在灾难性失败:几乎所有元素符号均为虚构,中文名称全部错误地显示为「氢」,原子序数混乱重复,相对原子质量不完整。图像仅保留了元素周期表卡片的视觉外壳,但核心化学信息内容几乎全部错误,完全无法作为化学教学参考材料使用。这是一次严重偏离提示词要求的生成结果。 【GEMINI】这是一张在视觉上试图模仿卡片但在内容上完全失败的AI生成图像。它完全无视了提示词中关于「前10号元素」和「准确性」的核心要求,充满了虚假的化学符号和重复的中文名称,属于典型的「幻觉」产物,完全不具备任何参考或教学价值。 【KIMI】该图像在化学知识准确性上呈现灾难级失败。模型似乎将元素周期表视为纯视觉图案而非结构化数据,导致原子序数、元素符号、中文名称、相对原子质量四项信息全部错位或虚构。尽管视觉清晰度尚可,但内容错误率极高,完全无法满足初中化学教学场景的基本需求。推测模型在训练时对化学元素的结构化关联学习不足,或提示词中的「前10号元素」约束被忽略,转而生成了看似周期表风格的随机字符组合。建议针对结构化知识生成任务加强约束机制。
进阶难度评测结果
- 得分:36.0 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在视觉风格上模仿了元素周期表的外观,但在内容准确性和结构正确性上几乎完全失败。20个元素的符号、中文名称、原子序数均存在根本性错误,相对原子质量数值完全缺失,周期表的行列结构也与标准周期表严重不符。这张图像仅具备元素周期表的「外形」,而不具备任何正确的化学信息内容,无法用于教学目的。 【GEMINI】该图像在视觉形式上模仿了挂图,但在核心内容——化学科学严谨性上完全失败。AI未能理解元素周期表的内在逻辑,生成的符号、名称和序数完全是随机字符的堆砌,属于典型的「虚假繁荣」,无法满足任何教学或展示需求。 【KIMI】这是一张在化学知识层面完全失败的AI生成图像。模型似乎完全不理解元素周期表的基本结构,将任务退化为「生成看起来像周期表的装饰图案」。所有关键化学信息(元素符号、中文名称、原子序数、排列顺序)几乎全部错误,仅保留了「有方格、有数字、有字母」的表面形式。这种「幻觉式生成」在严谨知识场景中极其危险——若学生以此学习,将获得完全错误的化学知识。排版和清晰度层面的技术执行尚可,但内容准确性崩塌导致整体价值极低。建议模型在生成知识密集型图表时,必须接入事实核查机制,而非仅凭视觉模式匹配。
困难难度评测结果
- 得分:30.7 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该AI生成图像在形式结构上模仿了元素周期表挂图的外观,但核心内容——元素符号、中文名称、原子序数、相对原子质量——几乎全部错误,均为AI虚构内容,与真实化学元素毫无对应关系。周期表结构严重违反标准(第一周期显示10个元素),族序号标注错误,周期标注存在错别字。这张图像作为化学教学材料完全不可用,会严重误导学生。仅在横版比例、右下角附注文字、方格内信息层次的形式模仿等少数方面满足要求,综合质量极差。 【GEMINI】这是一张视觉上具有欺骗性但内容完全错误的图像。虽然它模仿了挂图的外形和排版结构,但在核心的化学知识(符号、名称、序数、周期表布局)上出现了严重的幻觉和逻辑崩溃。作为教学工具,其准确性评分为零,完全无法使用。 【KIMI】该图像为典型的AI生成「幻觉」案例,模型完全未能理解化学周期表的基本结构与元素知识,生成了大量虚构的化学符号与无意义的中文名称。尽管视觉框架(横版挂图、网格布局、配色方案)大致模仿了教材风格,但核心内容——元素周期表——在结构、符号、名称、序数四个维度全部失效。提示词要求的「前20号元素」无一正确呈现,属于严重的内容级失败。排版层面的字号层次、信息字段也存在明显缺陷。整体而言,该图像不具备任何教学使用价值,仅可作为AI生成错误的典型案例。
相关链接
您可以通过以下链接查看更多相关内容: