qwen-image-plus-2026-01-09 在「初中化学实验室仪器组合图生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：qwen-image-plus-2026-01-09
用例名称：初中化学实验室仪器组合图生成
测试类型：图像生成
评测维度：教材插图

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一张初中化学实验室桌面场景图。桌面上整齐排列以下仪器： - 烧杯 - 试管架（含若干试管） - 酒精灯 - 量筒 - 漏斗要求： - 每件仪器下方或侧面标注对应的中文名称 - 玻璃仪器体现基本的透明质感 - 画面整洁，仪器排列有序

任务要求

AI 模型需要满足以下要求：

画面中包含烧杯、试管架（含试管）、酒精灯、量筒、漏斗，共五类仪器
每件仪器均有对应的中文名称标注
玻璃仪器具备基本透明感，可与非玻璃仪器区分
仪器造型基本准确，可辨识
整体画面整洁，仪器排列有序

评测结果

综合得分

该模型在此用例的得分为：58.8 分（满分 100 分），未通过

基础难度评测结果

得分：58.8 分
通过状态：未通过

模型生成产物

该模型生成了以下图片：

AI 生成图片，模型：qwen-image-plus-2026-01-09 — 在新标签页中查看原图

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图整体场景氛围符合初中化学实验室桌面的基本预期，玻璃材质渲染是最大亮点。然而两项核心要求存在严重缺陷：其一，漏斗以鸡尾酒杯形态替代，造型完全不符合化学仪器标准；其二，所有中文标签均为不可读的伪汉字乱码，文字标注功能彻底失败——这是提示词中权重最高（35%）的要求之一。综合来看，图像在视觉美观度上表现尚可，但在提示词核心功能性要求的完成度上存在重大缺失。【GEMINI】该图像在视觉渲染（尤其是玻璃材质）上表现优异，但在逻辑理解和文字生成上存在严重缺陷。模型完全无法处理中文标注要求，且对特定化学仪器的形态认知存在偏差，将酒精灯和漏斗误认为日常灯具和餐具，未能满足教学/专业场景的准确性需求。【KIMI】该图像在仪器完整性维度出现严重偏差，量筒和漏斗两类仪器或错误变形或完全缺失；文字标注维度则呈现典型的AI生成失败——所有中文标签均为不可辨识的伪汉字，功能完全失效。玻璃材质表现尚可但不足以弥补前两项的重大缺陷。整体而言，模型未能准确理解提示词中「量筒」「漏斗」的具体形态要求，且在中文文字生成上存在根本性技术短板，导致图像作为「标注化学仪器」的实用价值极低。

进阶难度评测结果

得分：60.4 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】本图在仪器造型、玻璃材质和光影构图方面表现尚可，基本还原了初中化学实验室桌面场景。然而，文字标注是致命短板——所有中文标注均为无意义乱码，完全无法识别，这是AI文字生成能力不足的典型表现，直接导致「标注规范中文名称」这一核心要求彻底失败。量筒刻度数字也不够清晰。综合来看，图像视觉质量中等，但因文字标注完全失效，整体完成度大打折扣。【GEMINI】图像在视觉渲染层面（光影、材质）表现出色，达到了摄影级质感；但在逻辑理解与文字生成层面表现极差。量筒刻度完全不可读，且最核心的「中文标注」要求被模型以乱码形式敷衍，完全失去了教学或展示的实用价值。【KIMI】该图像在核心任务——中文标注上完全失败，所有文字均为不可辨识的AI伪汉字，这是不可接受的硬伤。量筒刻度乱码、试管数量缺失等问题进一步暴露模型对精确数量、文字生成、科学仪器细节的控制力薄弱。虽玻璃材质和光影有基础表现，但无法弥补关键要求的重大缺陷。整体属于「部分完成要求，有多处需要改进」偏下的水平，主要因文字标注的彻底失败而大幅拉低分数。

困难难度评测结果

得分：64.1 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像基本完成了场景构建，六类仪器均有出现，整体视觉效果较为写实。但存在几个关键性问题严重影响评分：最突出的是「量筒」被错误标注为「量杯」且出现两次，这是基础性文字错误；酒精灯造型与真实实验室酒精灯差异较大；量筒刻度折射效果缺失；标注字体非楷体。综合来看，图像在视觉呈现上有一定水准，但在细节准确性和文字标注规范性上存在明显不足，属于「部分完成要求」的水平。【GEMINI】这张图像在视觉氛围上具有一定的迷惑性，但在化学专业性和指令执行力上表现糟糕。模型完全混淆了酒精灯与煤油灯的构造，且在中文文字渲染和逻辑标注上出现了灾难性的幻觉。量筒这一核心教学仪器的缺失以及乱码标注，使其完全无法满足「高度写实初中实验室」的要求。【KIMI】该图像在视觉渲染层面有一定完成度，但作为科学教育图像存在致命的标注准确性问题。仪器名称与实物的对应关系严重混乱，「量杯」「锥形瓶」「酒精灯」「量筒」等基础化学仪器名称被错误分配，「洒管架」的错别字更是低级失误。这种标注错误对于教学场景具有误导性，科学准确性评分必须严厉扣分。玻璃光学效果与光照构图尚可，但无法弥补仪器识别与标注系统的结构性失败。建议重新核对仪器形态与标准名称的对应关系，修正所有标注错误后方可用于教育场景。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

AI 评审点评

进阶难度评测结果

模型生成产物

AI 评审点评

困难难度评测结果

模型生成产物

AI 评审点评

相关链接

反馈评测问题