qwen-image-plus-2026-01-09 在「初中化学实验室仪器组合图生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:qwen-image-plus-2026-01-09
  • 用例名称:初中化学实验室仪器组合图生成
  • 测试类型:图像生成
  • 评测维度:教材插图

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张初中化学实验室桌面场景图。 桌面上整齐排列以下仪器: - 烧杯 - 试管架(含若干试管) - 酒精灯 - 量筒 - 漏斗 要求: - 每件仪器下方或侧面标注对应的中文名称 - 玻璃仪器体现基本的透明质感 - 画面整洁,仪器排列有序

任务要求

AI 模型需要满足以下要求:

  1. 画面中包含烧杯、试管架(含试管)、酒精灯、量筒、漏斗,共五类仪器
  2. 每件仪器均有对应的中文名称标注
  3. 玻璃仪器具备基本透明感,可与非玻璃仪器区分
  4. 仪器造型基本准确,可辨识
  5. 整体画面整洁,仪器排列有序

评测结果

综合得分

该模型在此用例的得分为:58.8 分(满分 100 分),未通过

基础难度评测结果

  • 得分:58.8 分
  • 通过状态:未通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:qwen-image-plus-2026-01-09
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图整体场景氛围符合初中化学实验室桌面的基本预期,玻璃材质渲染是最大亮点。然而两项核心要求存在严重缺陷:其一,漏斗以鸡尾酒杯形态替代,造型完全不符合化学仪器标准;其二,所有中文标签均为不可读的伪汉字乱码,文字标注功能彻底失败——这是提示词中权重最高(35%)的要求之一。综合来看,图像在视觉美观度上表现尚可,但在提示词核心功能性要求的完成度上存在重大缺失。 【GEMINI】该图像在视觉渲染(尤其是玻璃材质)上表现优异,但在逻辑理解和文字生成上存在严重缺陷。模型完全无法处理中文标注要求,且对特定化学仪器的形态认知存在偏差,将酒精灯和漏斗误认为日常灯具和餐具,未能满足教学/专业场景的准确性需求。 【KIMI】该图像在仪器完整性维度出现严重偏差,量筒和漏斗两类仪器或错误变形或完全缺失;文字标注维度则呈现典型的AI生成失败——所有中文标签均为不可辨识的伪汉字,功能完全失效。玻璃材质表现尚可但不足以弥补前两项的重大缺陷。整体而言,模型未能准确理解提示词中「量筒」「漏斗」的具体形态要求,且在中文文字生成上存在根本性技术短板,导致图像作为「标注化学仪器」的实用价值极低。

进阶难度评测结果

  • 得分:60.4 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:qwen-image-plus-2026-01-09
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】本图在仪器造型、玻璃材质和光影构图方面表现尚可,基本还原了初中化学实验室桌面场景。然而,文字标注是致命短板——所有中文标注均为无意义乱码,完全无法识别,这是AI文字生成能力不足的典型表现,直接导致「标注规范中文名称」这一核心要求彻底失败。量筒刻度数字也不够清晰。综合来看,图像视觉质量中等,但因文字标注完全失效,整体完成度大打折扣。 【GEMINI】图像在视觉渲染层面(光影、材质)表现出色,达到了摄影级质感;但在逻辑理解与文字生成层面表现极差。量筒刻度完全不可读,且最核心的「中文标注」要求被模型以乱码形式敷衍,完全失去了教学或展示的实用价值。 【KIMI】该图像在核心任务——中文标注上完全失败,所有文字均为不可辨识的AI伪汉字,这是不可接受的硬伤。量筒刻度乱码、试管数量缺失等问题进一步暴露模型对精确数量、文字生成、科学仪器细节的控制力薄弱。虽玻璃材质和光影有基础表现,但无法弥补关键要求的重大缺陷。整体属于「部分完成要求,有多处需要改进」偏下的水平,主要因文字标注的彻底失败而大幅拉低分数。

困难难度评测结果

  • 得分:64.1 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:qwen-image-plus-2026-01-09
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像基本完成了场景构建,六类仪器均有出现,整体视觉效果较为写实。但存在几个关键性问题严重影响评分:最突出的是「量筒」被错误标注为「量杯」且出现两次,这是基础性文字错误;酒精灯造型与真实实验室酒精灯差异较大;量筒刻度折射效果缺失;标注字体非楷体。综合来看,图像在视觉呈现上有一定水准,但在细节准确性和文字标注规范性上存在明显不足,属于「部分完成要求」的水平。 【GEMINI】这张图像在视觉氛围上具有一定的迷惑性,但在化学专业性和指令执行力上表现糟糕。模型完全混淆了酒精灯与煤油灯的构造,且在中文文字渲染和逻辑标注上出现了灾难性的幻觉。量筒这一核心教学仪器的缺失以及乱码标注,使其完全无法满足「高度写实初中实验室」的要求。 【KIMI】该图像在视觉渲染层面有一定完成度,但作为科学教育图像存在致命的标注准确性问题。仪器名称与实物的对应关系严重混乱,「量杯」「锥形瓶」「酒精灯」「量筒」等基础化学仪器名称被错误分配,「洒管架」的错别字更是低级失误。这种标注错误对于教学场景具有误导性,科学准确性评分必须严厉扣分。玻璃光学效果与光照构图尚可,但无法弥补仪器识别与标注系统的结构性失败。建议重新核对仪器形态与标准名称的对应关系,修正所有标注错误后方可用于教育场景。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...