qwen-image-2.0-pro 在「初中化学实验室仪器组合图生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:qwen-image-2.0-pro
  • 用例名称:初中化学实验室仪器组合图生成
  • 测试类型:图像生成
  • 评测维度:教材插图

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张初中化学实验室桌面场景图。 桌面上整齐排列以下仪器: - 烧杯 - 试管架(含若干试管) - 酒精灯 - 量筒 - 漏斗 要求: - 每件仪器下方或侧面标注对应的中文名称 - 玻璃仪器体现基本的透明质感 - 画面整洁,仪器排列有序

任务要求

AI 模型需要满足以下要求:

  1. 画面中包含烧杯、试管架(含试管)、酒精灯、量筒、漏斗,共五类仪器
  2. 每件仪器均有对应的中文名称标注
  3. 玻璃仪器具备基本透明感,可与非玻璃仪器区分
  4. 仪器造型基本准确,可辨识
  5. 整体画面整洁,仪器排列有序

评测结果

综合得分

该模型在此用例的得分为:72.3 分(满分 100 分),已通过

基础难度评测结果

  • 得分:72.3 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一个明亮的实验室场景,黑色实验台上整齐排列着五组玻璃仪器。从左至右依次是一个烧杯、一排插在白色架子上的试管、一盏装有透明液体的酒精灯、一个带有刻度的量筒以及一个漏斗。背景是模糊的教室环境,可以看到蓝色的窗帘和一块写有粉笔字的绿色黑板。光线从左侧窗户射入,使玻璃器皿显得晶莹剔透。 然而,画面中存在明显的 AI 生成缺陷。最显著的是每个仪器下方对应的白色手写体文字,这些文字虽然看起来像汉字,但实际上全是无法辨认的乱码或错别字,例如“漏斗”被写成了形似“漏紫”的错误字符。此外,烧杯和量筒上的刻度线模糊且不规范,量筒上方的品牌标识也是无意义的乱码字母。试管架的结构在透视上略显僵硬,部分线条衔接不够自然,体现了典型的 AI 逻辑错误。

图中展示了一个明亮的实验室场景,黑色实验台上整齐排列着五组玻璃仪器。从左至右依次是一个烧杯、一排插在白色架子上的试管、一盏装有透明液体的酒精灯、一个带有刻度的量筒以及一个漏斗。背景是模糊的教室环境,可以看到蓝色的窗帘和一块写有粉笔字的绿色黑板。光线从左侧窗户射入,使玻璃器皿显得晶莹剔透。

然而,画面中存在明显的 AI 生成缺陷。最显著的是每个仪器下方对应的白色手写体文字,这些文字虽然看起来像汉字,但实际上全是无法辨认的乱码或错别字,例如“漏斗”被写成了形似“漏紫”的错误字符。此外,烧杯和量筒上的刻度线模糊且不规范,量筒上方的品牌标识也是无意义的乱码字母。试管架的结构在透视上略显僵硬,部分线条衔接不够自然,体现了典型的 AI 逻辑错误。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在仪器完整性和玻璃材质表现方面表现优秀,五类仪器全部正确呈现且造型写实,玻璃透明质感自然。然而,文字标注是最大的失败点——五个中文名称标注中有四个严重错误,仅「漏斗」末字有误但尚可辨识,其余标注完全无法识别为正确汉字。这一核心缺陷严重影响了图像的实用价值,因为提示词明确要求「标注对应的中文名称」,而这一要求基本未能实现。综合来看,图像的视觉渲染能力强,但中文文字生成能力存在根本性缺陷。 【GEMINI】该图像在视觉渲染和物体建模方面表现极佳,玻璃质感和实验室氛围营造到位。然而,在文字生成这一关键任务上彻底失败,所有的中文标注均为无效乱码,严重影响了提示词的完成度。 【KIMI】该图像在仪器形态布局上勉强达标,但文字标注维度出现灾难性失败——五处中文名称全部错误,这是AI图像生成中典型的「文字幻觉」问题。作为「标注对应中文名称」的核心要求,此缺陷直接判定任务未完成。玻璃材质表现平庸,仅达及格线。综合而言,模型在理解「准确文字标注」这一关键指令上完全失效,属于典型的「形似神不似」案例。

进阶难度评测结果

  • 得分:65.1 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一个实验室桌面上的各种化学实验器材,背景是模糊的窗户。画面左侧是一个盛有亮蓝色液体的烧杯,中间是一个白色试管架,上面插着三支装有不同高度红色液体的试管。试管架前方有一盏点燃的酒精灯,火苗呈明亮的橙黄色。右侧则是一个装有透明液体的量筒,以及一个固定在铁架台上的玻璃漏斗。整体色调明亮,光影感较强。 然而,画面中存在明显的 AI 生成缺陷:首先,图片上方分布着几组黑色的手写体文字,如“浸岵”、“税菱”和“捕处”,这些词汇并非真实的中文词组,且笔画扭曲,属于典型的 AI 乱码。其次,量筒上的刻度线模糊且不规则,顶部的文字标识也是无法辨认的符号。此外,酒精灯的灯芯与火焰的衔接处略显生硬,铁架台的底座质感也显得有些不自然。

图中展示了一个实验室桌面上的各种化学实验器材,背景是模糊的窗户。画面左侧是一个盛有亮蓝色液体的烧杯,中间是一个白色试管架,上面插着三支装有不同高度红色液体的试管。试管架前方有一盏点燃的酒精灯,火苗呈明亮的橙黄色。右侧则是一个装有透明液体的量筒,以及一个固定在铁架台上的玻璃漏斗。整体色调明亮,光影感较强。

然而,画面中存在明显的 AI 生成缺陷:首先,图片上方分布着几组黑色的手写体文字,如“浸岵”、“税菱”和“捕处”,这些词汇并非真实的中文词组,且笔画扭曲,属于典型的 AI 乱码。其次,量筒上的刻度线模糊且不规则,顶部的文字标识也是无法辨认的符号。此外,酒精灯的灯芯与火焰的衔接处略显生硬,铁架台的底座质感也显得有些不自然。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】本图在仪器造型渲染和玻璃材质表现方面达到了较高水准,酒精灯火焰、烧杯蓝色液体等细节尤为出色,整体场景具有较强的真实感。然而,文字标注是本图最致命的缺陷——三个标注全部为错误汉字(「浸怡」「锐菱」「捅处」),且酒精灯和漏斗完全未标注,严重偏离提示词对「规范中文名称标注」的核心要求。此外量筒刻度数字因景深模糊无法辨读,也未达标。综合来看,图像的视觉渲染能力较强,但中文文字生成能力存在根本性缺陷,导致整体评分被大幅拉低。 【GEMINI】该图像在视觉氛围和玻璃材质渲染上表现尚可,但在逻辑准确性和文字生成方面存在严重缺陷。最核心的问题在于完全无法生成准确的中文标注,且在执行「4支试管」这一数量指令时出错。此外,液体液面的物理逻辑错误(倾斜)也是专业摄影/写实视角下的重大扣分项。 【KIMI】该图像在基础场景构建上具备一定能力,但在关键要求上存在系统性失败。最核心的中文文字标注完全为乱码,量筒刻度同样乱码,表明模型中文生成能力存在根本缺陷;仪器细节如试管数量、漏斗夹持方式、火焰光影均未满足提示词要求。作为「初中化学实验室」教学场景图,文字标注的错误使其完全失去实用价值。建议评分区间:50-60分,属于「问题较多,明显与提示词有偏差」层级。

困难难度评测结果

  • 得分:64.7 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一个实验室桌面,上面整齐排列着各种玻璃实验仪器,背景是明亮的窗户,整体色调清新。画面左侧是一个木制试管架,插着六支试管,其中三支分别装有红、黄、绿色的液体;前方是一个盛有蓝色液体的烧杯。中心位置是一盏点燃的酒精灯,火苗呈橙蓝色。右侧立着一个装有透明液体的量筒,以及一套由铁架台固定的漏斗和锥形瓶组合。画面中漂浮着黑色手写体中文字样,标注着仪器名称。 作为一张 AI 生成的图片,存在明显的逻辑和细节错误:量筒上的刻度数字排列混乱,出现了「100、70、80、60」这样不符合逻辑的降序和跳跃;漏斗的下端管部悬空,并没有插入下方的锥形瓶口中,而是偏向了一侧;酒精灯的灯芯结构模糊,火苗与灯头的连接处缺乏真实的物理质感;此外,背景窗框的线条在穿过玻璃仪器时出现了轻微的折射扭曲异常。

图中展示了一个实验室桌面,上面整齐排列着各种玻璃实验仪器,背景是明亮的窗户,整体色调清新。画面左侧是一个木制试管架,插着六支试管,其中三支分别装有红、黄、绿色的液体;前方是一个盛有蓝色液体的烧杯。中心位置是一盏点燃的酒精灯,火苗呈橙蓝色。右侧立着一个装有透明液体的量筒,以及一套由铁架台固定的漏斗和锥形瓶组合。画面中漂浮着黑色手写体中文字样,标注着仪器名称。

作为一张 AI 生成的图片,存在明显的逻辑和细节错误:量筒上的刻度数字排列混乱,出现了「100、70、80、60」这样不符合逻辑的降序和跳跃;漏斗的下端管部悬空,并没有插入下方的锥形瓶口中,而是偏向了一侧;酒精灯的灯芯结构模糊,火苗与灯头的连接处缺乏真实的物理质感;此外,背景窗框的线条在穿过玻璃仪器时出现了轻微的折射扭曲异常。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像整体呈现了一个较为真实的化学实验室桌面场景,仪器种类齐全,构图和光照效果较好。但存在几个关键性缺陷:量筒刻度顺序混乱是最严重的科学错误;所有标注均缺少引线连接;酒精灯火焰层次不符合要求(缺少淡蓝色外焰);标注字体非楷体。这些问题集中在细节准确性和标注规范性两个维度,导致整体评分中等偏下。图像的摄影质感和玻璃光学效果是相对较强的方面。 【GEMINI】这张图像在宏观氛围上捕捉到了化学实验室的感觉,但在严谨的科学仪器细节和文字排版逻辑上表现糟糕。作为一张教学或写实意图的图像,量筒刻度的逻辑错误和标注形式的完全偏离是致命伤,未能满足提示词中关于『规范标注』和『高度写实』的核心要求。 【KIMI】该图像作为「高度写实」的化学实验室场景存在显著差距。核心问题在于:标注系统完全缺失引线且字体错误,漏斗与锥形瓶的装配关系错误,量筒光学效果与液面位置双失败,酒精灯火焰结构违背物理常识。这些并非细节瑕疵,而是对提示词明确要求的直接违背。模型在复杂场景的多约束满足能力上表现不足,尤其文字排版与仪器交互关系方面需要重大改进。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...