混元生图 3.0 在「工业合成氨流程图生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:混元生图 3.0
- 用例名称:工业合成氨流程图生成
- 测试类型:图像生成
- 评测维度:教材插图
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张工业合成氨的工艺流程简图。 要求: - 流程图中包含以下组件框:「原料气净化」→「压缩机」→「合成塔」→「冷凝器」 - 各组件之间用箭头连接,表示物料流向 - 在合成塔对应的箭头或框内标注中文反应条件:「高温、高压、催化剂」 - 整体布局清晰,文字可读
任务要求
AI 模型需要满足以下要求:
- 流程图包含「原料气净化」「压缩机」「合成塔」「冷凝器」四个组件框
- 各组件之间有箭头连接且方向正确(从左至右或从上至下)
- 合成塔处标注了「高温、高压、催化剂」等中文反应条件
- 文字清晰可读,无明显遮挡或重叠
- 整体画面整洁,布局合理
评测结果
综合得分
该模型在此用例的得分为:15.0 分(满分 100 分),未通过
基础难度评测结果
- 得分:15.0 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一个在纯灰色背景下的工业管道系统示意图。画面由银灰色的金属管道、连接件以及三个白色的矩形标识牌组成。管道布局呈现出一种循环连接的结构,其中左侧有一个较小的标识牌,右侧上下各有一个较大的标识牌。管道之间通过弯头和法兰连接,下方的一段管道上还套有一个亮蓝色的圆柱形塑料组件,为单调的金属色调增添了一抹色彩。整体构图简洁,光影处理模拟了真实的金属质感。 然而,画面中存在明显的 AI 生成缺陷:最显著的问题在于标识牌上的文字,虽然看起来像汉字,但实际上是无法辨认、无意义的乱码和臆造字符,完全不符合中文语法和字形规范。此外,管道的逻辑连接也存在异常,例如右侧垂直管道的交汇处结构模糊,部分细小的管道支架在空间透视上显得生硬且不合理,缺乏实际的工程逻辑。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像严重偏离提示词要求。模型生成了一张工业管道系统的三维渲染效果图,而非合成氨工艺流程简图。四个关键组件框全部缺失,中文文字全为乱码,无任何箭头指示流程方向,「高温、高压、催化剂」等核心标注完全不存在。这是一次几乎完全失败的生成,仅在视觉渲染质量上有一定表现,但与任务目标毫无关联。 【GEMINI】这是一次严重的生成失败。模型完全未能理解「工业流程图」的语义要求,不仅组件缺失、逻辑混乱,生成的文字更是毫无意义的乱码。该图像无法作为任何形式的工程参考,仅能作为一种抽象的工业风格装饰图。 【KIMI】这是一次典型的AI文本渲染失败案例。模型在理解中文语义和化工专业知识方面完全崩溃,生成了看似有文字实则无意义的「伪中文」乱码,且对工业流程图的结构逻辑毫无概念。虽然视觉风格模仿了工业示意图的质感,但核心信息传达彻底失败。从提示词遵循度来看,这是严重的任务未完成状态。
进阶难度评测结果
- 得分:— 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【GEMINI】由于模型在本次任务中「图像生成失败」,导致无法完成任何预设的绘图任务,各项指标均无法评估,评测结果为 0 分。 【CLAUDE】候选输出为「图像生成失败,无法评分」,模型未能生成任何工艺流程图内容。所有评分维度均为0分。该任务要求生成包含六个组件框、循环回路、中文反应条件标注及工程制图风格的合成氨工艺流程图,但由于输出完全缺失,无法对任何功能要求进行评估。 【KIMI】该候选输出完全失败,未生成任何图像内容,仅返回「图像生成失败,无法评分」的提示信息。所有评分维度均无法达成,属于彻底的生成失败案例。建议检查图像生成模块的稳定性或输入参数的有效性。
困难难度评测结果
- 得分:34.6 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张模拟工业生产流程的示意图,背景为纯白色。画面中分布着多个蓝色的工业罐体、反应器和复杂的管道系统,整体色调以工业蓝、银灰色为主,并辅以橙色和蓝色的虚线箭头来表示物质的流动方向。构图上分为上下两层,通过交错的管道相互连接,试图呈现一种自动化的化学或能源处理过程。然而,这张图片具有明显的 AI 生成缺陷:画面中的所有文字标签均为乱码或扭曲的伪汉字,虽然看起来像中文,但实际上无法辨认任何具体含义;部分化学分子式如“N2-H(m)”等也属于逻辑错误的臆造。此外,管道的连接处存在透视异常,部分虚线箭头在空间中凭空断裂或重叠,机械零件的边缘模糊且缺乏真实的物理结构逻辑,整体是一张缺乏实际科学参考价值的视觉模拟图。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在执行「专业级工业合成氨哈伯法工艺流程图」提示词时严重失败。核心问题在于:①几乎所有中文标注均为AI生成的乱码,完全不可读;②图像风格为三维工业设备渲染而非PFD流程图;③合成塔关键参数严重缺失;④组件图标不符合工程惯例。仅有配色方案(蓝色主流/橙色循环)的基本意图可辨认。整体质量远低于「高中化学教材或工程参考图」的最低标准,无法作为教学或工程参考使用。 【GEMINI】该图像在生成专业工程流程图的任务上严重失败。虽然模型在图像渲染质感上表现尚可,但在核心的逻辑表达、文字标注准确性以及工程图标规范性上完全未达到要求。生成的文字均为乱码,导致该图无法用于任何实际的教学或工程参考,属于典型的「AI幻觉」产物。 【KIMI】这是一张典型的AI生成「伪专业」图像——表面具有工业设备的外观质感,但核心信息(文字标注、流程逻辑、工程符号)全面崩溃。模型似乎通过视觉风格模仿了化工流程图的「样子」,却完全无法理解哈伯法工艺的结构逻辑与专业标注规范。乱码文字(「特温出组」「关公微锁」等)表明模型在生成中文技术术语时出现了严重的token级幻觉,这是多语言大模型在专业技术领域的典型失效模式。作为「高中化学教材或工程参考图」,该图像不仅不合格,且具有误导性——若学生依据此图学习,将获得完全错误的工艺认知。建议评分:严重失败,需重新生成。
相关链接
您可以通过以下链接查看更多相关内容: