GLM-Image 在「机械生命体三视图设计」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:GLM-Image
  • 用例名称:机械生命体三视图设计
  • 测试类型:图像生成
  • 评测维度:游戏概念图

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一个类人型战斗机器人的三视图(正视图、侧视图、背视图),机器人全身由白色装甲板和金色骨架构成。 要求: - 三个视角清晰排列在同一画面中 - 白色装甲与金色骨架颜色对比明显 - 整体造型具有机械感

任务要求

AI 模型需要满足以下要求:

  1. 画面中包含正视图、侧视图、背视图三个视角
  2. 机器人整体为类人型比例
  3. 白色装甲与金色骨架清晰可辨
  4. 三个视图排列整齐,画面清晰
  5. 整体具有机械战斗机器人的视觉风格

评测结果

综合得分

该模型在此用例的得分为:73.0 分(满分 100 分),已通过

基础难度评测结果

  • 得分:73.0 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一套科幻风格的全覆盖式重型机甲设计稿,采用白色为主色调,辅以金属金和深灰色的机械关节细节。画面分为三个视角:左侧为正面全身像,中间为侧面视角,右侧为背面视角。机甲外形厚重且充满力量感,头部较小,肩部宽阔,胸部和腿部覆盖着流线型的装甲板。背景由浅蓝色的网格线和深灰色色块组成,呈现出一种技术制图的氛围。 在 AI 生成的细节方面,存在几处明显的逻辑缺陷:首先是手部结构,正面视角的双手手指数量模糊且排列不自然,侧面视角的手部则显得过于扁平,缺乏合理的关节构造;其次是装甲的对称性,左右肩部和腿部的细小纹路在三个视角中并不完全一致;此外,机甲脚部与地面的接触透视略显生硬,部分机械连接处的阴影表现不够真实。整体虽然看起来精致,但在精密机械逻辑上存在一定的违和感。

图中展示了一套科幻风格的全覆盖式重型机甲设计稿,采用白色为主色调,辅以金属金和深灰色的机械关节细节。画面分为三个视角:左侧为正面全身像,中间为侧面视角,右侧为背面视角。机甲外形厚重且充满力量感,头部较小,肩部宽阔,胸部和腿部覆盖着流线型的装甲板。背景由浅蓝色的网格线和深灰色色块组成,呈现出一种技术制图的氛围。

在 AI 生成的细节方面,存在几处明显的逻辑缺陷:首先是手部结构,正面视角的双手手指数量模糊且排列不自然,侧面视角的手部则显得过于扁平,缺乏合理的关节构造;其次是装甲的对称性,左右肩部和腿部的细小纹路在三个视角中并不完全一致;此外,机甲脚部与地面的接触透视略显生硬,部分机械连接处的阴影表现不够真实。整体虽然看起来精致,但在精密机械逻辑上存在一定的违和感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像部分完成了提示词要求,白色装甲的机械造型感较强,正视图与侧视图呈现质量尚可,但存在两个核心缺陷:其一,金色骨架几乎未被有效展现,这是提示词最核心的材质要求之一,严重影响整体评分;其二,背视图的视角准确性存疑,且三视图整体排列不符合标准工程制图规范。综合来看,该图像更接近一个「白色机甲展示图」而非「白色装甲+金色骨架的标准三视图」。 【GEMINI】该图像作为概念插画尚可,但作为工业设计三视图,其严谨性严重不足。模型在处理复杂机械结构的透视一致性上存在明显短板,导致三个视角之间缺乏物理关联,无法满足工程参考需求。 【KIMI】该图像在视觉完成度上看似合格,但严格审视下存在根本性的执行偏差。最核心的失败在于「金色骨架」这一关键描述被严重弱化,以及三视图之间无法对齐的透视与比例问题。作为「三视图」这一特定工业设计需求,视角的不一致性使其失去了功能性价值。模型似乎更擅长生成「看起来不错的机器人」而非「准确执行提示词的机械设计图」。

进阶难度评测结果

  • 得分:— 分
  • 通过状态:未通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

系统报错(阶段=模型生成; 模块=app.services.inference.call_text_model; provider=zhipu; model=glm-image):HTTP 429

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】本次生成任务因模型服务端返回HTTP 429(请求过于频繁/服务不可用)错误而完全失败,未产生任何有效图像输出。所有评分维度均得0分。建议在服务恢复后重新发起请求,或切换至其他可用的图像生成模型进行评测。 【GEMINI】本次评测中,模型未能成功执行生成任务,返回了「HTTP 429」错误(请求过于频繁或服务不可用),导致无法对三视图的生成质量进行任何有效评估。建议检查模型服务端的负载情况或重试请求。 【KIMI】本次评测中模型遭遇HTTP 429错误(请求过多),导致完全未能生成任何图像输出。这是一个服务层面的技术故障,而非生成质量层面的问题。从评测角度,所有功能要求均未满足,各维度均得0分。建议在系统稳定后重新进行测试以评估模型实际的图像生成能力。

困难难度评测结果

  • 得分:— 分
  • 通过状态:未通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

系统报错(阶段=模型生成; 模块=app.services.inference.call_text_model; provider=zhipu; model=glm-image):HTTP 429

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】本次候选输出为系统级错误信息「HTTP 429」(请求频率超限),模型未完成任何实质性的图像生成工作。用户要求的类人型战斗机器人精密工程三视图完全未呈现,所有评分维度均得0分。建议在系统层面处理限速问题后重新调用,方可对实际生成质量进行评估。 【GEMINI】本次评测中,模型在生成阶段触发了系统报错(HTTP 429,请求过于频繁),导致未能输出任何图像内容。由于缺乏可供评估的生成结果,所有维度均无法进行有效评分,评测结果为无效。 【KIMI】本次评测中,模型在生成阶段遭遇HTTP 429错误(请求频率限制),导致完全未能输出任何图像内容。这是一个系统级失败,而非内容质量问题。从评测角度,所有评分维度均无法达成,得分为0。建议在技术层面检查API调用频率限制或重试机制,以确保复杂生成任务的稳定性。该测试用例(vg_gameconc_029)属于高难度硬表面建模类任务,对模型的工程制图理解与精密机械细节生成能力要求极高,但本次失败属于基础设施层面,未进入实际内容生成环节。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...