GLM-Image 在「机械生命体三视图设计」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：GLM-Image
用例名称：机械生命体三视图设计
测试类型：图像生成
评测维度：游戏概念图

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一个类人型战斗机器人的三视图（正视图、侧视图、背视图），机器人全身由白色装甲板和金色骨架构成。要求： - 三个视角清晰排列在同一画面中 - 白色装甲与金色骨架颜色对比明显 - 整体造型具有机械感

任务要求

AI 模型需要满足以下要求：

画面中包含正视图、侧视图、背视图三个视角
机器人整体为类人型比例
白色装甲与金色骨架清晰可辨
三个视图排列整齐，画面清晰
整体具有机械战斗机器人的视觉风格

评测结果

综合得分

该模型在此用例的得分为：73.0 分（满分 100 分），已通过

基础难度评测结果

得分：73.0 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一套科幻风格的全覆盖式重型机甲设计稿，采用白色为主色调，辅以金属金和深灰色的机械关节细节。画面分为三个视角：左侧为正面全身像，中间为侧面视角，右侧为背面视角。机甲外形厚重且充满力量感，头部较小，肩部宽阔，胸部和腿部覆盖着流线型的装甲板。背景由浅蓝色的网格线和深灰色色块组成，呈现出一种技术制图的氛围。在 AI 生成的细节方面，存在几处明显的逻辑缺陷：首先是手部结构，正面视角的双手手指数量模糊且排列不自然，侧面视角的手部则显得过于扁平，缺乏合理的关节构造；其次是装甲的对称性，左右肩部和腿部的细小纹路在三个视角中并不完全一致；此外，机甲脚部与地面的接触透视略显生硬，部分机械连接处的阴影表现不够真实。整体虽然看起来精致，但在精密机械逻辑上存在一定的违和感。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像部分完成了提示词要求，白色装甲的机械造型感较强，正视图与侧视图呈现质量尚可，但存在两个核心缺陷：其一，金色骨架几乎未被有效展现，这是提示词最核心的材质要求之一，严重影响整体评分；其二，背视图的视角准确性存疑，且三视图整体排列不符合标准工程制图规范。综合来看，该图像更接近一个「白色机甲展示图」而非「白色装甲+金色骨架的标准三视图」。【GEMINI】该图像作为概念插画尚可，但作为工业设计三视图，其严谨性严重不足。模型在处理复杂机械结构的透视一致性上存在明显短板，导致三个视角之间缺乏物理关联，无法满足工程参考需求。【KIMI】该图像在视觉完成度上看似合格，但严格审视下存在根本性的执行偏差。最核心的失败在于「金色骨架」这一关键描述被严重弱化，以及三视图之间无法对齐的透视与比例问题。作为「三视图」这一特定工业设计需求，视角的不一致性使其失去了功能性价值。模型似乎更擅长生成「看起来不错的机器人」而非「准确执行提示词的机械设计图」。

进阶难度评测结果

得分：— 分
通过状态：未通过

模型生成产物

以下是该模型针对此任务的实际生成内容：

系统报错（阶段=模型生成; 模块=app.services.inference.call_text_model; provider=zhipu; model=glm-image）：HTTP 429

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】本次生成任务因模型服务端返回HTTP 429（请求过于频繁/服务不可用）错误而完全失败，未产生任何有效图像输出。所有评分维度均得0分。建议在服务恢复后重新发起请求，或切换至其他可用的图像生成模型进行评测。【GEMINI】本次评测中，模型未能成功执行生成任务，返回了「HTTP 429」错误（请求过于频繁或服务不可用），导致无法对三视图的生成质量进行任何有效评估。建议检查模型服务端的负载情况或重试请求。【KIMI】本次评测中模型遭遇HTTP 429错误（请求过多），导致完全未能生成任何图像输出。这是一个服务层面的技术故障，而非生成质量层面的问题。从评测角度，所有功能要求均未满足，各维度均得0分。建议在系统稳定后重新进行测试以评估模型实际的图像生成能力。

困难难度评测结果

得分：— 分
通过状态：未通过

模型生成产物

以下是该模型针对此任务的实际生成内容：

系统报错（阶段=模型生成; 模块=app.services.inference.call_text_model; provider=zhipu; model=glm-image）：HTTP 429

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】本次候选输出为系统级错误信息「HTTP 429」（请求频率超限），模型未完成任何实质性的图像生成工作。用户要求的类人型战斗机器人精密工程三视图完全未呈现，所有评分维度均得0分。建议在系统层面处理限速问题后重新调用，方可对实际生成质量进行评估。【GEMINI】本次评测中，模型在生成阶段触发了系统报错（HTTP 429，请求过于频繁），导致未能输出任何图像内容。由于缺乏可供评估的生成结果，所有维度均无法进行有效评分，评测结果为无效。【KIMI】本次评测中，模型在生成阶段遭遇HTTP 429错误（请求频率限制），导致完全未能输出任何图像内容。这是一个系统级失败，而非内容质量问题。从评测角度，所有评分维度均无法达成，得分为0。建议在技术层面检查API调用频率限制或重试机制，以确保复杂生成任务的稳定性。该测试用例（vg_gameconc_029）属于高难度硬表面建模类任务，对模型的工程制图理解与精密机械细节生成能力要求极高，但本次失败属于基础设施层面，未进入实际内容生成环节。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

进阶难度评测结果

模型生成产物

AI 评审点评

困难难度评测结果

模型生成产物

AI 评审点评

相关链接

反馈评测问题