GLM-Image 在「韩文书法与清水混凝土墙面融合」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：GLM-Image
用例名称：韩文书法与清水混凝土墙面融合
测试类型：图像生成
评测维度：书法艺术表现

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一面灰色清水混凝土墙面，上面用黑色韩文书法书写着文字。

任务要求

AI 模型需要满足以下要求：

画面主体为灰色清水混凝土墙面
墙面上有黑色韩文书法文字
混凝土材质质感可辨认
书法文字清晰可见
整体画面构图完整

评测结果

综合得分

该模型在此用例的得分为：— 分（满分 100 分），未通过

基础难度评测结果

得分：— 分
通过状态：未通过

模型生成产物

以下是该模型针对此任务的实际生成内容：

系统报错（阶段=模型生成; 模块=app.services.inference.call_text_model; provider=zhipu; model=glm-image）：HTTP 429

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【GEMINI】本次测试中，模型在生成阶段触发了 HTTP 429 错误（请求频率过高或服务不可用），导致未能完成任务要求。由于没有任何图像输出，所有维度均无法进行评估，评测结果为零分。【KIMI】该候选输出为系统报错信息（HTTP 429，表示请求过于频繁），模型未成功生成任何图像内容。由于生成任务完全失败，所有评分维度均无法获得有效评估依据，各维度得分均为0分。此错误属于服务端限流问题，非模型本身的生成能力缺陷，但从任务完成度角度，本次生成结果未满足任何功能要求。

进阶难度评测结果

得分：— 分
通过状态：未通过

模型生成产物

以下是该模型针对此任务的实际生成内容：

系统报错（阶段=模型生成; 模块=app.services.inference.call_text_model; provider=zhipu; model=glm-image）：HTTP 429

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【GEMINI】本次生成任务因模型端触发「HTTP 429」限流错误导致生成失败，未能输出任何视觉内容。无法对任务要求的材质、书法及艺术张力进行评估。【KIMI】本次评测中，候选模型因系统层面的HTTP 429错误（请求过于频繁）导致图像生成完全失败，未输出任何有效结果。所有评分维度均无法评估，建议检查服务提供商的速率限制配置或重试机制。该错误属于基础设施/服务可用性问题，而非模型本身的生成能力缺陷，但在当前评测框架下，输出结果为空，故各维度均计零分。

困难难度评测结果

得分：65.8 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

画面中展示了一面粗犷的灰色清水混凝土墙壁，墙上写有两行巨大的黑色韩文书法。光线从左上方斜射入画面，在墙面和粗糙的水泥地面上投射出明亮的三角形光斑与深沉的阴影，营造出一种工业风或极简主义的艺术氛围。文字笔触厚重，带有明显的毛笔书写质感，墨迹边缘略有晕染。作为一张 AI 生成的图片，其主要缺陷在于文字内容：虽然字符看起来像韩文，但实际上是无意义的乱码组合，部分笔画结构不符合真实的韩文书写逻辑，且笔画末端的飞白效果分布不够自然。此外，墙面上的圆形孔洞分布过于规律且有些模糊，与真实建筑中的拉杆孔细节略有出入。右下角带有浅灰色的“AI生成”水印。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【GEMINI】该图像在材质渲染和基础光影上达到了及格水平，但作为核心艺术元素的「韩文书法」完全失败。AI 生成了无法辨认的伪文字，且排版缺乏设计感，导致作品从「艺术创作」降级为「带有纹理的背景图」。【KIMI】本图是典型的「概念正确、执行失败」案例。AI理解了「混凝土墙面+韩文书法」的组合意图，但在所有质感细节上溃败：书法沦为矢量图形、混凝土沦为灰度贴图、光影沦为明暗填充。最致命的是书法维度——提示词明确要求的「干枯飞白」「墨色过渡」「微立体浮雕」三项核心特征全部缺失，导致「传统与工业碰撞」的艺术主题失去灵魂。整体呈现的是数字插画的廉价光滑感，而非真实材质的艺术张力。建议分数区间：55-70分。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

AI 评审点评

进阶难度评测结果

模型生成产物

AI 评审点评

困难难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

相关链接

反馈评测问题