GLM-Image 在「韩文书法与清水混凝土墙面融合」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:GLM-Image
- 用例名称:韩文书法与清水混凝土墙面融合
- 测试类型:图像生成
- 评测维度:书法艺术表现
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一面灰色清水混凝土墙面,上面用黑色韩文书法书写着文字。
任务要求
AI 模型需要满足以下要求:
- 画面主体为灰色清水混凝土墙面
- 墙面上有黑色韩文书法文字
- 混凝土材质质感可辨认
- 书法文字清晰可见
- 整体画面构图完整
评测结果
综合得分
该模型在此用例的得分为:— 分(满分 100 分),未通过
基础难度评测结果
- 得分:— 分
- 通过状态:未通过
模型生成产物
以下是该模型针对此任务的实际生成内容:
系统报错(阶段=模型生成; 模块=app.services.inference.call_text_model; provider=zhipu; model=glm-image):HTTP 429
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【GEMINI】本次测试中,模型在生成阶段触发了 HTTP 429 错误(请求频率过高或服务不可用),导致未能完成任务要求。由于没有任何图像输出,所有维度均无法进行评估,评测结果为零分。 【KIMI】该候选输出为系统报错信息(HTTP 429,表示请求过于频繁),模型未成功生成任何图像内容。由于生成任务完全失败,所有评分维度均无法获得有效评估依据,各维度得分均为0分。此错误属于服务端限流问题,非模型本身的生成能力缺陷,但从任务完成度角度,本次生成结果未满足任何功能要求。
进阶难度评测结果
- 得分:— 分
- 通过状态:未通过
模型生成产物
以下是该模型针对此任务的实际生成内容:
系统报错(阶段=模型生成; 模块=app.services.inference.call_text_model; provider=zhipu; model=glm-image):HTTP 429
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【GEMINI】本次生成任务因模型端触发「HTTP 429」限流错误导致生成失败,未能输出任何视觉内容。无法对任务要求的材质、书法及艺术张力进行评估。 【KIMI】本次评测中,候选模型因系统层面的HTTP 429错误(请求过于频繁)导致图像生成完全失败,未输出任何有效结果。所有评分维度均无法评估,建议检查服务提供商的速率限制配置或重试机制。该错误属于基础设施/服务可用性问题,而非模型本身的生成能力缺陷,但在当前评测框架下,输出结果为空,故各维度均计零分。
困难难度评测结果
- 得分:65.8 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中展示了一面粗犷的灰色清水混凝土墙壁,墙上写有两行巨大的黑色韩文书法。光线从左上方斜射入画面,在墙面和粗糙的水泥地面上投射出明亮的三角形光斑与深沉的阴影,营造出一种工业风或极简主义的艺术氛围。文字笔触厚重,带有明显的毛笔书写质感,墨迹边缘略有晕染。作为一张 AI 生成的图片,其主要缺陷在于文字内容:虽然字符看起来像韩文,但实际上是无意义的乱码组合,部分笔画结构不符合真实的韩文书写逻辑,且笔画末端的飞白效果分布不够自然。此外,墙面上的圆形孔洞分布过于规律且有些模糊,与真实建筑中的拉杆孔细节略有出入。右下角带有浅灰色的“AI生成”水印。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【GEMINI】该图像在材质渲染和基础光影上达到了及格水平,但作为核心艺术元素的「韩文书法」完全失败。AI 生成了无法辨认的伪文字,且排版缺乏设计感,导致作品从「艺术创作」降级为「带有纹理的背景图」。 【KIMI】本图是典型的「概念正确、执行失败」案例。AI理解了「混凝土墙面+韩文书法」的组合意图,但在所有质感细节上溃败:书法沦为矢量图形、混凝土沦为灰度贴图、光影沦为明暗填充。最致命的是书法维度——提示词明确要求的「干枯飞白」「墨色过渡」「微立体浮雕」三项核心特征全部缺失,导致「传统与工业碰撞」的艺术主题失去灵魂。整体呈现的是数字插画的廉价光滑感,而非真实材质的艺术张力。建议分数区间:55-70分。
相关链接
您可以通过以下链接查看更多相关内容: