GLM-Image 在「江南雨巷诗意图像生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：GLM-Image
用例名称：江南雨巷诗意图像生成
测试类型：图像生成
评测维度：书法艺术表现

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一幅江南雨巷场景图：青石板铺就的小巷中，一名女子撑着油纸伞，画面呈现朦胧、忧郁的氛围。

任务要求

AI 模型需要满足以下要求：

画面中有青石板铺就的江南小巷
有一名撑着油纸伞的女子背影
整体氛围朦胧、忧郁
画面清晰，构图完整

评测结果

综合得分

该模型在此用例的得分为：— 分（满分 100 分），未通过

基础难度评测结果

得分：— 分
通过状态：未通过

模型生成产物

以下是该模型针对此任务的实际生成内容：

系统报错（阶段=模型生成; 模块=app.services.inference.call_text_model; provider=zhipu; model=glm-image）：HTTP 429

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【GEMINI】本次任务模型生成失败，返回了「HTTP 429」错误代码，导致无法完成对江南雨巷意境的视觉还原，各项指标均无法评估。【KIMI】该候选输出为系统报错信息（HTTP 429，请求过于频繁），属于典型的服务层故障导致生成失败，未产生任何有效图像内容。根据评测要求，所有评分维度均无法达成，故各维度均计0分。此结果反映的是模型服务可用性问题，而非图像生成质量本身的问题。

进阶难度评测结果

得分：— 分
通过状态：未通过

模型生成产物

以下是该模型针对此任务的实际生成内容：

系统报错（阶段=模型生成; 模块=app.services.inference.call_text_model; provider=zhipu; model=glm-image）：HTTP 429

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【GEMINI】本次测试中，模型因触发「HTTP 429」错误导致生成任务失败，未能输出任何符合要求的图像内容。无法对各项指标进行有效评估，建议检查接口限流策略或重试生成。【KIMI】本次评测中，模型因HTTP 429错误（请求过于频繁）未能成功生成图像，属于服务层面的技术故障，而非生成质量层面的问题。由于没有任何可视化输出结果，所有评分维度均无法进行评估，故各维度得分均为0分。建议在系统负载正常后重新进行评测。

困难难度评测结果

得分：62.5 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展现了一个充满怀旧与忧郁氛围的雨后江南小巷。画面中央是一位身着灰色修身旗袍的女性背影，她正撑着一把白色的油纸伞，独自走在湿漉漉的青石板路上。小巷两侧是斑驳的白墙黛瓦，墙根处长有青苔，远景在雨雾中显得朦胧。画面右侧配有黑色的简体中文字体，引用了戴望舒《雨巷》中的诗句。整体色调偏冷，以灰、白、青色为主，营造出一种凄清、迷茫的意境。在 AI 生成的细节方面，存在明显的逻辑缺陷：女子右手撑伞的姿势极不自然，手臂线条扭曲且似乎直接穿过了伞柄；左手消失在身体一侧，结构缺失；此外，地面上的倒影与人物脚步动作不完全匹配，右侧文字中的“哀怨”被错误地写成了“哀恩”，“彷徨”被误写成了“仿惺”，反映了 AI 在处理复杂汉字和人体结构时的局限性。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【GEMINI】该图像在基础场景构建上尚可，但对于「诗意」和「书法融合」这一核心诉求完成度极低。尤其是文字处理完全忽视了提示词的艺术要求，导致画面整体质感大打折扣。倒影的物理错误和油纸伞的畸变也反映出模型在处理细节逻辑时的局限性。【KIMI】该图像在场景基底搭建上有一定完成度，但在两个核心诉求上严重失败：一是书法文字从字体、墨色、排布到内容准确性全面崩塌，错字问题尤为低级；二是人物动态与情感表达僵硬刻板，未能捕捉《雨巷》的诗意灵魂。作为「融合书法与诗意场景」的测试目标，此图未达标。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

AI 评审点评

进阶难度评测结果

模型生成产物

AI 评审点评

困难难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

相关链接

反馈评测问题