GLM-Image 在「故障艺术风格短视频平台 Logo 设计」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:GLM-Image
  • 用例名称:故障艺术风格短视频平台 Logo 设计
  • 测试类型:图像生成
  • 评测维度:Logo 设计

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

为一个短视频平台设计一个 Logo。 设计要求: - 以播放键(向右的三角形)作为主体图形 - 整体风格为故障艺术(Glitch Art) - 加入红蓝色彩偏移效果,营造数字信号故障感

任务要求

AI 模型需要满足以下要求:

  1. Logo 主体为向右的三角形播放键图形
  2. 画面呈现故障艺术(Glitch Art)风格
  3. 有明显的红蓝色彩偏移(Chromatic Aberration)效果
  4. 整体构图清晰,Logo 辨识度高

评测结果

综合得分

该模型在此用例的得分为:— 分(满分 100 分),未通过

基础难度评测结果

  • 得分:— 分
  • 通过状态:未通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

系统报错(阶段=模型生成; 模块=app.services.inference.call_text_model; provider=zhipu; model=glm-image):HTTP 429

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】本次评测中,模型因触发API调用频率限制(HTTP 429)导致图像生成完全失败,未产生任何有效输出内容。所有评分维度均为0分。这属于系统层面的服务异常,而非模型能力本身的体现,但按评测规范,无输出即视为任务未完成,各维度均不得分。 【GEMINI】本次生成任务因系统错误(HTTP 429,请求过于频繁或服务限制)导致模型未能输出任何图像内容。由于缺乏生成结果,无法满足用户提出的 Logo 设计需求,各项指标均无法达成。 【KIMI】本次评测中模型完全未能生成有效输出,返回 HTTP 429 错误(请求过于频繁)。这是一个服务层面的技术故障,而非模型能力问题,导致所有评分维度均无法获得有效评估依据。建议重新发起请求以测试模型在故障艺术 Logo 设计任务上的实际能力。

进阶难度评测结果

  • 得分:75.3 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一个具有现代科技感的视频播放图标,背景为深黑色。画面中心是一个白色的圆角正方形,其内部镂空出一个向右指的黑色三角形播放按钮。整个图标采用了明显的“故障艺术”风格,边缘伴随着鲜艳的红、蓝、青三色重影和半透明的水平拉伸线条,仿佛电子屏幕信号不稳定时的视觉效果。构图居中且对称,色彩对比强烈,营造出一种动感与数字化的氛围。在 AI 生成的细节方面,可以观察到一些逻辑上的不一致:图标左右两侧的彩色拉伸线条分布并不均匀,且部分线条在穿过白色区域时出现了断裂或模糊,缺乏真实的物理透视感。此外,白色方块的圆角边缘在色彩重叠处显得有些生硬,未能完全模拟出自然的色彩偏移效果。

图中展示了一个具有现代科技感的视频播放图标,背景为深黑色。画面中心是一个白色的圆角正方形,其内部镂空出一个向右指的黑色三角形播放按钮。整个图标采用了明显的“故障艺术”风格,边缘伴随着鲜艳的红、蓝、青三色重影和半透明的水平拉伸线条,仿佛电子屏幕信号不稳定时的视觉效果。构图居中且对称,色彩对比强烈,营造出一种动感与数字化的氛围。在 AI 生成的细节方面,可以观察到一些逻辑上的不一致:图标左右两侧的彩色拉伸线条分布并不均匀,且部分线条在穿过白色区域时出现了断裂或模糊,缺乏真实的物理透视感。此外,白色方块的圆角边缘在色彩重叠处显得有些生硬,未能完全模拟出自然的色彩偏移效果。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像完成了故障艺术风格Logo的基础构建——圆角矩形容器内的播放键形态标准,红蓝色彩分离描边具有一定的故障氛围,深色背景与主体配色符合要求。然而,作为重点考察「故障艺术特效还原能力」的测试任务,图像在最关键的两项特效上存在明显缺陷:像素块状撕裂效果完全缺失,扫描线/噪点条纹数量极少且仅限于外缘。整体效果更接近「霓虹边框Logo」而非真正意义上的多重叠加故障艺术,视觉冲击力与提示词预期有较大差距。 【GEMINI】这是一份完成度很高的设计稿,准确捕捉了故障艺术的核心视觉语言。虽然在「像素撕裂」这一特定故障细节上有所欠缺,但作为 Logo 设计,其辨识度与现代感表现优秀,能够直接投入使用。 【KIMI】该图像在视觉层面具有一定完成度,但作为「故障艺术风格Logo」的任务执行存在方向性错误。模型将「故障艺术」理解为「霓虹发光效果」,核心要求的像素撕裂、三层色块错位、随机噪点扫描线均未实现。播放键被过度包装,品牌辨识度受损,且右下角水印直接破坏专业属性。整体呈现为精致的科技感图标,而非具有数字批判美学的故障艺术Logo。

困难难度评测结果

  • 得分:— 分
  • 通过状态:未通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

系统报错(阶段=模型生成; 模块=app.services.inference.call_text_model; provider=zhipu; model=glm-image):HTTP 429

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】本次评测的候选输出为系统调用失败产生的报错信息(HTTP 429 Too Many Requests),模型未能生成任何图像内容。任务要求设计一款包含复杂故障艺术效果的 Logo,涉及撕裂播放键、三通道色彩分离、不均匀扫描线、噪点颗粒及品牌文字等多项设计要求,但由于生成阶段发生错误,所有维度均无法得分。建议排查 API 调用频率限制问题后重新生成。 【GEMINI】本次任务中,模型因触发 API 频率限制(HTTP 429)导致生成过程完全中断,未输出任何符合要求的图像内容。由于缺乏可评估的视觉产出,所有维度均评为 0 分。 【KIMI】本次评测中,模型因 HTTP 429 错误完全未能生成图像输出,属于生成失败案例。所有评分维度均无法获得有效评估依据,各维度得分均为 0 分。该结果反映模型服务在请求处理环节出现限流或系统异常,未进入实际的图像生成与视觉设计阶段。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...