GLM-Image 在「情绪主题心理成长封面生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:GLM-Image
  • 用例名称:情绪主题心理成长封面生成
  • 测试类型:图像生成
  • 评测维度:PPT 设计

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

请生成一张 16:9 比例的疗愈系插画封面。 内容要求: - 画面中央以大号字体显示主标题「情绪不是问题,它只是信号」 - 主标题下方显示副标题「学会听懂情绪在提醒你什么」 - 配色柔和温暖,整体风格疗愈 - 全部文字使用简体中文

任务要求

AI 模型需要满足以下要求:

  1. 画面比例为 16:9 横版构图
  2. 主标题「情绪不是问题,它只是信号」清晰可读,位于画面中央
  3. 副标题「学会听懂情绪在提醒你什么」位于主标题下方
  4. 整体配色柔和,具有疗愈感
  5. 所有文字为简体中文,无错别字

评测结果

综合得分

该模型在此用例的得分为:— 分(满分 100 分),未通过

基础难度评测结果

  • 得分:— 分
  • 通过状态:未通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

系统报错(阶段=模型生成; 模块=app.services.inference.call_text_model; provider=zhipu; model=glm-image):HTTP 429

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】本次评测中,模型因HTTP 429(请求过于频繁/限流)错误未能成功生成图像,候选输出为纯系统报错信息,完全没有满足任何功能要求。16:9比例构图、中文标题文字、疗愈系风格配色、排版布局等所有评测维度均无法得分。建议排查API调用频率限制后重新生成。 【GEMINI】本次任务模型生成失败,返回了「HTTP 429」错误,导致无法完成任何指令要求。由于模型未能输出图像,所有维度均无法得分。 【KIMI】本次评测中模型因 HTTP 429 错误导致完全未生成有效输出,所有功能要求均未满足。这是一个服务层面的调用失败,而非生成质量层面的问题,但从任务完成度角度,该输出无法达成任何设计要求,所有维度均不得分。

进阶难度评测结果

  • 得分:— 分
  • 通过状态:未通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

系统报错(阶段=模型生成; 模块=app.services.inference.call_text_model; provider=zhipu; model=glm-image):HTTP 429

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】本次生成任务因模型推理服务出现HTTP 429(请求过于频繁/配额超限)错误而完全失败,候选输出仅为系统报错信息,未产生任何实际图像内容。所有评分维度均为0分。建议排查API配额限制或重试请求,以获取有效的图像生成结果。 【GEMINI】本次测试中,模型在生成阶段触发了 HTTP 429 错误(请求频率限制),导致未能完成任务要求。由于没有任何输出结果,所有维度均无法评估,评分为 0 分。 【KIMI】本次评测中,候选模型因服务提供商(zhipu/glm-image)返回 HTTP 429 错误而完全未能生成图像内容。这是一个典型的服务可用性问题,导致所有功能要求均未实现。从评测角度,输出结果为零产出状态,四个维度均无法获得任何分数。建议排查模型服务的并发限制或配额配置,重新执行生成任务。

困难难度评测结果

  • 得分:— 分
  • 通过状态:未通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

系统报错(阶段=模型生成; 模块=app.services.inference.call_text_model; provider=zhipu; model=glm-image):HTTP 429

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】本次生成任务因模型侧触发 HTTP 429(请求频率超限)错误,导致完全未能产出任何图像内容。所有评分维度均为 0 分。建议在请求速率控制正常后重新发起生成,以完成对该疗愈系插画封面任务的实际评测。 【GEMINI】本次测试中,模型因触发限流策略(HTTP 429)导致生成失败,未能输出任何符合要求的图像内容。无法对模型的功能实现情况进行有效评估。 【KIMI】本次评测中,模型因 HTTP 429 错误完全未能生成图像输出,属于服务层面的调用失败。所有评分维度均无法达标,各维度得分均为 0 分。该结果反映的是模型服务可用性问题,而非生成质量本身的问题,建议重试或检查服务配额限制。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...