GLM-Image 在「生态系统能量流动金字塔生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：GLM-Image
用例名称：生态系统能量流动金字塔生成
测试类型：图像生成
评测维度：教材插图

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一个生态系统能量金字塔示意图。要求： - 金字塔从底部到顶部依次为：生产者、初级消费者、次级消费者、三级消费者 - 每层面积从下到上依次递减，呈标准金字塔形状 - 每层用中文标注对应名称 - 整体图像清晰，层次分明

任务要求

AI 模型需要满足以下要求：

图像呈金字塔（梯形叠加）结构，共四层
从底部到顶部依次标注「生产者」「初级消费者」「次级消费者」「三级消费者」
各层面积从下到上依次递减，比例关系视觉上合理
中文标注清晰可读，位置准确对应各层
整体画面构图完整，背景简洁

评测结果

综合得分

该模型在此用例的得分为：81.4 分（满分 100 分），已通过

基础难度评测结果

得分：81.4 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一个位于米白色布纹背景中央的等腰三角形，它被水平切分为四个层级，模拟了生态系统中的能量金字塔。从下往上，最底层的面积最大，颜色为深绿色，中心写有黑色简体中文“生产者”；第二层为中绿色，写有“初级消费者”；第三层为较浅的绿色，写有“次级消费者”；最顶端的三角形尖端为红色，写有“三级消费者”。文字均采用黑体字，居中排列。画面整体构图简洁对称，色彩对比鲜明。作为 AI 生成的图片，其主要缺陷在于细节处理不够严谨：层级之间的白色分割线粗细不一，且边缘存在轻微的锯齿感；背景的布纹质感在边缘处略显模糊。此外，右下角带有一个半透明的灰色椭圆标签，标有“AI生成”字样。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【GEMINI】该图像在几何结构构建上表现良好，但在核心逻辑（文字标注顺序）上出现了致命错误。作为一张示意图，准确性是第一位的，层级颠倒导致其失去了作为教学或演示工具的价值。【KIMI】该图像成功完成了提示词的所有核心要求：四层金字塔结构、正确的层级顺序、面积递减关系、完整的中文标注。作为生态系统能量金字塔示意图，其信息传达准确、结构清晰，可直接用于教学或演示。视觉表现虽朴素但无硬伤，属于「完成度优先于美观度」的实用型生成结果。若追求更高品质，可优化色彩层次、字体设计及去除水印。

进阶难度评测结果

得分：— 分
通过状态：未通过

模型生成产物

以下是该模型针对此任务的实际生成内容：

系统报错（阶段=模型生成; 模块=app.services.inference.call_text_model; provider=zhipu; model=glm-image）：HTTP 429

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【GEMINI】由于模型在生成过程中触发了 HTTP 429 错误（请求频率限制），导致未能输出任何内容。因此，所有维度均无法满足任务要求，评分为 0 分。【KIMI】模型生成失败，返回HTTP 429错误（请求过于频繁），未输出任何符合要求的金字塔示意图内容。所有评分维度均得0分，属于完全未完成任务的情况。

困难难度评测结果

得分：52.4 分
通过状态：未通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一个关于生态系统能量金字塔的科普图表，背景为浅灰色纹理。画面中心是一个由四层色块组成的三角形金字塔：底层是代表生产者的绿色，向上依次是初级消费者的浅绿色、次级消费者的橙色，以及顶端三级消费者的红色。每层都标注了对应的生物示例，如草、昆虫、青蛙和鹰等。金字塔周围散布着多个指向性箭头和百分比数值，右侧还有一个带有刻度的彩色能量条。这张图片具有明显的 AI 生成缺陷，主要体现在逻辑混乱和排版异常上。首先，画面中的箭头指向非常随意，部分箭头穿透了文字或色块边缘，缺乏严谨的科学图表逻辑。其次，文字排版拥挤且重叠，右下角的说明文字被截断并与“AI生成”的水印混杂在一起。最严重的问题在于数据标注，百分比数值（如10%-20%）在画面中多处重复出现，且位置分布毫无规律，未能清晰表达能量传递的递减关系，刻度线也显得粗细不一，不符合教学图表的规范。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【GEMINI】这是一次失败的生成。尽管模型识别了金字塔的基本形状和颜色要求，但在处理复杂的逻辑标注（如能量传递效率）时表现极差。图像充斥着重复的无意义标注和混乱的排版，完全无法作为科学信息图使用。AI在处理逻辑性强的图表任务时，仍存在严重的逻辑幻觉和排版控制力不足的问题。【KIMI】该图像在基础结构搭建上达标，但在核心的能量传递逻辑可视化上失败。面积比例与标注数值的脱节是最严重的科学表达错误，而标注信息的混乱排布进一步削弱了信息图的传达效率。作为科学教育用途的Infographic，逻辑自洽性优先于视觉美观，此图未能通过这一核心检验。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

进阶难度评测结果

模型生成产物

AI 评审点评

困难难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

相关链接

反馈评测问题