qwen-image-max 在「初中数学坐标系函数图像生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:qwen-image-max
  • 用例名称:初中数学坐标系函数图像生成
  • 测试类型:图像生成
  • 评测维度:教材插图

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张初中数学教学图,包含完整的平面直角坐标系。 要求: - 画出X轴和Y轴,两轴交于原点O - 轴上标注刻度数字(范围约-5到5) - 在坐标系中绘制一条穿过一、三象限的正比例函数直线,并在直线旁标注函数表达式「y=2x」

任务要求

AI 模型需要满足以下要求:

  1. 图中有完整的X轴和Y轴,交点处标注原点「O」
  2. 坐标轴上有清晰的刻度数字
  3. 图中有一条穿过一、三象限的直线
  4. 直线旁标注有函数表达式「y=2x」
  5. 整体画面清晰,线条规范

评测结果

综合得分

该模型在此用例的得分为:61.8 分(满分 100 分),已通过

基础难度评测结果

  • 得分:61.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:qwen-image-max
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像存在较严重的结构性问题,最突出的是两套坐标系叠加共存,导致整体图形混乱难以阅读。刻度标注的正负错误进一步降低了数学规范性。函数直线虽方向正确但线条质量差(多线叠加、第三象限弯曲)。唯一表现较好的是函数表达式的文字标注。综合来看,该图像仅部分满足提示词要求,存在多处明显缺陷,不适合作为教学用图。 【GEMINI】该图像严重违背了数学教学图的规范性要求。虽然视觉上模仿了手绘坐标系,但内部逻辑漏洞百出:刻度数字的正负号缺失、数值重复、原点标注错误以及多余轴线的出现,使其完全失去了作为教学工具的参考价值。AI 在处理具有严密逻辑关系的数学图形时表现较差。 【KIMI】这是一张手绘风格的数学示意图,但作为AI生成的教学图像质量堪忧。坐标系刻度系统存在根本性错误,数字标注混乱到几乎无法用于教学;函数图像与标注表达式严重不符,斜率错误且线条不规范。唯一尚可的是文字标注的基本可读性。整体而言,该图像若用于实际教学将严重误导学生,数学准确性方面需要完全重做。

进阶难度评测结果

  • 得分:36.2 分
  • 通过状态:未通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:qwen-image-max
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在核心数学规范性上存在多处根本性错误,几乎无法作为有效的数学教学图使用。坐标轴刻度标注混乱无序,两条函数曲线的形态均与数学定义严重不符——直线画成了曲线,抛物线顶点位置错误且开口方向相反。额外出现的红色水平线和绿紫分段的曲线进一步加剧了视觉混乱。尽管标题和函数表达式文字标注存在,但与图形的对应关系严重失准,整体质量不达标,不具备教学参考价值。 【GEMINI】这是一张在数学逻辑上完全失败的AI生成图像。尽管它尝试模仿教学图表的视觉风格,但在最核心的坐标系规范、函数图像准确性方面出现了严重的常识性错误。刻度数字随机排列、函数曲线形态与表达式完全不符,使其完全失去了作为「教学图」的实用价值。 【KIMI】该图像作为数学教学图存在根本性失败。坐标轴刻度系统完全混乱,无法建立正确的数学参照系;两条函数曲线形态与标签严重错位,将直线标为抛物线、将开口向上的抛物线绘制成开口向下的形态,构成严重的教学误导。原点位置、刻度方向、曲线形状三大核心要素全部错误,不具备任何教学价值。推测模型在理解「平面直角坐标系」「正比例函数」「二次函数」等基础数学概念上存在严重缺陷,或受到训练数据噪声干扰导致生成混乱。建议评分:32/100(加权计算后)。

困难难度评测结果

  • 得分:30.4 分
  • 通过状态:未通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:qwen-image-max
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像存在根本性的生成错误,几乎未能满足提示词的核心要求。坐标系轴标签完全错误(x轴标y、y轴标x),刻度数字混乱超出范围,图像错误地生成了四条曲线形成上下镜像结构,抛物线出现了开口朝下的错误形态,函数表达式标注混乱且有错误,交点标注不规范。整体图像与「初中数学教学挂图」的标准相差极远,完全不适合教学使用,属于严重失败的生成结果。 【GEMINI】该图像在视觉美观度上尚可,但在数学逻辑和教学规范性上属于彻底的失败。它完全无视了笛卡尔坐标系的基本规则,刻度数字混乱,函数图像形态错误,标注内容与实际几何位置毫无关联,完全无法作为教学挂图使用。 【KIMI】这是一张在数学规范性上完全失败的AI生成图像。核心问题在于坐标轴结构的根本性颠倒,导致所有基于坐标系的数学元素(刻度、函数图像、交点)全部错位。图像呈现出典型的AI幻觉特征:表面上有坐标系、曲线、标注等「数学图形」的元素,但内在逻辑完全崩塌,数字、文字、曲线之间无正确关联。作为初中数学教学挂图,该图像不仅无法辅助教学,还会对学生造成严重的概念误导。建议重新生成时严格约束坐标系结构,优先确保X轴水平、Y轴垂直的基础正确性。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...