qwen-image-max 在「中式榫卯结构拆解图生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:qwen-image-max
  • 用例名称:中式榫卯结构拆解图生成
  • 测试类型:图像生成
  • 评测维度:物体生成

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张中国传统木工「燕尾榫」的结构拆解示意图。 要求: - 展示榫头与榫眼两个独立木件 - 清晰呈现燕尾形状的凹凸咬合结构 - 图像背景简洁,木件轮廓清晰

任务要求

AI 模型需要满足以下要求:

  1. 图像中可识别出两个独立的木构件(榫头件与榫眼件)
  2. 燕尾榫的梯形榫头形态清晰可辨
  3. 榫眼的凹槽形状与榫头形态对应匹配
  4. 整体画面清晰,构件轮廓无歧义
  5. 图像具有一定的立体感或透视感

评测结果

综合得分

该模型在此用例的得分为:73.1 分(满分 100 分),已通过

基础难度评测结果

  • 得分:73.1 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一张关于木工榫卯结构的示意图,背景为淡雅的米白色。画面中有两根带有清晰木质纹理的棕褐色木梁,它们正试图展示一种对接结构。左侧的木梁下方连接着一根圆柱形的木桩,右侧的木梁则呈斜向放置。图中上方带有黑色文字标注“燕尾榫”,并配有指引线指向木材的切口处。然而,作为一张 AI 生成的图片,画面存在明显的逻辑和透视缺陷:首先,标注的“燕尾榫”在现实中应为梯形连接,但图中展示的却是平滑的半圆弧形凹槽,完全不符合燕尾榫的几何特征;其次,左右两块木材的切口形状并不匹配,无法实现物理上的严丝合缝;此外,木材横截面的年轮纹理分布杂乱,与长条表面的木纹走向缺乏连贯性,整体结构在现实木工原理中是无法成立的。

图中展示了一张关于木工榫卯结构的示意图,背景为淡雅的米白色。画面中有两根带有清晰木质纹理的棕褐色木梁,它们正试图展示一种对接结构。左侧的木梁下方连接着一根圆柱形的木桩,右侧的木梁则呈斜向放置。图中上方带有黑色文字标注“燕尾榫”,并配有指引线指向木材的切口处。然而,作为一张 AI 生成的图片,画面存在明显的逻辑和透视缺陷:首先,标注的“燕尾榫”在现实中应为梯形连接,但图中展示的却是平滑的半圆弧形凹槽,完全不符合燕尾榫的几何特征;其次,左右两块木材的切口形状并不匹配,无法实现物理上的严丝合缝;此外,木材横截面的年轮纹理分布杂乱,与长条表面的木纹走向缺乏连贯性,整体结构在现实木工原理中是无法成立的。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在视觉表现力和清晰度方面表现良好,但在最核心的「燕尾榫结构准确性」上存在明显偏差。燕尾榫的本质特征是梯形截面的榫头(形似燕子尾巴展开),能够在拉力方向上形成机械锁定,而图中呈现的是尖锐菱形/三角形的榫头与榫眼,更接近于某种异形榫而非标准燕尾榫。此外,左侧构件底部多余的圆柱榫进一步干扰了结构表达。对于一张以「结构拆解示意」为核心目的的图像,结构准确性的失分是致命的。综合评分约75分,属于「基本完成要求但有明显瑕疵」的水平。 【GEMINI】作为一张「燕尾榫」示意图,该生成结果在视觉表现力上很出色,但在核心知识点上完全失败。它生成了一个看起来很专业、实则物理逻辑完全错误的伪结构。它将燕尾榫误解成了某种流线型的滑轨结构,失去了榫卯结构最基本的「梯形互锁」特征,无法作为教学或技术参考。 【KIMI】这是一张「看似专业实则结构失效」的典型AI生成图像。模型在视觉表层(纹理、光影、标注)表现合格,但在核心功能逻辑——燕尾榫的阴阳咬合原理——上出现根本性错误。左右构件均为凹槽、无法配对的问题,暴露出AI对「榫头必须凸出、榫眼必须凹陷」这一基础木工常识的理解缺失。该图像若作为教学材料,将严重误导学习者对燕尾榫结构的认知。建议重新生成时明确约束「左侧为凸出榫头、右侧为凹陷榫眼、两者形状互补可咬合」的结构关系。

进阶难度评测结果

  • 得分:67.0 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一个木工榫卯结构的近景特写,背景是模糊的木工坊环境,整体色调呈温暖的木质原色。画面中心是三根木构件交汇的连接处:两根横向的方木呈 90 度直角对接,中间垂直立着一根圆柱形的木栓。构件表面有清晰的木材纹理,光影柔和。画面中带有中文标注和白色箭头,试图解释“燕尾榫”、“榫头”和“榫眼”等术语。 然而,作为一张 AI 生成的图片,其结构存在明显的逻辑错误和透视缺陷:首先,标注的文字与实际结构完全不符,例如指向实心方木的箭头被标为“榫眼”,而指向圆柱体的部分被标为“燕尾榫”。其次,物理结构不合理,两根方木的交接处呈现出一种不自然的融合感,缺乏真实的咬合缝隙,且圆柱木栓与方木的连接处木材纹理错乱,看起来像是直接“长”在一起而非组装而成。此外,右侧方木上的虚线标注毫无逻辑,未能准确勾勒出任何内部结构,属于典型的 AI 视觉幻觉。

图中展示了一个木工榫卯结构的近景特写,背景是模糊的木工坊环境,整体色调呈温暖的木质原色。画面中心是三根木构件交汇的连接处:两根横向的方木呈 90 度直角对接,中间垂直立着一根圆柱形的木栓。构件表面有清晰的木材纹理,光影柔和。画面中带有中文标注和白色箭头,试图解释“燕尾榫”、“榫头”和“榫眼”等术语。

然而,作为一张 AI 生成的图片,其结构存在明显的逻辑错误和透视缺陷:首先,标注的文字与实际结构完全不符,例如指向实心方木的箭头被标为“榫眼”,而指向圆柱体的部分被标为“燕尾榫”。其次,物理结构不合理,两根方木的交接处呈现出一种不自然的融合感,缺乏真实的咬合缝隙,且圆柱木栓与方木的连接处木材纹理错乱,看起来像是直接“长”在一起而非组装而成。此外,右侧方木上的虚线标注毫无逻辑,未能准确勾勒出任何内部结构,属于典型的 AI 视觉幻觉。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在材质渲染和立体感方面表现出色,但在最核心的「燕尾榫结构准确性」上存在根本性错误——将燕尾榫的榫头渲染为圆柱形,完全丢失了燕尾榫梯形截面、两侧扩张防拔出的核心特征。这一错误导致图像虽然视觉效果精美,却无法作为燕尾榫的结构示意图使用。标注方面也存在方向指示缺失和标注内容与结构不符的问题。综合来看,图像完成了部分提示词要求(半分离状态、木纹纹理、基本标注),但在最关键的「燕尾榫形态」这一核心要求上严重失分。 【GEMINI】这是一张在视觉表现力上尚可,但在核心逻辑和专业知识上严重失败的图像。模型完全未能理解「燕尾榫」这一特定中国传统木工结构的几何特征,仅通过堆砌木材构件和随机贴上专业标签来应付指令,导致图像失去了作为「结构示意图」的教学与参考价值。 【KIMI】该图像在视觉表现层面具备一定专业度,但在核心任务——准确呈现「燕尾榫」结构——上遭遇失败。模型似乎混淆了「燕尾榫」作为特定榫型的技术定义,将其泛化为「某种榫卯连接」的模糊概念,导致结构类型、构件命名、标注逻辑三重错误。这反映出AI对中国传统木工术语与结构原理的理解停留在表面视觉模仿,缺乏真正的工艺知识支撑。空间立体感与纹理表现尚可,但无法弥补结构性错误的硬伤。

困难难度评测结果

  • 得分:66.7 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中展示了一个仿中国传统建筑“斗拱”结构的木质模型示意图。该模型由三层复杂的榫卯结构垂直叠加而成,中心由一根粗壮的木柱贯穿,整体呈现出由下至上逐渐向外挑出的倒金字塔形态。木材呈现深浅不一的棕褐色,纹理清晰。画面两侧带有大量的文字标注和虚线引线,试图解释各部件的名称。 然而,作为 AI 生成的图片,画面存在明显的逻辑和细节缺陷:首先,文字标注虽然看起来像汉字,但大多是无法辨认的“伪汉字”或乱码,笔画扭曲且毫无意义。其次,斗拱的结构逻辑混乱,木件之间的穿插关系不符合真实的力学原理,部分构件在空间上相互重叠或凭空消失。此外,背景的虚线标注与实物位置对齐不准,右下角还有一个重复且模糊的小缩略图,显示了典型的 AI 拼贴痕迹。整体透视虽然看起来宏大,但经不起细致的工程学推敲。

画面中展示了一个仿中国传统建筑“斗拱”结构的木质模型示意图。该模型由三层复杂的榫卯结构垂直叠加而成,中心由一根粗壮的木柱贯穿,整体呈现出由下至上逐渐向外挑出的倒金字塔形态。木材呈现深浅不一的棕褐色,纹理清晰。画面两侧带有大量的文字标注和虚线引线,试图解释各部件的名称。

然而,作为 AI 生成的图片,画面存在明显的逻辑和细节缺陷:首先,文字标注虽然看起来像汉字,但大多是无法辨认的“伪汉字”或乱码,笔画扭曲且毫无意义。其次,斗拱的结构逻辑混乱,木件之间的穿插关系不符合真实的力学原理,部分构件在空间上相互重叠或凭空消失。此外,背景的虚线标注与实物位置对齐不准,右下角还有一个重复且模糊的小缩略图,显示了典型的 AI 拼贴痕迹。整体透视虽然看起来宏大,但经不起细致的工程学推敲。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像基本完成了斗拱爆炸分解示意图的框架搭建,三层分解结构、色差区分、缩略参考图等核心要素均有呈现。然而,最致命的问题在于标注文字的大量错误——AI生成的构件名称存在明显的字符错误与生造词,严重损害了图像作为「技术示意图」的专业可信度。此外,榫卯接口细节不足、昂的形态不准确等结构问题也拉低了整体评分。综合来看,该图像属于「有框架、缺精度」的典型AI生成问题,距离真正的博物馆展陈级别示意图仍有较大差距。 【GEMINI】这张图像在视觉美学上非常接近专业博物馆展陈图,木质感和空间布局令人印象深刻。然而,作为一张技术示意图,它在核心的‘准确性’上表现糟糕:文字标注全是乱码错字,榫卯结构经不起推敲,构件间的逻辑关系仅停留在表面堆叠。它是一张优秀的艺术创作,但作为工程或学术参考则是完全失败的。 【KIMI】该图像在「形似」层面完成了斗拱结构的粗略示意,但在「工程准确性」与「信息传达」层面存在系统性缺陷。核心问题在于 AI 对中国传统木构建筑的结构逻辑理解肤浅:斗拱作为层层出跳、中轴贯通的力学系统,其垂直对齐关系、榫卯咬合原理、构件命名规范均未得到正确呈现。标注系统的混乱与术语错误进一步削弱了图像作为「示意图」的功能价值。建议评分 52-55 分区间,属于「需要大幅修改方可使用」的质量水平。若用于教育或出版场景,需由专业古建筑学者与插画师重新绘制。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...