Google: Gemini 3.1 Flash Image Preview (Nano Banana 2) 在「中式榫卯结构拆解图生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:Google: Gemini 3.1 Flash Image Preview (Nano Banana 2)
- 用例名称:中式榫卯结构拆解图生成
- 测试类型:图像生成
- 评测维度:物体生成
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张中国传统木工「燕尾榫」的结构拆解示意图。 要求: - 展示榫头与榫眼两个独立木件 - 清晰呈现燕尾形状的凹凸咬合结构 - 图像背景简洁,木件轮廓清晰
任务要求
AI 模型需要满足以下要求:
- 图像中可识别出两个独立的木构件(榫头件与榫眼件)
- 燕尾榫的梯形榫头形态清晰可辨
- 榫眼的凹槽形状与榫头形态对应匹配
- 整体画面清晰,构件轮廓无歧义
- 图像具有一定的立体感或透视感
评测结果
综合得分
该模型在此用例的得分为:80.0 分(满分 100 分),已通过
基础难度评测结果
- 得分:80.0 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张燕尾榫木工结构的拆解示意图。画面背景为米白色,主体是两块浅棕色实木板,左侧木板水平放置,末端切割成梯形的“燕尾”凸起;右侧木板垂直倾斜,侧面开有对应的方形凹槽。画面配有中文和英文标注,解释了榫头、卯眼等专业术语。然而,作为一张 AI 生成的图片,其逻辑存在严重错误:左侧的“燕尾”凸起呈梯形,而右侧对应的“卯眼”凹槽却是正方形,两者在几何形状上完全无法匹配咬合。此外,标注文字也存在术语混淆,例如将榫头标注为“Tail Piece - Pins”,在木工逻辑上不够严谨。右侧木板的透视关系略显生硬,凹槽的深度与木板厚度比例失调,是一张视觉上具有误导性的示意图。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张图像在视觉呈现质量上相当出色,清晰度、立体感和标注体系均达到较高水准,具备专业示意图的品质。然而,作为「燕尾榫」结构拆解图,其最核心的结构特征——燕尾形(梯形斜面)的榫头与对应梯形凹槽的榫眼——并未得到准确呈现,两个构件的端部形态更接近矩形直角榫。这一结构准确性的缺失是最主要的扣分点,但图像在其他方面的完成度弥补了部分分数。 【GEMINI】这是一张视觉表现力极佳但结构逻辑存在致命伤的 AI 生成图。作为摄影或设计作品,其光影和材质无可挑剔;但作为「结构拆解示意图」,它完全失败了——榫头与榫眼的形状互不匹配,违背了木工基本原理,属于典型的「画得像但不能用」。 【KIMI】该图像在视觉表现层面具备一定专业度,但在核心结构准确性上存在致命缺陷。燕尾榫的本质特征——梯形咬合与自锁机制——被完全误解,榫眼做成矩形直槽是原则性错误,这使得图像作为「示意图」的功能失效。术语标注的混乱进一步暴露了模型对传统木工知识的理解不足。建议重新理解燕尾榫的几何原理:榫头呈外宽内窄的梯形,榫眼呈对应的外大内小的扩口空间,两者结合后形成无法脱开的机械互锁。
进阶难度评测结果
- 得分:82.7 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中展示了一张关于木工“燕尾榫”结构的示意图,背景为米白色。图中包含两块具有清晰木纹质感的浅褐色木材,分别标注为 A 和 B。上方木块 A 的末端有一个凸起的梯形“榫头”,下方木块 B 的对应位置有一个凹陷的“榫眼”,两者通过虚线箭头指示拼接方向。左侧有黑色简体中文字样“燕尾榫”、“榫头”和“榫眼”。 这张图片存在明显的 AI 生成逻辑错误:首先,木块 A 上的榫头形状与木块 B 上的榫眼在几何逻辑上无法匹配,榫头的侧面斜度与榫眼的开口方向冲突,实际无法垂直嵌入;其次,木块 B 的透视关系异常,其左侧切面与整体长方体结构不符合物理常识;此外,木块 A 上重复出现了两个字母 A,且文字与指示线的排版略显生硬,线条末端有细微的溢出,反映了 AI 在处理精密结构图时的局限性。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张质量较高的燕尾榫结构拆解示意图,整体完成度良好。图像准确传达了燕尾榫的核心结构逻辑,半分离状态表达清晰,木材质感真实,标注信息完整,空间立体感出色。主要不足在于燕尾角度偏小、榫眼内部细节略显不足,但这些属于细节层面的问题,不影响整体信息传达。综合来看,该图像基本满足提示词的全部要求,是一张合格且较为优秀的技术示意图。 【GEMINI】这是一张优秀的教学示意图,准确地完成了提示词中关于燕尾榫结构拆解的所有核心要求。标注清晰、透视准确,极具实用价值。唯一的显著缺点在于木工专业逻辑的缺失,即木纹走向与榫头受力结构的矛盾,这反映了模型对物理常识的理解尚浅,但在视觉传达层面已达到高水准。 【KIMI】这是一张「看起来专业但结构完全错误」的典型AI生成图。模型似乎理解了燕尾榫的「梯形」视觉特征,却未能掌握其「外宽内窄、自锁咬合」的核心力学原理,导致榫头与榫眼呈镜像错误。这种错误对于教学或技术说明用途具有严重误导性。编号系统的混乱与透视不一致进一步暴露了空间理解能力的不足。建议重新生成时明确指定「榫头外宽内窄、榫眼外窄内宽」的几何约束。
困难难度评测结果
- 得分:78.8 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张中国传统建筑“斗拱”结构的爆炸拆解示意图。画面背景为淡雅的米黄色,呈现出一种复古的工程图纸质感。中心位置垂直排列着数个木质构件,包括栌斗、华拱、昂等,它们呈现出自然的木材纹理,并通过虚线连接以指示组装位置。画面左右两侧带有中英文对照的标注,左下角还有一个展示组装完成状态的小缩略图。 作为一张 AI 生成的图片,画面中存在明显的逻辑和文字缺陷。首先,文字标注出现了多处拼写错误和逻辑混乱,例如“小斗”被拼写为“Siaodou”(应为 Xiaodou),“三台”被标注为“Santaixin Angtou”,且部分英文说明与中文术语并不完全对应。其次,在结构逻辑上,部分木构件的榫卯开口位置与连接虚线无法精准对齐,存在透视上的偏差。最底部的“栌斗”被标注为“护斗”,且右下角的说明文字中出现了字符重叠和乱码现象,体现了 AI 在处理精细图表和文字排版时的局限性。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张高质量的斗拱结构爆炸分解示意图,全面满足并在多处超越了提示词的要求。图像在结构层级展示、双语标注体系、木材纹理表现和整体视觉风格四个维度上均表现出色。主要不足集中在细节层面:「Siaodou」拼音拼写错误、昂构件斜度不够准确、以及「小斗」标注的轻微混淆。这些问题不影响图像的整体使用价值,但在专业学术或博物馆展陈场景中需要修正。综合来看,该图像达到了工程制图与博物馆展陈示意图的专业标准,是AI生成传统建筑技术图解的优秀案例。 【GEMINI】这是一张视觉表现力极佳但专业逻辑漏洞百出的示意图。作为插画,它成功营造了工程制图的氛围,木材质感极具欺骗性;但作为技术图解,其标注文字的拼写错误、引线指向错误以及榫卯结构的几何不匹配,使其失去了教学或参考价值。模型在视觉风格上完成了任务,但在中国传统建筑知识图谱的准确性上表现欠佳。 【KIMI】该图像在视觉风格上成功模仿了工程制图与博物馆展陈的 aesthetic,但在核心任务——斗拱结构的准确性上失败严重。AI 对「斗拱」这一具体传统木工结构的理解停留在表面形态模仿,生成了「Santai Xin Angtou」等虚构构件,且榫卯接口的空间逻辑多处断裂。标注系统的命名混乱(重复标签、中英文错位、编号断裂)进一步削弱了作为技术图纸的功能性。这是一张「看起来像那么回事」但「经不起专业审视」的示意图,适合作为装饰性插图,无法作为结构参考。
相关链接
您可以通过以下链接查看更多相关内容: