Google: Gemini 3.1 Flash Image Preview (Nano Banana 2) 在「中式榫卯结构拆解图生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：Google: Gemini 3.1 Flash Image Preview (Nano Banana 2)
用例名称：中式榫卯结构拆解图生成
测试类型：图像生成
评测维度：物体生成

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一张中国传统木工「燕尾榫」的结构拆解示意图。要求： - 展示榫头与榫眼两个独立木件 - 清晰呈现燕尾形状的凹凸咬合结构 - 图像背景简洁，木件轮廓清晰

任务要求

AI 模型需要满足以下要求：

图像中可识别出两个独立的木构件（榫头件与榫眼件）
燕尾榫的梯形榫头形态清晰可辨
榫眼的凹槽形状与榫头形态对应匹配
整体画面清晰，构件轮廓无歧义
图像具有一定的立体感或透视感

评测结果

综合得分

该模型在此用例的得分为：80.0 分（满分 100 分），已通过

基础难度评测结果

得分：80.0 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一张燕尾榫木工结构的拆解示意图。画面背景为米白色，主体是两块浅棕色实木板，左侧木板水平放置，末端切割成梯形的“燕尾”凸起；右侧木板垂直倾斜，侧面开有对应的方形凹槽。画面配有中文和英文标注，解释了榫头、卯眼等专业术语。然而，作为一张 AI 生成的图片，其逻辑存在严重错误：左侧的“燕尾”凸起呈梯形，而右侧对应的“卯眼”凹槽却是正方形，两者在几何形状上完全无法匹配咬合。此外，标注文字也存在术语混淆，例如将榫头标注为“Tail Piece - Pins”，在木工逻辑上不够严谨。右侧木板的透视关系略显生硬，凹槽的深度与木板厚度比例失调，是一张视觉上具有误导性的示意图。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这张图像在视觉呈现质量上相当出色，清晰度、立体感和标注体系均达到较高水准，具备专业示意图的品质。然而，作为「燕尾榫」结构拆解图，其最核心的结构特征——燕尾形（梯形斜面）的榫头与对应梯形凹槽的榫眼——并未得到准确呈现，两个构件的端部形态更接近矩形直角榫。这一结构准确性的缺失是最主要的扣分点，但图像在其他方面的完成度弥补了部分分数。【GEMINI】这是一张视觉表现力极佳但结构逻辑存在致命伤的 AI 生成图。作为摄影或设计作品，其光影和材质无可挑剔；但作为「结构拆解示意图」，它完全失败了——榫头与榫眼的形状互不匹配，违背了木工基本原理，属于典型的「画得像但不能用」。【KIMI】该图像在视觉表现层面具备一定专业度，但在核心结构准确性上存在致命缺陷。燕尾榫的本质特征——梯形咬合与自锁机制——被完全误解，榫眼做成矩形直槽是原则性错误，这使得图像作为「示意图」的功能失效。术语标注的混乱进一步暴露了模型对传统木工知识的理解不足。建议重新理解燕尾榫的几何原理：榫头呈外宽内窄的梯形，榫眼呈对应的外大内小的扩口空间，两者结合后形成无法脱开的机械互锁。

进阶难度评测结果

得分：82.7 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

画面中展示了一张关于木工“燕尾榫”结构的示意图，背景为米白色。图中包含两块具有清晰木纹质感的浅褐色木材，分别标注为 A 和 B。上方木块 A 的末端有一个凸起的梯形“榫头”，下方木块 B 的对应位置有一个凹陷的“榫眼”，两者通过虚线箭头指示拼接方向。左侧有黑色简体中文字样“燕尾榫”、“榫头”和“榫眼”。这张图片存在明显的 AI 生成逻辑错误：首先，木块 A 上的榫头形状与木块 B 上的榫眼在几何逻辑上无法匹配，榫头的侧面斜度与榫眼的开口方向冲突，实际无法垂直嵌入；其次，木块 B 的透视关系异常，其左侧切面与整体长方体结构不符合物理常识；此外，木块 A 上重复出现了两个字母 A，且文字与指示线的排版略显生硬，线条末端有细微的溢出，反映了 AI 在处理精密结构图时的局限性。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这是一张质量较高的燕尾榫结构拆解示意图，整体完成度良好。图像准确传达了燕尾榫的核心结构逻辑，半分离状态表达清晰，木材质感真实，标注信息完整，空间立体感出色。主要不足在于燕尾角度偏小、榫眼内部细节略显不足，但这些属于细节层面的问题，不影响整体信息传达。综合来看，该图像基本满足提示词的全部要求，是一张合格且较为优秀的技术示意图。【GEMINI】这是一张优秀的教学示意图，准确地完成了提示词中关于燕尾榫结构拆解的所有核心要求。标注清晰、透视准确，极具实用价值。唯一的显著缺点在于木工专业逻辑的缺失，即木纹走向与榫头受力结构的矛盾，这反映了模型对物理常识的理解尚浅，但在视觉传达层面已达到高水准。【KIMI】这是一张「看起来专业但结构完全错误」的典型AI生成图。模型似乎理解了燕尾榫的「梯形」视觉特征，却未能掌握其「外宽内窄、自锁咬合」的核心力学原理，导致榫头与榫眼呈镜像错误。这种错误对于教学或技术说明用途具有严重误导性。编号系统的混乱与透视不一致进一步暴露了空间理解能力的不足。建议重新生成时明确指定「榫头外宽内窄、榫眼外窄内宽」的几何约束。

困难难度评测结果

得分：78.8 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一张中国传统建筑“斗拱”结构的爆炸拆解示意图。画面背景为淡雅的米黄色，呈现出一种复古的工程图纸质感。中心位置垂直排列着数个木质构件，包括栌斗、华拱、昂等，它们呈现出自然的木材纹理，并通过虚线连接以指示组装位置。画面左右两侧带有中英文对照的标注，左下角还有一个展示组装完成状态的小缩略图。作为一张 AI 生成的图片，画面中存在明显的逻辑和文字缺陷。首先，文字标注出现了多处拼写错误和逻辑混乱，例如“小斗”被拼写为“Siaodou”（应为 Xiaodou），“三台”被标注为“Santaixin Angtou”，且部分英文说明与中文术语并不完全对应。其次，在结构逻辑上，部分木构件的榫卯开口位置与连接虚线无法精准对齐，存在透视上的偏差。最底部的“栌斗”被标注为“护斗”，且右下角的说明文字中出现了字符重叠和乱码现象，体现了 AI 在处理精细图表和文字排版时的局限性。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这是一张高质量的斗拱结构爆炸分解示意图，全面满足并在多处超越了提示词的要求。图像在结构层级展示、双语标注体系、木材纹理表现和整体视觉风格四个维度上均表现出色。主要不足集中在细节层面：「Siaodou」拼音拼写错误、昂构件斜度不够准确、以及「小斗」标注的轻微混淆。这些问题不影响图像的整体使用价值，但在专业学术或博物馆展陈场景中需要修正。综合来看，该图像达到了工程制图与博物馆展陈示意图的专业标准，是AI生成传统建筑技术图解的优秀案例。【GEMINI】这是一张视觉表现力极佳但专业逻辑漏洞百出的示意图。作为插画，它成功营造了工程制图的氛围，木材质感极具欺骗性；但作为技术图解，其标注文字的拼写错误、引线指向错误以及榫卯结构的几何不匹配，使其失去了教学或参考价值。模型在视觉风格上完成了任务，但在中国传统建筑知识图谱的准确性上表现欠佳。【KIMI】该图像在视觉风格上成功模仿了工程制图与博物馆展陈的 aesthetic，但在核心任务——斗拱结构的准确性上失败严重。AI 对「斗拱」这一具体传统木工结构的理解停留在表面形态模仿，生成了「Santai Xin Angtou」等虚构构件，且榫卯接口的空间逻辑多处断裂。标注系统的命名混乱（重复标签、中英文错位、编号断裂）进一步削弱了作为技术图纸的功能性。这是一张「看起来像那么回事」但「经不起专业审视」的示意图，适合作为装饰性插图，无法作为结构参考。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

进阶难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

困难难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

相关链接

反馈评测问题