doubao-seedream-4-0 在「三点透视」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:doubao-seedream-4-0
  • 用例名称:三点透视
  • 测试类型:图像生成
  • 评测维度:透视视角

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张图片:一个简单的立方体房间内部,从房间的一个角落向对角看去,能清晰看到三面墙壁、地板和天花板都向不同的消失点汇聚,展现基础的三点透视效果。房间内只有一把椅子放在中央。

任务要求

AI 模型需要满足以下要求:

  1. 图像成功生成,无技术性错误(如黑屏、严重噪点、内容缺失)
  2. 采用极端俯视或仰视视角(大仰角或大俯角),使垂直边缘线明显向画面上方(天点)或下方(地点)汇聚,形成清晰的第三消失点,而非默认平视的两点透视
  3. 立方体房间内部呈现三点透视:两组水平线分别向左右两侧消失点汇聚,所有垂直线(墙角线、门框线等)向同一个垂直方向消失点汇聚,三组透视线均不平行于画框边缘
  4. 视角为从房间一个角落向对角方向看去,画面中可同时清晰看到三面墙壁、地板和天花板,角落的竖向交线可见
  5. 房间中央放置一把椅子,椅子的透视方向与房间保持一致,椅子尺寸与房间空间比例合理,符合近大远小的透视规律

评测结果

综合得分

该模型在此用例的得分为:45.7 分(满分 100 分),未通过

基础难度评测结果

  • 得分:45.7 分
  • 通过状态:未通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中是一幅极简风格的铅笔素描,描绘了一个空旷、封闭的矩形房间。构图采用了典型的一点透视法,四周的墙线向中心汇聚,勾勒出天花板、地板和三面墙壁的轮廓。房间中央偏左的位置孤零零地摆放着一把木质靠背椅,椅子带有简单的阴影,投射在左侧的墙角处。整幅画作以白纸为底,线条呈现出铅笔特有的灰色质感,给人一种冷清、压抑或孤独的视觉感受。 在 AI 生成的细节方面,画面存在明显的透视逻辑缺陷:椅子的透视角度与房间整体的透视线并不统一,显得有些漂浮。最明显的缺陷在于阴影的处理,椅子下方的投影形状生硬,且与左侧墙壁上莫名出现的竖向排线阴影在逻辑上无法自洽。此外,房间右上角的汇聚线并未精准交汇在顶点,线条略显抖动且粗细不均,暴露出 AI 在处理严谨几何透视时的局限性。

画面中是一幅极简风格的铅笔素描,描绘了一个空旷、封闭的矩形房间。构图采用了典型的一点透视法,四周的墙线向中心汇聚,勾勒出天花板、地板和三面墙壁的轮廓。房间中央偏左的位置孤零零地摆放着一把木质靠背椅,椅子带有简单的阴影,投射在左侧的墙角处。整幅画作以白纸为底,线条呈现出铅笔特有的灰色质感,给人一种冷清、压抑或孤独的视觉感受。

在 AI 生成的细节方面,画面存在明显的透视逻辑缺陷:椅子的透视角度与房间整体的透视线并不统一,显得有些漂浮。最明显的缺陷在于阴影的处理,椅子下方的投影形状生硬,且与左侧墙壁上莫名出现的竖向排线阴影在逻辑上无法自洽。此外,房间右上角的汇聚线并未精准交汇在顶点,线条略显抖动且粗细不均,暴露出 AI 在处理严谨几何透视时的局限性。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】图像在技术执行层面是一张合格的铅笔素描,但对提示词的核心要求——「三点透视」和「从角落向对角看去的视角」——均未能实现。生成结果是一张教科书级别的一点透视室内草图,与提示词要求的三点透视在概念上存在根本差异。这不是细节瑕疵,而是对核心任务的理解性失败。perspective_accuracy 维度作为50%权重的核心维度,得分仅28分,直接拉低整体表现。若提示词仅要求「一点透视室内素描」,此图可得75分以上;但在「测试模型处理复杂透视」的任务背景下,该图像几乎完全未能完成测试目标。 【GEMINI】该生成结果在透视理论上存在严重偏差。提示词明确要求「三点透视」并解释了垂直线需向消失点汇聚,但模型仅给出了最基础的、垂直线平行的两点透视。空间布局上也未遵循「椅子放在中央」的指令,导致构图局促且逻辑错误。这是一张典型的未能理解复杂空间几何要求的失败案例。 【KIMI】这是一张在基础透视概念上失败的图像。模型未能理解「三点透视」的核心定义——垂直线必须向第三消失点汇聚,而是生成了标准的两点透视房间。尽管线条干净、结构内部自洽,但完全违背了提示词最关键的技术要求。椅子位置与比例问题进一步降低了完成度。作为「测试模型处理复杂透视」的任务,此图在核心维度上不及格,仅可作为两点透视的合格示例,而非三点透视。

进阶难度评测结果

  • 得分:68.6 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中展示了一个宏伟的圆形图书馆内部,采用仰视构图,呈现出强烈的视觉冲击力。中心是一个巨大的圆形玻璃天窗,阳光从中透射进来,照亮了整个空间。围绕着中心天窗,无数层圆环状的书架螺旋上升,每一层都摆满了密密麻麻的书籍。色调以柔和的米白色和深木色为主,环形边缘点缀着暖黄色的隐形灯带,营造出一种宁静而深邃的学术氛围。然而,作为一张 AI 生成的图片,画面存在明显的逻辑缺陷:书架的螺旋结构在透视上并不连贯,部分楼层的护栏与书架重叠模糊,且书籍的细节在放大后呈现出无意义的色块堆叠。最显著的问题在于,这些圆环似乎悬浮在空中,缺乏支撑结构的物理合理性,且天窗的几何线条在边缘处显得杂乱且不对称。

画面中展示了一个宏伟的圆形图书馆内部,采用仰视构图,呈现出强烈的视觉冲击力。中心是一个巨大的圆形玻璃天窗,阳光从中透射进来,照亮了整个空间。围绕着中心天窗,无数层圆环状的书架螺旋上升,每一层都摆满了密密麻麻的书籍。色调以柔和的米白色和深木色为主,环形边缘点缀着暖黄色的隐形灯带,营造出一种宁静而深邃的学术氛围。然而,作为一张 AI 生成的图片,画面存在明显的逻辑缺陷:书架的螺旋结构在透视上并不连贯,部分楼层的护栏与书架重叠模糊,且书籍的细节在放大后呈现出无意义的色块堆叠。最显著的问题在于,这些圆环似乎悬浮在空中,缺乏支撑结构的物理合理性,且天窗的几何线条在边缘处显得杂乱且不对称。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在技术执行层面相当精良,仰视同心圆构图的视觉冲击力强,近大远小的透视缩放规律准确,天窗位置与光线方向符合仰视逻辑。然而,图像在完成提示词最核心的测试目标——「三点透视」上存在根本性缺陷:水平方向的左消失点和右消失点完全缺失,所有水平结构线以弧线而非汇聚直线呈现,实质上是「单点仰视圆形透视」而非「三点透视」。此外,「螺旋上升」的建筑叙事也未能实现,各层书架呈水平环状叠加而非真正的螺旋坡道结构。作为「测试模型处理复杂透视」的任务,该图像选择了视觉上最安全、最规整的同心圆方案来规避三点透视的复杂性,本质上是对提示词核心挑战的回避。 【GEMINI】这张图片在视觉美感和纵深感营造上非常成功,但在「复杂透视测试」这一核心任务上表现欠佳。它回避了严谨的三点透视几何构造,转而使用更易生成的圆环放射状构图来模拟空间感。虽然满足了「螺旋上升」和「仰视」的意图,但未能准确执行提示词中关于三个具体消失点的透视逻辑要求,属于典型的「形似而神不似」的AI生成结果。 【KIMI】该图像在垂直方向的透视处理上基本达标,但核心失败在于未实现提示词要求的「三个不同方向的透视消失点」。水平方向的双消失点完全缺失,各层环形结构退化为同心圆放射模式,本质上是鱼眼畸变与单点透视的混合体,而非标准三点透视。此外,螺旋结构的比例一致性和光影纵深感均有明显缺陷。作为「复杂透视」测试,模型未能通过最关键的三点透视结构验证,仅完成约60%的提示词要求。

困难难度评测结果

  • 得分:64.5 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一个充满未来感和工业气息的室内空间,看起来像是一个巨大的地下交通枢纽或科技工厂。画面采用对称式构图,视觉中心是两条向深处延伸的自动扶梯或传送带,扶梯侧边散发出明亮的蓝色霓虹灯光。上方是复杂的工业结构,包括交错的银灰色金属管道、钢梁支撑以及带有红色指示灯的管线。两侧各有一组向上延伸的金属楼梯,整体色调以冷峻的深蓝色和银灰色为主,局部点缀着警示性的红色。 然而,画面中存在明显的 AI 生成缺陷:首先是透视逻辑混乱,中央延伸的轨道在尽头消失在不自然的漆黑阴影中,且轨道结构模糊不清。其次,天花板上的管道连接方式违背物理常识,许多管道在空中凭空截断或交错重叠。两侧的楼梯踏步细节模糊,与扶梯的衔接处显得生硬且不连贯。此外,画面中部的圆形平台护栏呈现出扭曲的线条,缺乏真实的建筑结构支撑感。

图中展示了一个充满未来感和工业气息的室内空间,看起来像是一个巨大的地下交通枢纽或科技工厂。画面采用对称式构图,视觉中心是两条向深处延伸的自动扶梯或传送带,扶梯侧边散发出明亮的蓝色霓虹灯光。上方是复杂的工业结构,包括交错的银灰色金属管道、钢梁支撑以及带有红色指示灯的管线。两侧各有一组向上延伸的金属楼梯,整体色调以冷峻的深蓝色和银灰色为主,局部点缀着警示性的红色。

然而,画面中存在明显的 AI 生成缺陷:首先是透视逻辑混乱,中央延伸的轨道在尽头消失在不自然的漆黑阴影中,且轨道结构模糊不清。其次,天花板上的管道连接方式违背物理常识,许多管道在空中凭空截断或交错重叠。两侧的楼梯踏步细节模糊,与扶梯的衔接处显得生硬且不连贯。此外,画面中部的圆形平台护栏呈现出扭曲的线条,缺乏真实的建筑结构支撑感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像本质上是一张现实建筑空间(地铁站或大型商业建筑)的摄影作品,而非AI生成的未来都市地下交通枢纽概念图。图像在技术摄影层面质量尚可,但与提示词的核心要求存在根本性偏差:磁悬浮轨道完全缺失、三点透视特征不明显、悬空观景平台视角未实现、轨道井深渊感为零、深度层次不足五个。提示词中最具挑战性的「三点透视复杂空间」测试目标几乎未被满足,画面更接近标准两点透视的建筑内景。综合加权得分约为70分(perspective_accuracy×0.5 + structural_consistency×0.3 + compositional_depth×0.2 ≈ 36+19.5+15.6 = 71.1),属于「部分完成要求,有多处需要改进」区间。 【GEMINI】该图像虽然在视觉元素上堆砌了管道、扶梯和发光轨道,基本符合未来地下枢纽的题材,但在核心任务「复杂透视处理」上表现不佳。模型完全忽略了「三点透视」的指令,垂直结构线呈平行状态,导致画面缺乏大俯角应有的深渊感和宏大尺度。空间层次虽多但逻辑混乱,未能形成统一的透视坐标系。 【KIMI】这是一张典型的「AI透视崩溃」案例——模型成功渲染了未来科技感的表面元素(金属、发光、管道),但完全未能建立统一的三点透视几何系统。提示词的核心挑战「复杂透视」被回避而非解决:轨道井被简化为对称的平行隧道,扶梯与主空间形成透视冲突,多层次空间要求被扁平化处理。画面乍看专业,细究则空间逻辑支离破碎,属于「氛围到位、结构失败」的类型。评分需严厉以拉开与真正掌握透视的模型差距。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...