wan2.7-image-pro 在「俯视视角」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:wan2.7-image-pro
  • 用例名称:俯视视角
  • 测试类型:图像生成
  • 评测维度:透视视角

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张图片:从正上方俯视一个圆形的白色陶瓷盘子,盘子中央放着一个红色的苹果。背景是深色的木质桌面,光线从上方均匀照射,苹果和盘子的影子清晰可见。

任务要求

AI 模型需要满足以下要求:

  1. 图像采用严格的正上方垂直俯视角度(Top-down view),仅能看到盘子和苹果的顶部平面,不应出现明显的侧面透视
  2. 盘子在俯视视角下呈现为正圆形或接近正圆形(长短轴比不低于0.85)
  3. 红色苹果位于白色陶瓷盘子的中央位置,偏移量不超过盘子半径的25%
  4. 背景为深色木质桌面,木纹纹理可见,整体色调较深,与白色盘子形成明显对比
  5. 光线从正上方照射,苹果和盘子在桌面或盘面上产生可见阴影,阴影应呈现顶光特征(短小、位于物体正下方边缘)

评测结果

综合得分

该模型在此用例的得分为:77.8 分(满分 100 分),已通过

基础难度评测结果

  • 得分:77.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:wan2.7-image-pro
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】图像整体构图美观,元素齐全,基本符合提示词的核心要求,但在两个关键技术点上存在偏差:其一,视角未达到严格的90度垂直俯视,略带倾斜导致侧面透视感;其二,光影方向与「正上方均匀照射」的要求不符,阴影呈现侧光特征而非顶光特征。空间布局和元素内容表现良好,综合加权后属于「基本完成但有明显瑕疵」的水平。 【GEMINI】这张图片在材质渲染和基本构图上表现优秀,但在执行‘严格俯视’和‘顶光光影’这两个硬性技术指标上出现了明显偏差。AI倾向于生成更具立体感的斜上方光影,而非提示词要求的平面化、科学化的顶视效果。视角处理上未能完全克服透视投影的惯性。 【KIMI】该图像基本完美地完成了提示词要求,视角、空间布局和光影表现都达到了较高水平,仅有少量细节可以改进。

进阶难度评测结果

  • 得分:78.6 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:wan2.7-image-pro
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在场景元素完整性方面表现较好,六类核心元素基本齐全,光影方向逻辑正确。但最核心的问题在于视角未能达到严格的高空垂直俯视(Bird's eye view)标准,而是呈现为斜角俯视,导致建筑侧立面可见、圆形花坛变形为椭圆、远近端元素比例失调等连锁问题。这是对提示词「高空俯视视角」要求的明显偏差,影响了整体评分。 【GEMINI】图像在元素完整性上表现出色,准确捕捉了繁忙十字路口的所有细节。然而,作为一次针对‘垂直俯视’能力的专项测试,该模型未能克服常见的视角倾斜问题,未能提供纯粹的平面展开视觉效果。几何形状的保真度受视角影响产生形变,阴影处理略显粗糙,未能达到专业摄影/制图级别的几何严谨性。 【KIMI】总体而言,图像较好地完成了提示词要求,视角准确,场景元素完整,几何形状和阴影逻辑基本正确。但在行人数量和阴影细节上仍有改进空间。

困难难度评测结果

  • 得分:65.0 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:wan2.7-image-pro
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在场景元素完整性上表现尚可,成功包含了提示词要求的大部分场景组件(棋盘、棋手、计时钟、记谱纸、咖啡)。然而在核心技术要求上存在多处明显失误:视角未达到严格90度垂直俯视(圆形物体呈椭圆、棋盘有梯形变形);最关键的棋子位置要求(白方王后e4、黑方马f6)完全无法验证;棋子布局严重失真,数量和分布不符合国际象棋规则。综合来看,图像在「氛围营造」上有一定成效,但在提示词的核心技术要求(精确视角、精确棋子位置、合理棋局布局)上均存在明显缺陷。 【GEMINI】这是一张在视觉美感上尚可,但在执行‘极端透视约束’和‘特定逻辑细节’上表现欠佳的图像。作为专业评审,我认为模型在处理‘严格垂直视角’这一摄影基本功时产生了妥协,导致几何图形的纯粹性受损。同时,对国际象棋坐标的理解仍停留在概率分布而非精确指令执行上,未能完全拉开与中端模型的差距。 【KIMI】这张AI生成的图像在整体上较好地完成了提示词的要求,特别是在视角准确度方面表现突出。但在空间逻辑对齐和几何保真度方面仍有改进空间,部分棋子的分布和轮廓清晰度需要进一步优化。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...