wan2.7-image-pro 在「俯视视角」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：wan2.7-image-pro
用例名称：俯视视角
测试类型：图像生成
评测维度：透视视角

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一张图片：从正上方俯视一个圆形的白色陶瓷盘子，盘子中央放着一个红色的苹果。背景是深色的木质桌面，光线从上方均匀照射，苹果和盘子的影子清晰可见。

任务要求

AI 模型需要满足以下要求：

图像采用严格的正上方垂直俯视角度（Top-down view），仅能看到盘子和苹果的顶部平面，不应出现明显的侧面透视
盘子在俯视视角下呈现为正圆形或接近正圆形（长短轴比不低于0.85）
红色苹果位于白色陶瓷盘子的中央位置，偏移量不超过盘子半径的25%
背景为深色木质桌面，木纹纹理可见，整体色调较深，与白色盘子形成明显对比
光线从正上方照射，苹果和盘子在桌面或盘面上产生可见阴影，阴影应呈现顶光特征（短小、位于物体正下方边缘）

评测结果

综合得分

该模型在此用例的得分为：77.8 分（满分 100 分），已通过

基础难度评测结果

得分：77.8 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

AI 生成图片，模型：wan2.7-image-pro — 在新标签页中查看原图

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】图像整体构图美观，元素齐全，基本符合提示词的核心要求，但在两个关键技术点上存在偏差：其一，视角未达到严格的90度垂直俯视，略带倾斜导致侧面透视感；其二，光影方向与「正上方均匀照射」的要求不符，阴影呈现侧光特征而非顶光特征。空间布局和元素内容表现良好，综合加权后属于「基本完成但有明显瑕疵」的水平。【GEMINI】这张图片在材质渲染和基本构图上表现优秀，但在执行‘严格俯视’和‘顶光光影’这两个硬性技术指标上出现了明显偏差。AI倾向于生成更具立体感的斜上方光影，而非提示词要求的平面化、科学化的顶视效果。视角处理上未能完全克服透视投影的惯性。【KIMI】该图像基本完美地完成了提示词要求，视角、空间布局和光影表现都达到了较高水平，仅有少量细节可以改进。

进阶难度评测结果

得分：78.6 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像在场景元素完整性方面表现较好，六类核心元素基本齐全，光影方向逻辑正确。但最核心的问题在于视角未能达到严格的高空垂直俯视（Bird's eye view）标准，而是呈现为斜角俯视，导致建筑侧立面可见、圆形花坛变形为椭圆、远近端元素比例失调等连锁问题。这是对提示词「高空俯视视角」要求的明显偏差，影响了整体评分。【GEMINI】图像在元素完整性上表现出色，准确捕捉了繁忙十字路口的所有细节。然而，作为一次针对‘垂直俯视’能力的专项测试，该模型未能克服常见的视角倾斜问题，未能提供纯粹的平面展开视觉效果。几何形状的保真度受视角影响产生形变，阴影处理略显粗糙，未能达到专业摄影/制图级别的几何严谨性。【KIMI】总体而言，图像较好地完成了提示词要求，视角准确，场景元素完整，几何形状和阴影逻辑基本正确。但在行人数量和阴影细节上仍有改进空间。

困难难度评测结果

得分：65.0 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像在场景元素完整性上表现尚可，成功包含了提示词要求的大部分场景组件（棋盘、棋手、计时钟、记谱纸、咖啡）。然而在核心技术要求上存在多处明显失误：视角未达到严格90度垂直俯视（圆形物体呈椭圆、棋盘有梯形变形）；最关键的棋子位置要求（白方王后e4、黑方马f6）完全无法验证；棋子布局严重失真，数量和分布不符合国际象棋规则。综合来看，图像在「氛围营造」上有一定成效，但在提示词的核心技术要求（精确视角、精确棋子位置、合理棋局布局）上均存在明显缺陷。【GEMINI】这是一张在视觉美感上尚可，但在执行‘极端透视约束’和‘特定逻辑细节’上表现欠佳的图像。作为专业评审，我认为模型在处理‘严格垂直视角’这一摄影基本功时产生了妥协，导致几何图形的纯粹性受损。同时，对国际象棋坐标的理解仍停留在概率分布而非精确指令执行上，未能完全拉开与中端模型的差距。【KIMI】这张AI生成的图像在整体上较好地完成了提示词的要求，特别是在视角准确度方面表现突出。但在空间逻辑对齐和几何保真度方面仍有改进空间，部分棋子的分布和轮廓清晰度需要进一步优化。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

AI 评审点评

进阶难度评测结果

模型生成产物

AI 评审点评

困难难度评测结果

模型生成产物

AI 评审点评

相关链接

反馈评测问题