wan2.7-image-pro 在「前后关系」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:wan2.7-image-pro
  • 用例名称:前后关系
  • 测试类型:图像生成
  • 评测维度:空间关系

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张图片:一棵大树在一座小房子的前面 要求: - 树明显遮挡住房子的一部分 - 透视关系正确 - 阳光明媚的场景

任务要求

AI 模型需要满足以下要求:

  1. 画面中必须同时出现一棵大树和一座小房子,大树位于房子的正前方(更靠近观察者),两者须有明确的前后层次区分
  2. 大树须遮挡房子至少约 20% 的可见区域(如遮挡部分墙体、屋顶或门窗),遮挡边缘自然清晰,不得出现树与房子相互穿插或融合的错误
  3. 大树与房子的大小比例须符合近大远小的透视规律,画面应呈现出清晰的空间纵深感
  4. 场景光照须呈现阳光明媚的晴天效果,光照方向统一,树木与房子均应有明确的受光面与投影,整体色调明亮温暖

评测结果

综合得分

该模型在此用例的得分为:86.0 分(满分 100 分),已通过

基础难度评测结果

  • 得分:86.0 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:wan2.7-image-pro
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张高质量完成提示词要求的 AI 生成图像。核心任务「测试前后遮挡关系」完成出色:大树明确位于房子前方并形成有效遮挡,透视关系准确,阳光明媚的场景氛围真实自然。三个评分维度均达到优秀水平,没有明显瑕疵或违背提示词的问题。画面在完成功能性要求的同时,还展现了较高的美学质量和细节还原度。综合表现属于该类测试任务的高分范例。 【GEMINI】该图像在宏观构图上完成了提示词的要求,但在微观物理逻辑上存在典型AI瑕疵。遮挡关系(Occlusion)仅停留在‘位置重叠’层面,未能处理好物体交界处的边缘关系及阴影投射。若要达到商业级插画或摄影标准,需修正穿模问题并补全投影逻辑。 【KIMI】整体上,图像较好地完成了提示词的要求。大树与房子的遮挡关系自然,透视关系基本合理,阳光明媚的场景还原较好。但在房子屋顶与树干的比例上略有不协调,需要微调。

进阶难度评测结果

  • 得分:76.2 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:wan2.7-image-pro
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张完成度较高的图像,准确实现了提示词要求的三层空间结构和透视关系。山、树、花三个主体清晰可辨,空间层次分明,遮挡逻辑基本正确。主要扣分点在于:花朵与树木之间缺乏直接遮挡交互,以及花朵的视觉体量相对树木不够突出,导致透视对比度略显不足。但这些问题并不严重,整体表现优秀,符合提示词的核心要求。 【GEMINI】本次生成任务在‘空间遮挡’这一核心测试点上表现极差。模型未能理解提示词要求的极端透视布局,而是按照常规风景画的逻辑将元素散乱排布。最关键的‘遮挡关系’与‘近大远小比例’均未达标,仅勉强完成了元素的堆砌,未能体现出复杂的空间层级处理能力。 【KIMI】整体上,这张图像较好地完成了提示词的要求,空间层次分布和透视比例基本合理,遮挡关系也基本正确。但山的尺寸略大,可以进一步优化以增强透视效果。

困难难度评测结果

  • 得分:82.0 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:wan2.7-image-pro
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张对提示词要求完成度极高的AI生成图像。图像准确呈现了镜面反射的核心物理规律:人物站在镜子前,举起右手在镜中正确显示为左手,T恤文字在镜中呈现完美的镜像翻转效果。镜面反射的边界清晰,反射内容严格限定在镜框范围内,空间逻辑一致。构图合理,人物与镜子的相对位置符合现实场景。四个评分维度均达到90分以上,展现了模型在处理复杂镜像物理关系方面的强大能力。这是一张几乎无可挑剔的高质量生成图像。 【GEMINI】该图像在视觉美感上尚可,但在核心逻辑层面是一次彻底的失败。它未能理解‘镜像’的本质,仅仅是简单地在镜框区域内生成了一个相同动作的副本。对于要求严格遵循物理规律的测试点(文字反转、左右手互换),模型表现极差,无法通过专业级的视觉逻辑审核。 【KIMI】整体上,这张AI生成的图像在镜像反射的物理规律、手部左右方位的镜像准确性、T恤文字的镜像反转效果以及空间构图方面表现良好,基本符合提示词要求。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...