wan2.7-image-pro 在「六个物体排列」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:wan2.7-image-pro
  • 用例名称:六个物体排列
  • 测试类型:图像生成
  • 评测维度:数量控制

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

六个红色苹果整齐地摆放在白色桌面上,呈2x3的矩形排列,每个苹果大小相似,表面光滑有光泽。

任务要求

AI 模型需要满足以下要求:

  1. 图像中必须恰好包含6个红色苹果,多于或少于6个均视为不合格,每个苹果须独立可辨,边界清晰,不得出现苹果融合或严重遮挡导致数量无法准确判定的情况
  2. 6个苹果须严格排列为2行3列的矩形网格布局(横向3个为一行,纵向共2行),行与行、列与列之间对齐整齐,间距分布均匀
  3. 所有苹果须放置于白色桌面之上,桌面颜色应为白色或接近白色的浅色,桌面作为主要背景清晰可见
  4. 6个苹果的大小须视觉上基本一致,每个苹果表面应呈现红色且具有光滑光泽的质感,无明显形态畸变或颜色严重偏差

评测结果

综合得分

该模型在此用例的得分为:92.6 分(满分 100 分),已通过

基础难度评测结果

  • 得分:92.6 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:wan2.7-image-pro
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张几乎完美完成提示词要求的生成图像。模型准确生成了6个红色苹果,并严格按照2x3矩形网格排列,行列对齐整齐、间距均匀。所有苹果的颜色、大小、光泽质感保持高度一致,白色桌面背景清晰。唯一可提及的是苹果表面的高光反射呈现出较为规则的白色条纹,略显程式化,但这并不影响对提示词核心要求的满足。整体而言,该图像在数量、排列、属性三个维度均表现优异,达到了高质量生成标准。 【GEMINI】该模型在执行简单数量指令上表现出色,但在处理严苛的几何排列(网格对齐)和物体尺寸一致性方面仍有改进空间。画面质感达到了专业摄影的水准,但作为设计素材使用时,其排版规则性尚不达标。 【KIMI】图像基本完美地完成了提示词要求,苹果的数量、排列和属性均符合描述。

进阶难度评测结果

  • 得分:68.4 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:wan2.7-image-pro
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在背景质量、色彩多样性和空间布局方面表现良好,森林场景自然真实,蝴蝶姿态丰富。但在核心测试目标「生成并排列六个物体」上严重失败——实际蝴蝶数量至少为10-11只,远超要求的6只,这是数量控制能力的重大缺陷。尽管视觉效果丰富,但未能精准执行提示词的数量约束,导致整体评价大幅下降。 【GEMINI】作为一名评审员,该模型在理解‘数量’和‘特定空间布局’方面表现欠佳。虽然单体蝴蝶的渲染质量尚可,但未能严格执行提示词中的约束性条件(如数量、高度层次、停落姿态、小径背景)。这是一张视觉尚可但逻辑任务失败的图像。 【KIMI】整体上,图像较好地完成了提示词的要求,蝴蝶的数量、花纹和颜色的多样性以及背景的呈现都较为出色,但在蝴蝶的空间分布上还有提升空间。

困难难度评测结果

  • 得分:71.0 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

AI 生成图片,模型:wan2.7-image-pro
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】图像整体呈现出高质量的现代艺术画廊氛围,材质表现和照明效果均较为专业。然而,最核心的数量准确性问题(出现8件而非6件雕塑)是本图最严重的失分点,直接影响了提示词的核心测试目标。空间布局基本合理但入口位置不明确,部分雕塑位置与提示词描述存在偏差。综合来看,图像在视觉质量上表现良好,但在严格遵循提示词的数量和位置要求方面存在明显不足。 【GEMINI】该生成图像在多物体控制和材质物理属性上表现欠佳。虽然构图尝试还原画廊氛围,但在最核心的‘数量准确性’和‘玻璃材质透明度’上出现了严重偏差。空间布局缺乏真实的物理支撑(如悬挂逻辑),且光影处理存在明显的AI合成痕迹,未能达到专业视觉设计的要求。 【KIMI】整体上,图像较好地完成了提示词要求,但在细节处理上还有提升空间。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...