doubao-seedream-5-0 在「黄山迎客松镂空寿字卡片生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:doubao-seedream-5-0
  • 用例名称:黄山迎客松镂空寿字卡片生成
  • 测试类型:图像生成
  • 评测维度:VG-FramedPerspective

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张写实风格的图像:一只手拿着一张深灰色岩石质感的卡片,卡片中心镂空刻有汉字「寿」,透过镂空部分可以看到远处的黄山迎客松与云海。背景云雾缭绕,整体氛围大气磅礴。

任务要求

AI 模型需要满足以下要求:

  1. 画面中有一只手持有深灰色岩石质感卡片
  2. 卡片中心有镂空的汉字「寿」
  3. 透过镂空部分可见黄山迎客松
  4. 背景有云海或云雾元素
  5. 整体风格为写实摄影风格

评测结果

综合得分

该模型在此用例的得分为:82.1 分(满分 100 分),已通过

基础难度评测结果

  • 得分:82.1 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中,一只手拿着一张深灰色的岩石质感卡片,背景是云雾缭绕的高山深谷,呈现出一种宁静致远的意境。卡片中央有一个八角星形的镂空窗口,透过窗口可以看到远处山巅上一棵苍劲的迎客松。在镂空位置的中心,悬浮着一个黑色的简体汉字“寿”,寓意长寿。整幅画面的色调以灰、白、绿为主,构图采用了“画中画”的视觉效果。 然而,画面中存在明显的 AI 生成缺陷。首先,中间的“寿”字笔画结构异常,最下方的“寸”字部分缺失了关键的竖钩和点,变成了一个不完整的形状,且字体悬浮在空中,与背景缺乏透视衔接。其次,左下角拿卡片的手部比例略显僵硬,手指的边缘与卡片的接触面显得不够自然。此外,卡片边缘的岩石纹理在右侧显得过于平整,与左侧的粗糙质感不统一,透视关系略显平面化。

画面中,一只手拿着一张深灰色的岩石质感卡片,背景是云雾缭绕的高山深谷,呈现出一种宁静致远的意境。卡片中央有一个八角星形的镂空窗口,透过窗口可以看到远处山巅上一棵苍劲的迎客松。在镂空位置的中心,悬浮着一个黑色的简体汉字“寿”,寓意长寿。整幅画面的色调以灰、白、绿为主,构图采用了“画中画”的视觉效果。

然而,画面中存在明显的 AI 生成缺陷。首先,中间的“寿”字笔画结构异常,最下方的“寸”字部分缺失了关键的竖钩和点,变成了一个不完整的形状,且字体悬浮在空中,与背景缺乏透视衔接。其次,左下角拿卡片的手部比例略显僵硬,手指的边缘与卡片的接触面显得不够自然。此外,卡片边缘的岩石纹理在右侧显得过于平整,与左侧的粗糙质感不统一,透视关系略显平面化。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像高质量地完成了提示词的核心要求:手持石质卡片、镂空「寿」字、迎客松、云海背景五项关键要求全部满足,写实摄影风格执行到位,整体意境大气磅礴。主要不足在于「寿」字镂空的视觉逻辑略显模糊(笔画深色与卡片材质相近,透空感不够彻底),以及松树在镂空框内的呈现略显局促。综合来看,这是一张高完成度的AI生成图像,在意境营造和写实质感上表现尤为突出。 【GEMINI】这是一张典型的「AI 逻辑陷阱」作品。虽然它成功识别了所有提示词元素,但在处理复杂的物理空间关系(镂空透视)时完全失败。它将「镂空」处理成了「透明图层叠加」,导致画面失去了真实摄影应有的物理逻辑。对于追求写实感的作品而言,这种空间关系的错误是致命的。 【KIMI】该图像完成了提示词的基础框架,但在核心的「镂空透视」这一技术难点上出现明显失误——背景景物与前景卡片的空间关系混乱,导致「透过镂空看远景」的视觉逻辑崩塌。此外,「迎客松」这一特定意象的还原度不足,镂空内的松树更像是普通黄山松的随意填充。整体处于「形似而神不似」的尴尬状态,技术执行力未能支撑创意意图。

进阶难度评测结果

  • 得分:79.2 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只右手捏着一块正方形灰色石板,背景是云雾缭绕的高山松树奇观。石板中心镂空雕刻了一个巨大的繁体“寿”字,透过镂空处可以看到远处的迎客松。石板左下角刻有数字“2026”,右下角则有一个黑色的马形剪影。整体色调清新自然,天空呈现淡蓝色,远景虚化,营造出一种登高望远的意境。 在 AI 生成细节方面,存在明显的逻辑和透视缺陷:首先,手部捏住石板的方式不自然,大拇指与食指的受力点显得有些漂浮;其次,石板右下角的黑色马形剪影像是后期直接粘贴上去的平面贴纸,缺乏石材应有的雕刻质感和光影深度;最显著的错误在于“寿”字的结构,其下半部分的笔画连接逻辑混乱,不符合汉字的标准写法,且镂空边缘的厚度表现不一致,透视感较弱。

图中展示了一只右手捏着一块正方形灰色石板,背景是云雾缭绕的高山松树奇观。石板中心镂空雕刻了一个巨大的繁体“寿”字,透过镂空处可以看到远处的迎客松。石板左下角刻有数字“2026”,右下角则有一个黑色的马形剪影。整体色调清新自然,天空呈现淡蓝色,远景虚化,营造出一种登高望远的意境。

在 AI 生成细节方面,存在明显的逻辑和透视缺陷:首先,手部捏住石板的方式不自然,大拇指与食指的受力点显得有些漂浮;其次,石板右下角的黑色马形剪影像是后期直接粘贴上去的平面贴纸,缺乏石材应有的雕刻质感和光影深度;最显著的错误在于“寿”字的结构,其下半部分的笔画连接逻辑混乱,不符合汉字的标准写法,且镂空边缘的厚度表现不一致,透视感较弱。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像较好地完成了提示词的核心要求,所有关键元素均有呈现,写实摄影质感到位,整体意境大气。主要不足在于镂空透视的纵深感不够强烈、迎客松形态辨识度偏低,以及手卡比例略有失真。综合来看属于完成度较高的生成结果,但在细节精准度上仍有提升空间。 【GEMINI】这是一张典型的「初看尚可,细看崩坏」的 AI 生成图。虽然在材质表现和构图意图上完成了任务,但在关键的透视逻辑(镂空透视)和细节解剖(手部)上表现不佳。特别是镂空透视的失误,直接导致了画面的真实感崩塌,使其难以达到专业摄影作品的标准。 【KIMI】该图像在视觉初印象上具备一定冲击力,但经不起专业审视。核心问题在于AI对汉字结构的认知缺陷导致「寿」字形态错误,以及镂空透视的空间逻辑混乱——这是测试模型三维理解能力的关键指标,此处表现不佳。马剪影的风格错位暴露了AI在元素协调性上的短板。整体属于「远看尚可,近看破绽百出」的中等水平生成结果,距离提示词要求的「写实摄影」质感仍有明显差距。

困难难度评测结果

  • 得分:71.2 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只左手捏着一块长方形的灰色石板,背景是云雾缭绕的高山峻岭。石板中心采用了精细的镂空工艺,雕刻出一个巨大的汉字“寿”,透过字体的空隙可以看到远处的迎客松和云海。石板的左下角刻有数字“2026”,右下角则刻有一匹奔马的剪影。整个画面色调清冷自然,构图以手持石板为视觉中心,营造出一种登高祈福的意境。 在 AI 生成的细节方面,存在几处明显的逻辑缺陷:首先是手部表现异常,大拇指的指甲形状不自然,且食指与中指的连接处显得生硬,缺乏真实的关节纹理;其次,石板上的“寿”字笔画虽然清晰,但其镂空部分的物理支撑结构不符合常理,部分笔画悬浮在空中而没有与边框连接;最后,背景中的松树分支略显模糊且分布过于规律,带有明显的算法合成痕迹。

图中展示了一只左手捏着一块长方形的灰色石板,背景是云雾缭绕的高山峻岭。石板中心采用了精细的镂空工艺,雕刻出一个巨大的汉字“寿”,透过字体的空隙可以看到远处的迎客松和云海。石板的左下角刻有数字“2026”,右下角则刻有一匹奔马的剪影。整个画面色调清冷自然,构图以手持石板为视觉中心,营造出一种登高祈福的意境。

在 AI 生成的细节方面,存在几处明显的逻辑缺陷:首先是手部表现异常,大拇指的指甲形状不自然,且食指与中指的连接处显得生硬,缺乏真实的关节纹理;其次,石板上的“寿”字笔画虽然清晰,但其镂空部分的物理支撑结构不符合常理,部分笔画悬浮在空中而没有与边框连接;最后,背景中的松树分支略显模糊且分布过于规律,带有明显的算法合成痕迹。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像基本完成了手持镂空石板卡片的场景构建,岩石质感、文字刻绘及整体意境均有一定水准。但在核心难点——镂空透视的物理真实性上存在明显不足:卡片厚度感缺失、景深分层效果弱是最突出的问题。手部姿态与提示词要求也有偏差。整体属于「部分完成要求」的水平,在镂空透视这一最高权重维度上未能达到预期效果。 【GEMINI】这是一张典型的「AI 拼贴感」图像。虽然在材质纹理和背景氛围上达到了一定水准,但在核心的物理逻辑(镂空透视、厚度、景深)上完全失败。它未能模拟出真实物理世界中「持卡拍摄」的透视关系,导致整张图看起来像是一个拙劣的后期合成作品,而非一次真实的摄影捕捉。 【KIMI】该图像在概念上理解了提示词要求,但在最核心的「镂空透视」技术上出现严重物理错误——镂空内的景象与外部背景未能形成合理的空间对应关系,且景深控制完全缺失。奔马剪影和手部姿态等细节也暴露出AI生成常见的结构理解缺陷。作为「第一人称手持镂空卡片」这一特定场景的测试,模型未能通过最核心的空间逻辑考验,属于「知其形而不知其理」的典型失败案例。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...