doubao-seedream-4-5 在「敦煌月牙泉镂空幻字卡片生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:doubao-seedream-4-5
  • 用例名称:敦煌月牙泉镂空幻字卡片生成
  • 测试类型:图像生成
  • 评测维度:VG-FramedPerspective

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张写实摄影风格的图像:一只手拿着一张土黄色卡片,卡片中心镂空刻有汉字「幻」,透过镂空部分可以看到远处的月牙泉,背景是连绵的沙丘。

任务要求

AI 模型需要满足以下要求:

  1. 画面中有一只手持卡片的构图
  2. 卡片呈土黄色,中心有镂空汉字「幻」
  3. 透过镂空部分可见月牙泉景观
  4. 背景为沙漠沙丘场景
  5. 整体风格为写实摄影

评测结果

综合得分

该模型在此用例的得分为:75.0 分(满分 100 分),已通过

基础难度评测结果

  • 得分:75.0 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一个极具超现实感的沙漠场景。画面前景是一只肤色偏深的手,正捏着一张正方形的牛皮纸卡片。卡片中心被镂空剪出了一个简体中文汉字「幻」。透过这个镂空的字样,我们可以看到与背景完全不同的景象:字孔中呈现的是一轮明亮的弯月悬挂在夕阳余晖下的沙漠,色调温暖金黄;而卡片之外的背景则是烈日下的广阔沙漠,远处有一个圆形的绿洲水潭,沙丘起伏,色调偏冷且明亮。 在 AI 生成的细节方面,存在几处明显的逻辑缺陷。首先,手部虎口处有一块不自然的白色色块,像是未处理好的笔触或皮肤缺失。其次,镂空字样内部的景象与外部背景在透视和光影上完全断层,虽然这可能是艺术表达,但字孔边缘的裁剪痕迹显得过于生硬。此外,卡片右上角的边缘呈现出一种锯齿状的模糊感,与整体清晰的对焦不符,显示出图像合成的痕迹。

图中展示了一个极具超现实感的沙漠场景。画面前景是一只肤色偏深的手,正捏着一张正方形的牛皮纸卡片。卡片中心被镂空剪出了一个简体中文汉字「幻」。透过这个镂空的字样,我们可以看到与背景完全不同的景象:字孔中呈现的是一轮明亮的弯月悬挂在夕阳余晖下的沙漠,色调温暖金黄;而卡片之外的背景则是烈日下的广阔沙漠,远处有一个圆形的绿洲水潭,沙丘起伏,色调偏冷且明亮。

在 AI 生成的细节方面,存在几处明显的逻辑缺陷。首先,手部虎口处有一块不自然的白色色块,像是未处理好的笔触或皮肤缺失。其次,镂空字样内部的景象与外部背景在透视和光影上完全断层,虽然这可能是艺术表达,但字孔边缘的裁剪痕迹显得过于生硬。此外,卡片右上角的边缘呈现出一种锯齿状的模糊感,与整体清晰的对焦不符,显示出图像合成的痕迹。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】图像在主体元素构建和整体摄影风格上表现良好,手、卡片、「幻」字镂空、沙漠背景等核心元素均有呈现。最核心的问题在于镂空透视效果的处理:镂空内部并非真实透视背后的月牙泉场景,而是一个独立合成的新月+金色光芒画面,导致「透过镂空看月牙泉」这一核心创意未能真实实现。此外背景水体形态与月牙泉特征不够吻合。整体属于「基本完成但有明显瑕疵」的水准。 【GEMINI】图像在宏观氛围和材质表现上达到了写实摄影的要求,但在微观细节和物理逻辑上表现欠佳。尤其是手部结构的崩坏和透视处理的生硬,使得这张照片在细看之下难以达到商业摄影的质量标准。 【KIMI】这是一张在局部技术层面合格、但在核心创意执行上失败的图像。模型似乎误解了「透过镂空看到月牙泉」的提示,将其处理为「镂空内嵌入月牙泉意象」的符号化表达,而非真实的空间透视。这种处理方式虽然产生了一定的视觉诗意(「幻」字内外的虚实对照),但严重背离了提示词明确的写实摄影要求。手部与背景的融合自然,但镂空区域的时空错位是不可原谅的硬伤,暴露出模型在空间逻辑一致性上的根本缺陷。

进阶难度评测结果

  • 得分:80.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只手在广袤的沙漠背景前,举着一张土黄色的创意镂空卡片。背景是连绵起伏的沙丘,阳光柔和,色调以温暖的橘黄色和淡米色为主。卡片中心镂空了一个汉字“幻”,通过这个孔洞可以看到远方沙漠中的一片绿洲和月牙泉景观。卡片下方印有数字“2026”,右下角有两匹骆驼和波浪纹的剪影装饰。画面构图采用中心聚焦,营造出一种穿越时空的虚实结合感。 在 AI 生成的细节方面,存在一些明显的逻辑缺陷:首先,镂空汉字“幻”的笔画结构不完整,中间的连接部分悬空,在现实物理中无法独立支撑;其次,透过镂空处看到的景色与背景沙丘的透视关系不一致,显得像是一张贴图;卡片边缘的质感略显模糊,且手持卡片的手指在边缘处的阴影处理不够自然,缺乏真实的压痕感。

图中展示了一只手在广袤的沙漠背景前,举着一张土黄色的创意镂空卡片。背景是连绵起伏的沙丘,阳光柔和,色调以温暖的橘黄色和淡米色为主。卡片中心镂空了一个汉字“幻”,通过这个孔洞可以看到远方沙漠中的一片绿洲和月牙泉景观。卡片下方印有数字“2026”,右下角有两匹骆驼和波浪纹的剪影装饰。画面构图采用中心聚焦,营造出一种穿越时空的虚实结合感。

在 AI 生成的细节方面,存在一些明显的逻辑缺陷:首先,镂空汉字“幻”的笔画结构不完整,中间的连接部分悬空,在现实物理中无法独立支撑;其次,透过镂空处看到的景色与背景沙丘的透视关系不一致,显得像是一张贴图;卡片边缘的质感略显模糊,且手持卡片的手指在边缘处的阴影处理不够自然,缺乏真实的压痕感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在摄影风格、景深处理和整体氛围营造上表现优秀,基本完成了提示词的大部分要求。最显著的问题是镂空汉字字形错误,生成的是「夕」而非「幻」,这是对核心文字要求的明确偏差。月牙泉的辨识度也略显不足。其余元素如手持视角、卡片质感、2026字样、马剪影、沙丘虚化背景均表现良好。综合来看属于基本完成要求但存在关键文字错误的情况。 【GEMINI】这张图像在氛围营造和材质表现上展现了不错的潜力,但在细节处理和逻辑严谨性上暴露了 AI 生成的常见短板。文字和图形的生成质量是最大的扣分项,严重影响了作品的专业度。如果能修复文字的结构和透视的真实感,这将是一张高质量的作品。 【KIMI】该图像在概念执行上基本完成了提示词要求,但镂空透视效果是核心短板——月牙泉的空间位置与形态扭曲暴露了AI对复杂三维透视关系的理解局限。作为「写实摄影风格」的作品,镂空边缘的立体缺失与景深过渡的生硬感使其难以通过专业视觉审查。建议在后续生成中强化镂空物体的厚度表现与背景景物的真实透视匹配。

困难难度评测结果

  • 得分:79.7 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中,一只手拿着一张牛皮纸质感的镂空卡片,背景是夕阳下的壮阔沙漠。卡片上方镂空刻有汉字「幻」,中间是一个带有回纹边框的圆孔,圆孔内巧妙地框住了远处的月牙泉景观,下方则印有数字「2026」和一枚金色的马形印章。阳光从左侧射入,给沙漠披上一层暖橘色的光辉,整体色调温馨而宁静。 作为一张 AI 生成的图片,画面存在几处明显的逻辑缺陷:首先,卡片中间圆孔内看到的景象与背景的透视关系不符,圆孔内的月牙泉和沙丘像是被强行缩放并嵌入其中的,而非自然的取景效果;其次,卡片上的汉字「幻」边缘略显生硬,且下方的数字「2026」与马形图案的印刷质感在光影下显得不够自然;最后,手部虎口处的皮肤纹理在强光下显得有些模糊,缺乏真实皮肤的细节层次感。

画面中,一只手拿着一张牛皮纸质感的镂空卡片,背景是夕阳下的壮阔沙漠。卡片上方镂空刻有汉字「幻」,中间是一个带有回纹边框的圆孔,圆孔内巧妙地框住了远处的月牙泉景观,下方则印有数字「2026」和一枚金色的马形印章。阳光从左侧射入,给沙漠披上一层暖橘色的光辉,整体色调温馨而宁静。

作为一张 AI 生成的图片,画面存在几处明显的逻辑缺陷:首先,卡片中间圆孔内看到的景象与背景的透视关系不符,圆孔内的月牙泉和沙丘像是被强行缩放并嵌入其中的,而非自然的取景效果;其次,卡片上的汉字「幻」边缘略显生硬,且下方的数字「2026」与马形图案的印刷质感在光影下显得不够自然;最后,手部虎口处的皮肤纹理在强光下显得有些模糊,缺乏真实皮肤的细节层次感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张AI生成图像整体完成度较高,成功呈现了沙漠黄昏手持纪念卡片的写实摄影场景,三层空间层次清晰,手部姿态自然,烫金细节精良。核心问题在于镂空形式与提示词存在偏差——提示词要求「幻」字本身作为镂空透视窗口,而图中采用圆形镂空配合独立「幻」字的设计,虽然视觉效果不差,但并非严格按提示词执行。复古胶片风格的暗角与颗粒感处理不足,整体更偏向自然摄影而非刻意的胶片美学。综合来看,这是一张质量较高但在关键细节上有所偏离的生成图像。 【GEMINI】这张图像在氛围营造和光影表现上表现出色,具备很强的视觉感染力。然而,作为一张以「镂空卡片」为核心的图像,其核心的透视逻辑和细节精度未能达到专业摄影水准。镂空部分的景观与背景脱节,以及烫金工艺的质感缺失,是拉低整体评价的主要原因。 【KIMI】该图像在执行第一人称视角与基础材质表现上达标,但在核心创意元素——镂空「幻」字与月牙泉的精准对应——上出现关键偏差。提示词明确要求「透过『幻』字镂空,精准呈现月牙泉的新月形水面」,但实际呈现的是环形镂空内悬浮的月牙发光体,且「幻」字本身为实心印刷。这一结构性错误导致图像未能准确传达用户意图的纪念卡片设计概念。此外,雕刻纹理、烫金质感、暗角控制等细节均有提升空间。综合判定为部分完成提示词要求,存在需要改进的明显瑕疵。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...