doubao-seedream-4-0 在「敦煌月牙泉镂空幻字卡片生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:doubao-seedream-4-0
  • 用例名称:敦煌月牙泉镂空幻字卡片生成
  • 测试类型:图像生成
  • 评测维度:VG-FramedPerspective

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张写实摄影风格的图像:一只手拿着一张土黄色卡片,卡片中心镂空刻有汉字「幻」,透过镂空部分可以看到远处的月牙泉,背景是连绵的沙丘。

任务要求

AI 模型需要满足以下要求:

  1. 画面中有一只手持卡片的构图
  2. 卡片呈土黄色,中心有镂空汉字「幻」
  3. 透过镂空部分可见月牙泉景观
  4. 背景为沙漠沙丘场景
  5. 整体风格为写实摄影

评测结果

综合得分

该模型在此用例的得分为:81.0 分(满分 100 分),已通过

基础难度评测结果

  • 得分:81.0 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一幅极具创意的沙漠景观。画面中心,一只肤色偏深的手捏着一张土黄色的厚纸片或泥板,板子中心镂空刻有一个汉字“幻”。透过这个镂空的字孔,可以看到背景中一弯清澈的蓝色月牙泉,泉水上方正巧映衬着一颗明亮的圆月,构思巧妙。背景是连绵起伏的金色沙丘,阳光洒在沙地上,明暗交替,纹理清晰。整体色调以温暖的土黄色和清冷的湖蓝色为主,形成鲜明对比。 在 AI 生成的细节方面,存在明显的逻辑缺陷:首先,画面左下角拿板子的手部结构异常,大拇指的生长位置和关节弯曲显得生硬且不符合人体解剖学。其次,镂空的“幻”字笔画并不完整,左侧的“幺”部与右侧部分连接处显得破碎且不自然。此外,背景中的月牙泉与远处的沙丘透视关系略显平面化,缺乏真实的空间深度感。

图中展示了一幅极具创意的沙漠景观。画面中心,一只肤色偏深的手捏着一张土黄色的厚纸片或泥板,板子中心镂空刻有一个汉字“幻”。透过这个镂空的字孔,可以看到背景中一弯清澈的蓝色月牙泉,泉水上方正巧映衬着一颗明亮的圆月,构思巧妙。背景是连绵起伏的金色沙丘,阳光洒在沙地上,明暗交替,纹理清晰。整体色调以温暖的土黄色和清冷的湖蓝色为主,形成鲜明对比。

在 AI 生成的细节方面,存在明显的逻辑缺陷:首先,画面左下角拿板子的手部结构异常,大拇指的生长位置和关节弯曲显得生硬且不符合人体解剖学。其次,镂空的“幻”字笔画并不完整,左侧的“幺”部与右侧部分连接处显得破碎且不自然。此外,背景中的月牙泉与远处的沙丘透视关系略显平面化,缺乏真实的空间深度感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像高质量完成了提示词的全部核心要求:手持土黄色镂空「幻」字卡片、透过镂空可见月牙泉、沙漠沙丘背景、写实摄影风格,五项关键要求全部达标。卡片的沙土龟裂质感设计尤为出彩,与场景高度融合。主要改进空间在于镂空内月牙泉景观的细节呈现与景深过渡的自然度,但这些属于锦上添花的细节,不影响整体的高完成度。综合评价属于优秀级别的AI图像生成作品。 【GEMINI】这是一张在氛围营造上表现尚可,但在细节逻辑和文字处理上存在明显短板的AI生成图像。模型在处理复杂的汉字镂空结构时表现乏力,导致核心主体「幻」字形崩坏。同时,透视逻辑的混乱(镂空内出现不合理光斑)严重削弱了写实摄影的真实感。作为一张概念图尚可,但作为严谨的写实摄影作品,其细节经不起推敲。 【KIMI】该图像属于「概念正确、执行走样」的典型AI生成案例。提示词的核心创意——镂空汉字与月牙泉的透视叠加——在视觉上被误读为「镂空看到月亮」,导致地理标志性景观(月牙泉)被天文现象(满月)替换,这是语义理解层面的严重偏差。汉字结构错误与光源不一致进一步暴露生成模型的物理逻辑缺陷。整体呈现「第一眼合格、细究崩溃」的质量特征,适合缩略图展示但无法经受专业审视。

进阶难度评测结果

  • 得分:79.7 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中,一只手在广袤的沙漠背景下举着一张土黄色的创意卡片。背景是连绵起伏的沙丘,阳光柔和,沙纹清晰。卡片中心有一个巨大的镂空汉字“幻”,通过这个镂空处,可以看到远方地平线上升起的一轮明月。卡片下方印有数字“2026”以及几匹奔马的剪影,卡片表面还粘有一些真实的粗砂砾。 这张图片存在明显的 AI 生成缺陷:首先,镂空汉字“幻”的笔画结构不完整,左侧的“幺”部和右侧部分连接异常,且镂空边缘的透视与背景沙丘不匹配,月亮看起来像是贴在镂空里的贴纸,而非远景。其次,卡片下方的马匹剪影比例失调,部分马腿缺失或与沙丘线条融合。最明显的逻辑错误在于,手持卡片的位置处于明亮的白昼沙漠,但镂空处却显现出夜晚的月亮,光影逻辑完全相悖。此外,握持卡片的手指边缘略显模糊,指甲形状也欠自然。

画面中,一只手在广袤的沙漠背景下举着一张土黄色的创意卡片。背景是连绵起伏的沙丘,阳光柔和,沙纹清晰。卡片中心有一个巨大的镂空汉字“幻”,通过这个镂空处,可以看到远方地平线上升起的一轮明月。卡片下方印有数字“2026”以及几匹奔马的剪影,卡片表面还粘有一些真实的粗砂砾。

这张图片存在明显的 AI 生成缺陷:首先,镂空汉字“幻”的笔画结构不完整,左侧的“幺”部和右侧部分连接异常,且镂空边缘的透视与背景沙丘不匹配,月亮看起来像是贴在镂空里的贴纸,而非远景。其次,卡片下方的马匹剪影比例失调,部分马腿缺失或与沙丘线条融合。最明显的逻辑错误在于,手持卡片的位置处于明亮的白昼沙漠,但镂空处却显现出夜晚的月亮,光影逻辑完全相悖。此外,握持卡片的手指边缘略显模糊,指甲形状也欠自然。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像整体完成度较高,第一人称持卡视角、镂空「幻」字、「2026」及马剪影等主体元素齐全,景深虚化处理尤为出色。主要短板集中在镂空内景观的准确性上——呈现的是满月映水而非月牙泉的标志性新月湖泊形态,导致核心地标辨识度不足;同时镂空内冷调与整体暖黄色调的冲突影响了风格统一性。综合来看属于「基本完成要求但存在明显瑕疵」的水平。 【GEMINI】这张图像在氛围营造和材质表现上展现了不错的潜力,但在核心的逻辑严谨性和细节处理上暴露了 AI 生成的常见弱点。特别是汉字结构的崩坏和镂空透视的逻辑错误,极大地削弱了作品的写实感。如果作为一张概念草图尚可,但作为一张追求写实摄影风格的作品,其细节经不起推敲。 【KIMI】本图在材质表现与基础构图上展现了AI的成熟能力,但「月牙泉」概念的根本性误读导致核心创意失败。模型将「月牙泉」拆解为「月牙+泉」后,错误地将「月牙」理解为天体月亮,而非泉水形态,最终呈现「透过镂空看月亮」的荒诞结果。这种语义层面的理解偏差,暴露了当前模型在处理文化特定景观(如中国西北地标)时的知识盲区。若提示词为英文「Crescent Moon Spring」,结果可能更糟。建议评分时严格区分「执行精度」与「概念准确性」——后者往往是AI图像的隐形陷阱。

困难难度评测结果

  • 得分:76.3 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只左手拿着一张浅棕色再生纸质地的镂空卡片,背景是沐浴在夕阳余晖下的壮丽沙漠景观。背景中可以看到连绵的沙丘和一处形似月牙泉的绿洲水源,整体色调呈现温暖的金黄色。卡片中心有一个巨大的月牙形镂空,月牙内部还精细地雕刻了复杂的纹理,镂空处巧妙地透出了远方的沙漠美景。月牙上方镂刻着一个汉字“幻”,下方印有金色字样“2026”以及三匹奔跑的骏马图案。 在 AI 生成细节方面,画面存在明显的逻辑与结构缺陷:首先,手持卡片的方式不符合物理常识,大拇指与食指的捏合位置与卡片边缘的受力点不匹配,且手指的关节线条略显生硬。其次,卡片上的镂空汉字“幻”缺乏必要的连接点,其内部笔画本应悬空掉落,但在图中却违背物理规律地漂浮在镂空区域。此外,背景中绿洲边缘的线条略显模糊,与前景清晰的卡片形成了不自然的对比。

图中展示了一只左手拿着一张浅棕色再生纸质地的镂空卡片,背景是沐浴在夕阳余晖下的壮丽沙漠景观。背景中可以看到连绵的沙丘和一处形似月牙泉的绿洲水源,整体色调呈现温暖的金黄色。卡片中心有一个巨大的月牙形镂空,月牙内部还精细地雕刻了复杂的纹理,镂空处巧妙地透出了远方的沙漠美景。月牙上方镂刻着一个汉字“幻”,下方印有金色字样“2026”以及三匹奔跑的骏马图案。

在 AI 生成细节方面,画面存在明显的逻辑与结构缺陷:首先,手持卡片的方式不符合物理常识,大拇指与食指的捏合位置与卡片边缘的受力点不匹配,且手指的关节线条略显生硬。其次,卡片上的镂空汉字“幻”缺乏必要的连接点,其内部笔画本应悬空掉落,但在图中却违背物理规律地漂浮在镂空区域。此外,背景中绿洲边缘的线条略显模糊,与前景清晰的卡片形成了不自然的对比。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张AI生成图像整体完成度较高,成功构建了沙漠旅行纪念卡片的写实摄影场景,三层空间层次清晰,卡片材质与背景环境融合自然,视觉创意出色。主要问题集中在细节执行层面:「幻」字未实现真正的镂空透视效果(最关键的技术要求之一),手部姿态与提示词描述有偏差,复古胶片调色不够完整。这些问题使图像从「优秀」降至「良好」水平。综合加权评分约为84分,属于基本完成要求但存在若干明显瑕疵的水平。 【GEMINI】这是一张典型的“第一眼惊艳,细看全是破绽”的AI生成图。虽然在氛围营造和色调把控上达到了复古摄影的要求,但在物理逻辑和细节精度上表现平庸。最严重的问题在于镂空透视的景深处理,这直接破坏了照片的真实感。作为一张强调“写实摄影”的作品,这种光学逻辑的错误是不可忽视的减分项。 【KIMI】这是一张在核心创意执行上严重失败的AI生成图像。最致命的错误在于「幻」字镂空与月牙泉景物的空间关系完全颠倒——模型似乎未能理解汉字「幻」的结构,将右侧「幺」部错误地生成为实体遮挡,导致「透过镂空精准呈现月牙泉」这一核心要求彻底落空。卡片材质、烫金工艺、光影逻辑、胶片调色均停留在表面模仿阶段,缺乏对物理真实性的深入理解。整体呈现出AI生成图像典型的「形似神不似」特征:构图框架存在,但关键细节的逻辑链条断裂。建议重新训练模型对汉字结构、镂空透视、材质光学特性的理解。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...