doubao-seedream-4-0 在「热带海岛日落镂空旺字卡片生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:doubao-seedream-4-0
  • 用例名称:热带海岛日落镂空旺字卡片生成
  • 测试类型:图像生成
  • 评测维度:VG-FramedPerspective

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张写实摄影风格的图像:第一人称视角,一只手拿着一张半透明磨砂亚克力卡片,卡片中心镂空刻有汉字「旺」。透过镂空部分可以看到远处的椰林、沙滩和紫色日落海景。整体色彩高饱和度。

任务要求

AI 模型需要满足以下要求:

  1. 画面呈现第一人称视角,有手持卡片的构图
  2. 卡片材质体现半透明磨砂亚克力质感
  3. 卡片中心有清晰可辨的镂空汉字「旺」
  4. 透过镂空部分可见椰林、沙滩与日落海景
  5. 整体色彩饱和度高,画面清晰

评测结果

综合得分

该模型在此用例的得分为:72.5 分(满分 100 分),已通过

基础难度评测结果

  • 得分:72.5 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一幅在热带海滩日落时分的唯美画面。一只左手捏着一块透明的正方形亚克力板,板子中心镂空刻有一个巨大的汉字“旺”。背景是迷人的紫色调天空,远处一轮红日正悬在海平线上方,将余晖洒在波光粼粼的海面和沙滩上。左侧是一排高耸的椰子树剪影,构图呈现出一种宁静而吉祥的氛围。然而,画面中存在明显的 AI 生成缺陷:手部结构异常,大拇指的比例和连接处显得生硬,且手指的数量和抓握姿势不符合人体工程学;亚克力板左下角的边缘与手指交叠处出现了透视错误,板子仿佛嵌入了肉里;此外,镂空的“旺”字笔画边缘略显模糊,与背景的融合感不够自然。

图中展示了一幅在热带海滩日落时分的唯美画面。一只左手捏着一块透明的正方形亚克力板,板子中心镂空刻有一个巨大的汉字“旺”。背景是迷人的紫色调天空,远处一轮红日正悬在海平线上方,将余晖洒在波光粼粼的海面和沙滩上。左侧是一排高耸的椰子树剪影,构图呈现出一种宁静而吉祥的氛围。然而,画面中存在明显的 AI 生成缺陷:手部结构异常,大拇指的比例和连接处显得生硬,且手指的数量和抓握姿势不符合人体工程学;亚克力板左下角的边缘与手指交叠处出现了透视错误,板子仿佛嵌入了肉里;此外,镂空的“旺”字笔画边缘略显模糊,与背景的融合感不够自然。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】图像在构图、色彩和整体氛围上完成度较高,手持卡片的第一人称视角、高饱和度日落海景均符合提示词要求。但最核心的「旺」字镂空效果存在明显问题:字形准确性存疑,镂空边缘的物理真实感不足。磨砂亚克力质感表现中规中矩,未能充分体现磨砂材质的哑光细腻感。综合来看,场景氛围出色,但核心视觉要素(镂空字形与材质细节)的完成度拖累了整体评分。 【GEMINI】图像在色彩氛围营造上表现优异,但在核心的物理材质模拟和汉字结构逻辑上存在明显短板。AI对汉字结构的理解依然是其主要瓶颈,导致「旺」字在镂空呈现时出现了结构性崩坏,严重影响了作品的专业度。 【KIMI】该图像在概念层面完成了提示词的基本要求,但在材质物理真实性和光学逻辑上暴露出AI生成图像的典型缺陷。亚克力材质的表现停留在「看起来像」而非「物理上正确」的层面,镂空透视的景深错误和边缘光学细节的缺失尤为致命。场景色彩虽达成高饱和度要求,但色彩科学层面的不一致性显示出模型对复杂光照环境的理解局限。整体属于「一眼惊艳、细看崩溃」的类型,适合缩略图展示但经不起专业审视。

进阶难度评测结果

  • 得分:77.9 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只左手捏着一块透明的亚克力板,背景是热带海滩的日落美景。亚克力板中心镂空刻有一个巨大的汉字“旺”,透过镂空处可以看到沙滩和棕榈树。板子底部印有白色的数字“2026”和一匹马的剪影。背景左侧是明亮的阳光和翠绿的棕榈林,右侧则是被夕阳染成深紫色的天空与海面,画面充满了梦幻的紫色调和光晕效果。 这张图片存在明显的 AI 生成缺陷:首先是文字逻辑错误,2026 年在中国传统生肖中应为马年,但画面中的“旺”字通常与狗年(旺旺)相关,且镂空汉字的笔画结构略显僵硬,不符合自然书写习惯;其次是透视与光影异常,手持板子的手指边缘略显模糊,指甲形状不够自然,且板子上的反光与背景光源的方向不完全匹配;最后,背景中的紫色天空色彩过于饱和,呈现出一种不真实的数字合成感。

图中展示了一只左手捏着一块透明的亚克力板,背景是热带海滩的日落美景。亚克力板中心镂空刻有一个巨大的汉字“旺”,透过镂空处可以看到沙滩和棕榈树。板子底部印有白色的数字“2026”和一匹马的剪影。背景左侧是明亮的阳光和翠绿的棕榈林,右侧则是被夕阳染成深紫色的天空与海面,画面充满了梦幻的紫色调和光晕效果。

这张图片存在明显的 AI 生成缺陷:首先是文字逻辑错误,2026 年在中国传统生肖中应为马年,但画面中的“旺”字通常与狗年(旺旺)相关,且镂空汉字的笔画结构略显僵硬,不符合自然书写习惯;其次是透视与光影异常,手持板子的手指边缘略显模糊,指甲形状不够自然,且板子上的反光与背景光源的方向不完全匹配;最后,背景中的紫色天空色彩过于饱和,呈现出一种不真实的数字合成感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张AI生成图像整体完成度较高,核心要求基本全部满足:第一人称手持卡片构图、半透明磨砂亚克力材质感、镂空「旺」字透视效果、底部「2026」文字与马剪影、丰富的Bokeh光斑以及高饱和度日落海景均有良好呈现。最突出的表现在于背景氛围营造,紫色日落与彩色光斑的组合极具视觉感染力。主要不足在于「旺」字字形略有变形,以及部分细节(马剪影、卡片边缘光影)的精细度有提升空间。综合而言,这是一张高质量的AI生成图像,对复杂的多层次视觉效果(材质+镂空+透视+氛围)的综合处理能力令人印象深刻。 【GEMINI】这是一张典型的「远看不错,近看崩坏」的 AI 生成图。背景氛围和色彩处理达到了写实摄影的要求,但在核心的文字镂空设计和图案细节上表现极差。汉字「旺」的结构错误和马剪影的崩坏,直接拉低了作品的专业度。作为一张设计素材,它在近景细节处理上需要大幅改进。 【KIMI】该图像在概念执行上基本达标,但细节处暴露出AI生成的典型缺陷:图案结构错误(马剪影)、材质光学逻辑缺失(镂空透视无衰减)、色彩过度饱和偏离写实范畴。作为「写实摄影风格」的测试,其在物理真实性和光学合理性上表现不足,属于「乍一看合格,细看问题多」的中间品质输出。

困难难度评测结果

  • 得分:74.1 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只左手拿着一块透明的亚克力方牌,背景是绚丽的海边日落。天空呈现出深邃的紫色与橙色的渐变,远处的太阳正悬在海平线上,散发出柔和的光芒。透明牌子的中心镂空出了一个巨大的汉字,形状接近“旺”字,透过这个镂空可以看到背景中的椰子树和沙滩。牌子下方印有白色的“2026”字样以及两匹奔跑的小马剪影。构图采用了浅景深效果,背景的椰林和海浪被虚化成梦幻的光斑。 在 AI 生成的细节方面,存在明显的逻辑缺陷:首先,手部动作显得不自然,大拇指的长度和关节弯曲角度略显僵硬,指甲边缘模糊。其次,透明牌子上的汉字并非标准字体,笔画结构扭曲且不完整,无法准确辨认。此外,牌子下方的两匹马剪影细节模糊,尤其是左侧那匹马的腿部线条杂乱,缺乏真实的生物结构。牌子边缘的光效虽然亮眼,但与环境光的折射逻辑并不完全吻合。

图中展示了一只左手拿着一块透明的亚克力方牌,背景是绚丽的海边日落。天空呈现出深邃的紫色与橙色的渐变,远处的太阳正悬在海平线上,散发出柔和的光芒。透明牌子的中心镂空出了一个巨大的汉字,形状接近“旺”字,透过这个镂空可以看到背景中的椰子树和沙滩。牌子下方印有白色的“2026”字样以及两匹奔跑的小马剪影。构图采用了浅景深效果,背景的椰林和海浪被虚化成梦幻的光斑。

在 AI 生成的细节方面,存在明显的逻辑缺陷:首先,手部动作显得不自然,大拇指的长度和关节弯曲角度略显僵硬,指甲边缘模糊。其次,透明牌子上的汉字并非标准字体,笔画结构扭曲且不完整,无法准确辨认。此外,牌子下方的两匹马剪影细节模糊,尤其是左侧那匹马的腿部线条杂乱,缺乏真实的生物结构。牌子边缘的光效虽然亮眼,但与环境光的折射逻辑并不完全吻合。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像整体完成度较高,成功还原了海边日落持卡的核心场景,氛围营造出色。主要短板集中在材质物理真实性与镂空透视连续性两个技术难点上:磨砂亚克力的漫射质感不够准确,镂空区域的内外景物衔接存在轻微合成感。卡片图文元素基本准确但哑光质感欠缺。综合来看,这是一张视觉吸引力强但技术细节存在若干瑕疵的AI生成图像,适合展示氛围但难以通过专业材质质感审查。 【GEMINI】该图像在氛围营造和色彩表现上表现尚可,但在核心的「写实逻辑」和「图文准确性」上存在严重缺陷。最致命的问题在于镂空区域的透视割裂感,以及汉字与奔马剪影的生成错误,这使得图像在近距离观察时显得极其不自然,无法达到商业级写实摄影的要求。 【KIMI】该图像在氛围营造与基础构图上表现尚可,但在最核心的「镂空透视」功能上完全失败。提示词明确要求镂空「旺」字区域「完全透明」以框取远景,实际却渲染为封闭的金属反光面,这一根本性错误使得卡片的设计意图(通过镂空字框景)无法实现。材质表现停留在表面纹理模拟,缺乏真实光学行为。整体属于「看起来精致但功能错误」的典型AI生成案例,提示词理解存在关键偏差。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...