doubao-seedream-5-0 在「天坛祈年殿镂空岁字卡片生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:doubao-seedream-5-0
  • 用例名称:天坛祈年殿镂空岁字卡片生成
  • 测试类型:图像生成
  • 评测维度:VG-FramedPerspective

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张图像:一只手拿着一张银色金属质感的长方形卡片,卡片中心镂空刻有汉字「岁」,透过镂空部分可以看到远处的北京天坛祈年殿,背景是湛蓝的天空。

任务要求

AI 模型需要满足以下要求:

  1. 画面中有一只手持银色金属长方形卡片
  2. 卡片中心有镂空的汉字「岁」
  3. 透过「岁」字镂空可见北京天坛祈年殿
  4. 背景为湛蓝天空
  5. 整体画面清晰,构图完整

评测结果

综合得分

该模型在此用例的得分为:81.5 分(满分 100 分),已通过

基础难度评测结果

  • 得分:81.5 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只左手拿着一张银灰色金属质感的镂空卡片,背景是纯净明亮的蓝色天空。卡片中心镂空出了一个汉字,形状介于“岁”字与“岸”字之间,结构并不标准。通过这个镂空处,可以看到远处的北京天坛祈年殿,建筑细节清晰,拥有标志性的蓝色琉璃瓦三重檐和红色墙体。构图上,手部位于画面左下角,卡片占据中心位置,利用镂空形成了“景中景”的视觉效果。画面整体色调清新,光线自然。明显的 AI 生成缺陷在于:镂空的汉字笔画结构逻辑混乱,无法准确辨认为某个特定汉字;此外,手部持卡的方式略显生硬,指尖与卡片的接触边缘过于锐利,缺乏自然的压痕,且天坛建筑在镂空框内的透视关系与背景天空略有脱节。

图中展示了一只左手拿着一张银灰色金属质感的镂空卡片,背景是纯净明亮的蓝色天空。卡片中心镂空出了一个汉字,形状介于“岁”字与“岸”字之间,结构并不标准。通过这个镂空处,可以看到远处的北京天坛祈年殿,建筑细节清晰,拥有标志性的蓝色琉璃瓦三重檐和红色墙体。构图上,手部位于画面左下角,卡片占据中心位置,利用镂空形成了“景中景”的视觉效果。画面整体色调清新,光线自然。明显的 AI 生成缺陷在于:镂空的汉字笔画结构逻辑混乱,无法准确辨认为某个特定汉字;此外,手部持卡的方式略显生硬,指尖与卡片的接触边缘过于锐利,缺乏自然的压痕,且天坛建筑在镂空框内的透视关系与背景天空略有脱节。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像整体完成度较高,四个核心元素均已呈现,空间层次关系处理合理,金属材质表现出色。最主要的问题是镂空汉字字形不够准确,呈现的是「岩」而非「岁」,这是对提示词核心文字要求的偏差,影响了主体元素完整性的得分。若字形能够准确还原「岁」字,整体评分将显著提升。综合来看,这是一张视觉质量较高但在关键细节(字形准确性)上存在明显瑕疵的AI生成图像。 【GEMINI】这是一张典型的「AI 构图尚可但细节崩坏」的图像。虽然模型成功理解了手持卡片和背景建筑的宏观布局,但在处理复杂的汉字镂空结构时表现乏力,导致核心主体「岁」字完全不可读。此外,缺乏光学景深处理使得画面缺乏真实感,更像是一张粗糙的合成图而非摄影作品。 【KIMI】该图像在材质表现与色彩控制上达到较高水准,成功完成了提示词的核心创意——透过汉字镂空框景古建筑的视觉概念。然而作为「挑剔评审」,必须指出其在汉字结构准确性与空间透视逻辑上的AI典型缺陷:「岁」字的结构变形并非艺术化处理,而是模型对复杂汉字部件关系的理解不足;卡片与建筑的透视矛盾则暴露了多图层合成时的空间一致性算法局限。这些瑕疵在快速浏览时易被忽略,但经仔细审视后显著影响专业可信度。综合评定为「良好但未尽完美」,适合社交媒体传播但不适用于需要文字准确性的正式场景。

进阶难度评测结果

  • 得分:79.2 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只右手拿着一张银色拉丝质感的金属卡片,背景是晴朗蓝天下的北京天坛祈年殿。金属卡片的中心被镂空成一个巨大的汉字,这个字看起来像是“岁”字的变体,通过镂空处正好可以看到远处背景中天坛的顶部。卡片的右下角刻有数字“2026”和一个简笔画风格的马形图案。画面构图采用了前景聚焦、背景虚化的手法,色彩清新自然。 在 AI 生成的细节方面,存在明显的逻辑和结构缺陷:首先,镂空的汉字结构并不完全符合标准汉字,笔画连接处显得生硬且不自然。其次,最明显的错误在于卡片右下角的马形图案,2026 年在中国传统生肖中应为马年,但画面中的马有五条腿,且身体线条扭曲。此外,持卡的手指边缘略显模糊,指甲形状不够自然,卡片边缘与手指的接触位置也存在轻微的透视重叠异常。

图中展示了一只右手拿着一张银色拉丝质感的金属卡片,背景是晴朗蓝天下的北京天坛祈年殿。金属卡片的中心被镂空成一个巨大的汉字,这个字看起来像是“岁”字的变体,通过镂空处正好可以看到远处背景中天坛的顶部。卡片的右下角刻有数字“2026”和一个简笔画风格的马形图案。画面构图采用了前景聚焦、背景虚化的手法,色彩清新自然。

在 AI 生成的细节方面,存在明显的逻辑和结构缺陷:首先,镂空的汉字结构并不完全符合标准汉字,笔画连接处显得生硬且不自然。其次,最明显的错误在于卡片右下角的马形图案,2026 年在中国传统生肖中应为马年,但画面中的马有五条腿,且身体线条扭曲。此外,持卡的手指边缘略显模糊,指甲形状不够自然,卡片边缘与手指的接触位置也存在轻微的透视重叠异常。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】图像整体完成度较高,主要元素基本齐全,金属材质表现是最大亮点。核心问题在于镂空汉字字形准确性存疑(更像「梦」而非「岁」),以及祈年殿与镂空的对称居中关系未能精准实现,这两点是提示词的核心考察点,存在明显偏差。电影调色氛围略显平淡,未达到「电影级」的色彩分级标准。综合来看属于基本完成要求但有明显瑕疵的水平。 【GEMINI】这张图像在材质表现和整体氛围营造上展现了不错的AI生成能力,尤其是金属质感和电影色调的把控。然而,在核心的「文字镂空」这一关键任务上出现了严重的逻辑错误,汉字「岁」的结构完全崩坏,这直接影响了作品的专业度。此外,细节处的雕刻线条处理也略显粗糙,未能达到精细化设计的标准。 【KIMI】该图像在视觉冲击力上表现尚可,但作为AI生成图像的质量检测样本,暴露出模型在处理「汉字结构准确性」与「复杂透视对称」时的系统性缺陷。「岁」字的结构错误属于文化符号层面的硬伤,不可接受;构图对称的偏移虽细微,却破坏了提示词明确要求的「对称居中」核心意图。材质表现中规中矩,但雕刻光影的矛盾显示物理引擎整合不足。综合判定为「基本可用但需后期修正」级别,不适合直接作为成品输出。

困难难度评测结果

  • 得分:71.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只右手拿着一张银色拉丝质感的金属卡片,背景是晴朗蓝天下模糊的天坛祈年殿。卡片中心有一个镂空的汉字,形状介于“岁”字与“岸”字之间,通过镂空处可以清晰看到远处天坛的建筑细节。卡片下方印有数字“2026”和一个黑色的马形剪影。构图采用了前景聚焦、背景虚化的手法,色调清新自然。画面中存在明显的 AI 生成缺陷:首先,卡片上的镂空汉字并非标准字体,笔画结构扭曲且不符合常规汉字逻辑;其次,虽然数字是 2026 年,但旁边的生肖图案却是马,而 2026 年对应的生肖应该是马,此处逻辑正确,但马的剪影线条略显生硬;最明显的异常在于持卡的手部,手指的关节连接处显得不够自然,且卡片的边缘与手指的接触位置存在轻微的透视重叠错误。

图中展示了一只右手拿着一张银色拉丝质感的金属卡片,背景是晴朗蓝天下模糊的天坛祈年殿。卡片中心有一个镂空的汉字,形状介于“岁”字与“岸”字之间,通过镂空处可以清晰看到远处天坛的建筑细节。卡片下方印有数字“2026”和一个黑色的马形剪影。构图采用了前景聚焦、背景虚化的手法,色调清新自然。画面中存在明显的 AI 生成缺陷:首先,卡片上的镂空汉字并非标准字体,笔画结构扭曲且不符合常规汉字逻辑;其次,虽然数字是 2026 年,但旁边的生肖图案却是马,而 2026 年对应的生肖应该是马,此处逻辑正确,但马的剪影线条略显生硬;最明显的异常在于持卡的手部,手指的关节连接处显得不够自然,且卡片的边缘与手指的接触位置存在轻微的透视重叠错误。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在材质表现和元素完整性方面表现较好,银色拉丝金属卡片质感真实,主要元素均已呈现。但存在两个核心问题严重影响评分:其一,视角设定与提示词要求完全相反,提示词要求第一人称视角,实际呈现为第三人称侧视角;其二,「框中框」对称构图的精准度不足,祈年殿未能严格居中对齐于「岁」字镂空,削弱了核心创意的视觉冲击力。整体属于「部分完成要求」的水平,核心构图逻辑存在明显偏差。 【GEMINI】该图像在视觉氛围营造上达到了一定水准,但在核心的「构图逻辑」与「细节精准度」上表现平庸。AI 在处理复杂镂空文字与透视对齐时显得力不从心,导致作品缺乏高端文创应有的严谨与精致感,更像是一张未完成的合成草图。 【KIMI】这是一张「概念及格、执行失败」的AI生成图像。模型理解了「镂空卡片+古建筑」的基本创意,但在核心要求——「框中框」对称构图——上完全偏离,祈年殿与「岁」字镂空的位置关系错位导致视觉意图崩塌。书法字体、金属材质、手持姿态等细节均存在明显的AI生成痕迹,缺乏真实摄影的物理精确性与手工质感。作为「高端文创宣传图」的定位,其精致度与专业完成度均未达标。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...