doubao-seedream-4-5 在「天坛祈年殿镂空岁字卡片生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:doubao-seedream-4-5
- 用例名称:天坛祈年殿镂空岁字卡片生成
- 测试类型:图像生成
- 评测维度:VG-FramedPerspective
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张图像:一只手拿着一张银色金属质感的长方形卡片,卡片中心镂空刻有汉字「岁」,透过镂空部分可以看到远处的北京天坛祈年殿,背景是湛蓝的天空。
任务要求
AI 模型需要满足以下要求:
- 画面中有一只手持银色金属长方形卡片
- 卡片中心有镂空的汉字「岁」
- 透过「岁」字镂空可见北京天坛祈年殿
- 背景为湛蓝天空
- 整体画面清晰,构图完整
评测结果
综合得分
该模型在此用例的得分为:84.3 分(满分 100 分),已通过
基础难度评测结果
- 得分:84.3 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中,一只左手在湛蓝的晴空下举起一块长方形的金属镂空牌。金属牌表面带有细微的划痕质感,中心镂空出一个简体中文“岁”字。透过镂空的边框,背景中远处的北京天坛祈年殿被虚化处理,展现出蓝瓦金顶的宏伟轮廓。构图上,手部位于画面左侧,金属牌居中,与背景中的古建筑形成趣味对位。 然而,画面中存在明显的 AI 生成缺陷:首先,手部结构严重异常,在大拇指和食指捏住金属牌的同时,左侧边缘多出了一个无法解释的指节,且手指的生长方向和关节连接不符合人体解剖学。其次,金属牌中间的“岁”字笔画逻辑有误,上半部分的“山”字头与下半部分连接处显得生硬且不自然,缺乏真实的物理支撑感。此外,金属牌边缘的阴影与手指的接触面处理得较为模糊,透视关系略显违和。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张高质量的图像,完整实现了提示词的全部核心要求。手持银色金属镂空「岁」字卡片、透过镂空可见天坛祈年殿、湛蓝天空背景——五项关键要求全部满足。空间层次关系处理自然,金属材质表现细腻,整体构图具有较强的视觉冲击力和文化意境。存在的小瑕疵(卡片缺角、「岁」字略偏右)不影响整体优秀的完成度。综合评分应在90分左右。 【GEMINI】这是一张构图逻辑清晰的 AI 生成图像,成功捕捉了前景与背景的空间关系。然而,作为核心视觉焦点的汉字「岁」未能准确生成,笔画结构崩坏,这在视觉传达上是一个重大失误。此外,手部细节和金属材质的真实感仍有提升空间。 【KIMI】该图像在核心元素完整性上表现良好,基本完成了提示词的全部要求。但作为挑剔的评审,必须指出其在物理真实感上的关键破绽:透视关系的不协调与色彩统一性的缺失,暴露了AI图像合成中常见的「图层拼贴」痕迹而非真实光学成像。金属质感虽细节丰富,但光影逻辑未能完全自洽。整体属于「乍一看合格,细究有漏洞」的中上水平生成结果,距离摄影级真实感仍有差距。
进阶难度评测结果
- 得分:76.9 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一双人手正举着一块银灰色金属质感的镂空书签,背景是北京天坛祈年殿和晴朗的蓝天。书签中心镂空出了一个巨大的汉字,其形状介于“岁”和“发”之间,通过镂空处正好可以看到远处宏伟的祈年殿。书签下方刻有数字“2026”以及一匹奔马的轮廓。画面色彩明亮,构图采用了框景摄影风格。 然而,画面中存在明显的 AI 生成缺陷:首先,最显著的问题是书签中心的镂空汉字是一个“错别字”,笔画结构扭曲,不符合任何标准汉字的写法;其次,画面左侧的大拇指指甲形状异常平扁,且手指关节的纹路处理得不够自然;此外,书签下方的数字“2026”与马的图案在透视上略显生硬,像是直接贴在金属表面而非真实的物理刻痕。天坛的建筑细节在镂空边缘处也出现了轻微的结构断层。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在材质表现和空间层次构建上表现优秀,银色金属卡片的工艺感和祈年殿的建筑细节均令人印象深刻。然而最致命的问题是镂空汉字错误——提示词明确要求「岁」字,图像呈现的却是「梦」字,这直接导致核心测试目标失败。此外景深虚化和电影级调色的表现也未达到提示词的期望水准。综合来看,这是一张在技术执行层面较为精良但在关键语义理解上存在根本性错误的图像。 【GEMINI】该图像在氛围营造和色彩控制上表现尚可,但在核心的文字渲染和精细化材质表现上暴露了当前AI模型的典型弱点。尤其是「岁」字的错误书写和手部结构的崩坏,严重影响了作品的专业度和真实感,未能达到高质量摄影作品的标准。 【KIMI】该图像在完成度上属于「概念验证通过,执行细节翻车」的案例。模型成功理解了「镂空汉字+地标建筑」的核心创意,但在汉字造型准确性、构图对称精度、材质工艺表现三个关键维度出现不可接受的失误。 particularly,「岁」字的结构性错误属于文化符号层面的失败,无法通过后期调整修正。电影调色与景深效果达到可用水准,但未能建立独特的视觉风格。综合判定为「有想法但执行粗糙」的AI生成结果,距离专业应用尚有显著差距。
困难难度评测结果
- 得分:64.5 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中,一只手正握着一块长方形的银色金属牌,背景是北京天坛祈年殿。金属牌中心有一个巨大的镂空汉字,形状介于“岁”和“出”之间,通过镂空部分可以清晰地看到远处的天坛建筑。金属牌下方刻有数字“2026”以及两匹奔马的浮雕图案。背景天空湛蓝,点缀着几朵白云,整体色调明亮清新。 这张图片存在明显的 AI 生成缺陷:首先,金属牌中心的镂空汉字并非标准字体,笔画结构混乱,无法准确辨认;其次,手部细节处理不自然,尤其是右侧握持边缘的手指数量和连接处显得生硬且不符合解剖学逻辑;此外,金属牌底部的马匹浮雕线条略显模糊,与“2026”数字的质感不完全统一。天坛建筑的细节在镂空处也略显扭曲,与周围环境的透视关系不够严谨。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在材质表现和视角构建上有一定水准,手持金属卡片的场景感较为真实,拉丝金属质感和环境光反射处理较好。然而,最致命的问题是核心汉字错误——将「岁」字生成为「梦」字,这直接导致提示词的核心主题(2026岁末/新年主题)表达失败,也使「框中框」的对称构图逻辑无法成立。在文字准确性这一AI生成图像的基础能力上出现如此明显的错误,严重拉低了整体评分。综合来看,这是一张在技术执行层面中规中矩、但在核心创意要素上存在根本性偏差的图像。 【GEMINI】该图像在氛围营造和材质表现上达到了一定水准,但在核心的「构图精准度」与「元素细节处理」上表现平庸。AI 在处理复杂几何镂空与解剖结构时出现了明显的逻辑崩坏,尤其是手部畸形和文字形态的失真,严重影响了高端文创宣传图的专业感。 【KIMI】这张图像是一个典型的「概念过关、执行失败」案例。AI模型理解了将「岁」字镂空与祈年殿结合的创意方向,但在所有关键执行层面——书法字形准确性、对称构图精度、材质物理合理性、人体结构真实性——均出现明显瑕疵。最致命的是「岁」字非书法风格与祈年殿未精准居中,这两项直接违背提示词的核心要求。整体品质处于「能看懂是什么,但经不起细看」的水平,距离「电影级」「高端文创宣传图」的目标差距显著。
相关链接
您可以通过以下链接查看更多相关内容: