doubao-seedream-4-0 在「天坛祈年殿镂空岁字卡片生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：doubao-seedream-4-0
用例名称：天坛祈年殿镂空岁字卡片生成
测试类型：图像生成
评测维度：VG-FramedPerspective

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一张图像：一只手拿着一张银色金属质感的长方形卡片，卡片中心镂空刻有汉字「岁」，透过镂空部分可以看到远处的北京天坛祈年殿，背景是湛蓝的天空。

任务要求

AI 模型需要满足以下要求：

画面中有一只手持银色金属长方形卡片
卡片中心有镂空的汉字「岁」
透过「岁」字镂空可见北京天坛祈年殿
背景为湛蓝天空
整体画面清晰，构图完整

评测结果

综合得分

该模型在此用例的得分为：84.3 分（满分 100 分），已通过

基础难度评测结果

得分：84.3 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一只手拿着一块长方形的金属镂空书签，背景是北京天坛的祈年殿。画面构图以手持书签为中心，书签表面有拉丝金属质感，中间镂空刻有一个汉字。透过镂空部分，可以清晰地看到远处蓝天下的天坛建筑。背景的天空呈明亮的湛蓝色，天坛建筑处于虚化状态，突出了前景的金属质感。然而，这张 AI 生成的图片存在明显的逻辑和细节错误。首先，书签中心镂空的汉字形状异常，它看起来像是“岁”字的变形，但笔画结构完全错误，不符合任何标准汉字。其次，手部细节存在 AI 缺陷：左侧露出的手指关节连接生硬，指尖形状不自然；下方捏住书签的大拇指指甲盖边缘模糊，且与书签边缘的接触位置缺乏真实的物理受力感。此外，书签镂空边缘的透视与背景天坛的轮廓并未完美契合，呈现出一种生硬的拼贴感。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这张图像整体完成度相当高，五项关键要求基本全部满足：手持银色金属卡片✓、镂空汉字✓（字形有偏差）、透过镂空可见祈年殿✓、湛蓝天空背景✓、画面清晰构图完整✓。最主要的问题是镂空字形与标准「岁」字存在明显差异，上部「山」字形结构并非「岁」字的正确写法。空间层次和材质表现是本图最大亮点，达到了近乎照片级的真实感。综合评分约88分。【GEMINI】这是一张在材质表现和空间构图上表现优异的图像，但在 AI 绘图最薄弱的文字生成环节出现了严重失误。汉字「岁」的结构崩坏直接影响了作品的专业度，使其无法达到商业级摄影作品的标准。【KIMI】该图像基本完成提示词核心要求，创意构图将汉字镂空与古建筑结合具有视觉巧思。主要扣分点在于「岁」字对祈年殿顶部的遮挡导致建筑完整性受损，以及透视关系的轻微失真。金属质感与色彩表现处于合格水平，但未达到精致标准。整体属于「有想法但执行欠打磨」的中上之作。

进阶难度评测结果

得分：79.1 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一只手正握着一块银色金属镂空卡片，背景是北京天坛的祈年殿。卡片的上半部分镂空出了一个巨大的汉字“岁”，下半部分则镂空有数字“2026”和一个马形的剪影。透过卡片中间的镂空区域，可以清晰地看到远处蓝天下的祈年殿，构图巧妙地将金属工艺与古建筑实景结合。画面色调明亮，蓝天纯净，金属质感细腻。然而，图中存在明显的 AI 生成缺陷：首先，手部结构异常，左侧的大拇指显得过长且关节僵硬，右侧握持卡片的手指数量和排列逻辑混乱，指尖形状不自然。其次，卡片上的汉字“岁”字形结构略显生硬，不符合常规书法或印刷美学。最后，远处的祈年殿虽然轮廓清晰，但细节处的飞檐和纹饰在透视上略显模糊，与近处清晰的手部形成了不协调的对比。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这张AI生成图像整体完成度较高，成功呈现了手持金属镂空卡片透视祈年殿的核心创意。材质细节和电影调色是最突出的优势，金属质感逼真，色调冷静大气。主要不足在于镂空汉字「岁」的字形准确性存疑，以及祈年殿与镂空框的对称居中关系不够精准。综合来看，图像达到了提示词的主要要求，属于质量良好的生成结果，但在字形准确性和构图精准度上仍有提升空间。【GEMINI】这是一张典型的「初看尚可，细看崩坏」的AI生成图。虽然在整体氛围和色彩上达到了要求，但在核心的汉字结构、人体解剖学以及材质细节上存在明显短板。特别是汉字「岁」的镂空处理，完全失去了作为设计元素的可读性，这是此类设计类图像的大忌。【KIMI】该图像完成了提示词的核心概念——「岁」字镂空框住天坛祈年殿的创意构图，但在执行精度上存在多处妥协。作为AI生成图像，其最大价值在于概念实现，而非工艺细节。汉字结构、激光雕刻质感、电影调色三个关键要求均未达到专业标准，属于「想法不错、执行粗糙」的典型案例。若用于社交媒体快速传播尚可，但作为「电影级高清图像」的宣传素材则明显不达标。

困难难度评测结果

得分：69.3 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一只左手拿着一块长方形银色金属牌，背景是北京天坛祈年殿。金属牌中心有一个巨大的镂空汉字，透过这个镂空处，可以清晰地看到远处的天坛建筑，形成了一种巧妙的框景构图。金属牌下方刻有数字“2026”以及两匹奔马和波浪纹饰。背景天空晴朗，呈现出鲜艳的蓝色。然而，画面中存在明显的 AI 生成缺陷：首先，金属牌上的镂空汉字结构杂乱且不完整，无法辨认出具体是哪个字；其次，手部细节存在异常，大拇指的比例和关节连接显得不够自然；此外，金属牌下方的马匹图案线条略显生硬，且背景中天坛的边缘与金属牌镂空处的衔接在透视上略显违和，缺乏真实的光影遮挡关系。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像在材质表现、景深效果和整体视觉风格上有较好的表现，手持金属卡片的场景构建基本成功。然而，最致命的问题是核心汉字错误——镂空文字为「火」而非「岁」，这直接导致提示词的核心测试目标（「岁」字异形镂空与古建筑对称美学）完全失败。「框中框」对称构图也未能精准实现，祈年殿未居中于镂空区域。综合来看，图像在视觉呈现层面有一定质量，但在文字准确性和构图精准度这两个核心维度上存在严重缺陷，整体评价为部分完成提示词要求。【GEMINI】这是一张典型的「初看惊艳，细看崩坏」的 AI 生成图。虽然在色彩氛围和金属材质渲染上达到了商业宣传图的及格线，但在核心的构图逻辑和细节处理上存在重大缺陷。最致命的是对汉字「岁」的结构性破坏，使其失去了作为文创产品设计的核心灵魂。此外，透视关系的错位和奔马剪影的畸形，进一步拉低了作品的专业度。【KIMI】该图像在视觉完成度上达到中等水平，但核心文字元素的严重错误（「共」代「岁」）直接导致提示词关键要求落空，这是不可接受的硬性失误。构图与雕刻细节也存在多处可优化的空间，整体更接近「概念示意稿」而非「高端文创宣传图」的精度要求。模型在汉字识别与书法风格生成方面存在明显短板，需在文字准确性上加强约束。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

进阶难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

困难难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

相关链接

反馈评测问题