doubao-seedream-4-0 在「天坛祈年殿镂空岁字卡片生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:doubao-seedream-4-0
- 用例名称:天坛祈年殿镂空岁字卡片生成
- 测试类型:图像生成
- 评测维度:VG-FramedPerspective
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张图像:一只手拿着一张银色金属质感的长方形卡片,卡片中心镂空刻有汉字「岁」,透过镂空部分可以看到远处的北京天坛祈年殿,背景是湛蓝的天空。
任务要求
AI 模型需要满足以下要求:
- 画面中有一只手持银色金属长方形卡片
- 卡片中心有镂空的汉字「岁」
- 透过「岁」字镂空可见北京天坛祈年殿
- 背景为湛蓝天空
- 整体画面清晰,构图完整
评测结果
综合得分
该模型在此用例的得分为:84.3 分(满分 100 分),已通过
基础难度评测结果
- 得分:84.3 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只手拿着一块长方形的金属镂空书签,背景是北京天坛的祈年殿。画面构图以手持书签为中心,书签表面有拉丝金属质感,中间镂空刻有一个汉字。透过镂空部分,可以清晰地看到远处蓝天下的天坛建筑。背景的天空呈明亮的湛蓝色,天坛建筑处于虚化状态,突出了前景的金属质感。 然而,这张 AI 生成的图片存在明显的逻辑和细节错误。首先,书签中心镂空的汉字形状异常,它看起来像是“岁”字的变形,但笔画结构完全错误,不符合任何标准汉字。其次,手部细节存在 AI 缺陷:左侧露出的手指关节连接生硬,指尖形状不自然;下方捏住书签的大拇指指甲盖边缘模糊,且与书签边缘的接触位置缺乏真实的物理受力感。此外,书签镂空边缘的透视与背景天坛的轮廓并未完美契合,呈现出一种生硬的拼贴感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张图像整体完成度相当高,五项关键要求基本全部满足:手持银色金属卡片✓、镂空汉字✓(字形有偏差)、透过镂空可见祈年殿✓、湛蓝天空背景✓、画面清晰构图完整✓。最主要的问题是镂空字形与标准「岁」字存在明显差异,上部「山」字形结构并非「岁」字的正确写法。空间层次和材质表现是本图最大亮点,达到了近乎照片级的真实感。综合评分约88分。 【GEMINI】这是一张在材质表现和空间构图上表现优异的图像,但在 AI 绘图最薄弱的文字生成环节出现了严重失误。汉字「岁」的结构崩坏直接影响了作品的专业度,使其无法达到商业级摄影作品的标准。 【KIMI】该图像基本完成提示词核心要求,创意构图将汉字镂空与古建筑结合具有视觉巧思。主要扣分点在于「岁」字对祈年殿顶部的遮挡导致建筑完整性受损,以及透视关系的轻微失真。金属质感与色彩表现处于合格水平,但未达到精致标准。整体属于「有想法但执行欠打磨」的中上之作。
进阶难度评测结果
- 得分:79.1 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只手正握着一块银色金属镂空卡片,背景是北京天坛的祈年殿。卡片的上半部分镂空出了一个巨大的汉字“岁”,下半部分则镂空有数字“2026”和一个马形的剪影。透过卡片中间的镂空区域,可以清晰地看到远处蓝天下的祈年殿,构图巧妙地将金属工艺与古建筑实景结合。画面色调明亮,蓝天纯净,金属质感细腻。然而,图中存在明显的 AI 生成缺陷:首先,手部结构异常,左侧的大拇指显得过长且关节僵硬,右侧握持卡片的手指数量和排列逻辑混乱,指尖形状不自然。其次,卡片上的汉字“岁”字形结构略显生硬,不符合常规书法或印刷美学。最后,远处的祈年殿虽然轮廓清晰,但细节处的飞檐和纹饰在透视上略显模糊,与近处清晰的手部形成了不协调的对比。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张AI生成图像整体完成度较高,成功呈现了手持金属镂空卡片透视祈年殿的核心创意。材质细节和电影调色是最突出的优势,金属质感逼真,色调冷静大气。主要不足在于镂空汉字「岁」的字形准确性存疑,以及祈年殿与镂空框的对称居中关系不够精准。综合来看,图像达到了提示词的主要要求,属于质量良好的生成结果,但在字形准确性和构图精准度上仍有提升空间。 【GEMINI】这是一张典型的「初看尚可,细看崩坏」的AI生成图。虽然在整体氛围和色彩上达到了要求,但在核心的汉字结构、人体解剖学以及材质细节上存在明显短板。特别是汉字「岁」的镂空处理,完全失去了作为设计元素的可读性,这是此类设计类图像的大忌。 【KIMI】该图像完成了提示词的核心概念——「岁」字镂空框住天坛祈年殿的创意构图,但在执行精度上存在多处妥协。作为AI生成图像,其最大价值在于概念实现,而非工艺细节。汉字结构、激光雕刻质感、电影调色三个关键要求均未达到专业标准,属于「想法不错、执行粗糙」的典型案例。若用于社交媒体快速传播尚可,但作为「电影级高清图像」的宣传素材则明显不达标。
困难难度评测结果
- 得分:69.3 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只左手拿着一块长方形银色金属牌,背景是北京天坛祈年殿。金属牌中心有一个巨大的镂空汉字,透过这个镂空处,可以清晰地看到远处的天坛建筑,形成了一种巧妙的框景构图。金属牌下方刻有数字“2026”以及两匹奔马和波浪纹饰。背景天空晴朗,呈现出鲜艳的蓝色。然而,画面中存在明显的 AI 生成缺陷:首先,金属牌上的镂空汉字结构杂乱且不完整,无法辨认出具体是哪个字;其次,手部细节存在异常,大拇指的比例和关节连接显得不够自然;此外,金属牌下方的马匹图案线条略显生硬,且背景中天坛的边缘与金属牌镂空处的衔接在透视上略显违和,缺乏真实的光影遮挡关系。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在材质表现、景深效果和整体视觉风格上有较好的表现,手持金属卡片的场景构建基本成功。然而,最致命的问题是核心汉字错误——镂空文字为「火」而非「岁」,这直接导致提示词的核心测试目标(「岁」字异形镂空与古建筑对称美学)完全失败。「框中框」对称构图也未能精准实现,祈年殿未居中于镂空区域。综合来看,图像在视觉呈现层面有一定质量,但在文字准确性和构图精准度这两个核心维度上存在严重缺陷,整体评价为部分完成提示词要求。 【GEMINI】这是一张典型的「初看惊艳,细看崩坏」的 AI 生成图。虽然在色彩氛围和金属材质渲染上达到了商业宣传图的及格线,但在核心的构图逻辑和细节处理上存在重大缺陷。最致命的是对汉字「岁」的结构性破坏,使其失去了作为文创产品设计的核心灵魂。此外,透视关系的错位和奔马剪影的畸形,进一步拉低了作品的专业度。 【KIMI】该图像在视觉完成度上达到中等水平,但核心文字元素的严重错误(「共」代「岁」)直接导致提示词关键要求落空,这是不可接受的硬性失误。构图与雕刻细节也存在多处可优化的空间,整体更接近「概念示意稿」而非「高端文创宣传图」的精度要求。模型在汉字识别与书法风格生成方面存在明显短板,需在文字准确性上加强约束。
相关链接
您可以通过以下链接查看更多相关内容: