doubao-seedream-4-5 在「单一属性绑定」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:doubao-seedream-4-5
- 用例名称:单一属性绑定
- 测试类型:图像生成
- 评测维度:属性绑定
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张图片:一只橙色的猫 要求: - 猫的毛色必须是橙色 - 整只猫都是橙色,不是斑点
任务要求
AI 模型需要满足以下要求:
- 图像中必须有且仅有一只猫,不得出现多只猫或将猫与其他动物混淆
- 猫的毛色必须以橙色系为主色调,包括橘色、橙黄色、姜黄色等均符合要求
- 猫的整体毛色应以橙色覆盖为主,允许因自然光影产生的深浅条纹,但不得出现大面积(超过体表20%)的白色、黑色、灰色等非橙色毛发区域
- 猫的形态必须完整清晰,头部、身体、四肢可辨认,无严重畸变或肢体缺失
- 背景不得使用与橙色高度相似的颜色,以免干扰对猫毛色的判断
评测结果
综合得分
该模型在此用例的得分为:85.9 分(满分 100 分),已通过
基础难度评测结果
- 得分:85.9 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中展示了一只以插画风格呈现的橘色条纹猫,它正安静地蹲伏在米白色的纯净背景中央。这只猫拥有温暖的姜黄色皮毛,背部和头部带有深橘色的虎斑条纹,毛发质感细腻,边缘透出柔和的光泽。它的眼睛是明亮的琥珀色,正平和地注视着前方,粉红色的鼻头和细长的白色胡须让神态显得十分乖巧。构图上,猫咪占据了画面主体,身体呈侧卧蹲姿,尾巴顺从地环绕在身侧。 作为一张 AI 生成的图像,画面中存在一些明显的逻辑缺陷:最显著的问题在于猫咪的前肢,左前爪的线条与身体连接处显得模糊且结构异常,看起来像是直接从胸部生发出来,缺乏自然的骨骼转折;此外,猫咪身体后半部分的体积感略显臃肿,尾巴末端与身体的融合处线条处理不够自然,呈现出一种平面贴合感,而非真实的立体环绕。尽管如此,整体色调和谐,给人一种温馨治愈的视觉感受。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张完成度较高的橙色猫插画,主体清晰、形态完整、橙色属性绑定基本准确。主要扣分点在于下巴/胸口的浅米白色区域与提示词「整只猫都是橙色」的要求存在轻微偏差,以及虎斑条纹与「不是斑点」要求之间的字面冲突(尽管条纹属橙色系内变化)。整体而言属于基本完成要求、存在1-2处可见瑕疵的水准。 【GEMINI】该图像在色彩属性绑定上表现优异,完美执行了「全橙色」的指令。然而,作为一名挑剔的评审员,不能忽视其在生物形态结构上的硬伤,尤其是前肢末端的畸变严重拉低了实体完整性的得分。整体是一张色彩达标但结构有误的AI生成插画。 【KIMI】该图像基本完成了「一只橙色的猫」的核心提示词要求,但在「整只猫都是橙色」这一严格解读下,下颌至胸部的白色区域构成了实质性偏差。作为属性绑定测试,模型未能完全抑制猫的白色胸毛这一训练数据中的常见模式,显示出对提示词中「整只」「都是」等绝对化限定词的敏感度不足。插画风格的质量较高,但若以「测试单个物体的单个属性」的严格标准衡量,颜色属性的绑定存在可量化的缺陷。
进阶难度评测结果
- 得分:92.1 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了三只并排坐卧的小动物,从左至右分别是一只黑猫、一只白色的拉布拉多犬和一只棕色的小兔子。背景是简洁的浅灰色,带有细腻的绘画质感。左侧的黑猫有着明亮的黄色眼睛,神情冷峻;中间的拉布拉多犬体型最大,正温顺地趴在地上,眼神柔和;右侧的小兔子竖着长耳朵,模样乖巧。光线从左侧照射,在动物的皮毛上留下了温暖的高光。 作为一张 AI 生成的图片,画面中存在一些明显的逻辑缺陷:中间拉布拉多犬的身体结构显得有些局促,其后半身似乎消失在了黑猫和兔子身后,缺乏合理的透视衔接;此外,黑猫的左前爪与身体的连接处略显生硬,兔子的胡须分布也显得不够自然,左右长短和疏密程度不太对称。尽管如此,整幅画作色彩和谐,给人一种温馨治愈的感觉。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张高质量的AI生成插画,完整且准确地满足了提示词的核心要求:三只动物物种清晰可辨,颜色属性绑定精准无误,黑猫、白狗、棕兔各司其职,无颜色混淆或渗透问题。插画风格统一,视觉质量优良。存在的瑕疵均属细节层面(轻微高光、边缘处理、姿势遮挡),不影响对提示词要求的整体完成度。综合加权评分约为93分,属于优秀水准。 【GEMINI】这是一张高质量的AI生成插画,完美达成了用户关于「黑猫、白狗、棕兔」的颜色绑定要求。在属性绑定这一核心测试点上表现近乎完美。主要的失分项在于动物肢体结构的完整性(狗的后半身缺失)以及局部解剖细节(狗爪)的严谨性,但整体视觉效果和物种识别度非常出色。 【KIMI】该图像在核心任务——「三只特定颜色动物的准确生成」上表现优异,attribute_binding_accuracy 与 entity_completeness 均接近满分。视觉层面的瑕疵属于提示词未明确要求的「锦上添花」范畴,不影响主体任务完成度。扣分点严格限定于可观测的具体缺陷,而非风格偏好。整体属于高质量完成品,模型对颜色-物种绑定的理解可靠。
困难难度评测结果
- 得分:96.3 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了三位年轻男性并排站在一堵米白色墙壁前,他们穿着色彩鲜艳且对比强烈的纯色运动服。从左至右,第一位男士戴着黄色棒球帽,穿红色长袖卫衣和蓝色运动裤;中间的男士戴着绿色帽子,穿蓝色卫衣和红色裤子;右侧的男士戴着红色帽子,穿黄色卫衣和绿色裤子。三人的服装配色呈现出一种循环互换的视觉效果。光线从侧面照射,在墙上留下明显的阴影。 画面中存在几处明显的 AI 生成缺陷:最左侧男士插在口袋里的手部结构模糊,手指轮廓不自然;中间男士的左手(画面右侧)插兜处,衣服褶皱与手部的衔接显得生硬且逻辑混乱;右侧男士的裤腰处细节模糊,且其身后墙壁上的阴影形状与人物实际轮廓不完全匹配。此外,三人的面部特征过于相似,带有典型的 AI 模版化痕迹。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像出色地完成了提示词的核心要求——9个颜色属性全部准确绑定至对应人物的对应服饰部位,无任何颜色错位或串扰,属性绑定准确率接近满分。三人左中右排列清晰,空间位置关系符合要求。轻微不足在于画面底部略有截断及右侧人物轻微遮挡,但均不影响属性核查。整体而言,这是一张高质量完成提示词要求的图像。 【GEMINI】这是一张在属性绑定(Attribute Binding)测试中表现近乎完美的图像。它成功克服了 AI 绘画中常见的「颜色污染」和「属性错位」问题,准确地将 9 个独立的颜色指令分配到了正确的人物和服饰部位上。构图简洁有力,完全符合提示词的逻辑要求,是高质量生成的典范。 【KIMI】这是一张近乎完美的AI生成图像,在严格的颜色属性绑定测试中表现优异。提示词要求的9个颜色-人物-部位三元组全部正确实现,无任何错位、遗漏或混淆。三人空间关系明确,形态完整,满足「测试单个物体的单个属性」的核心目标。扣分点仅在于非关键区域的轻微AI痕迹,不影响功能验证。
相关链接
您可以通过以下链接查看更多相关内容: