doubao-seedream-4-5 在「八个物体」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:doubao-seedream-4-5
- 用例名称:八个物体
- 测试类型:图像生成
- 评测维度:数量控制
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
一个白色餐盘上整齐摆放着八个红色草莓,草莓大小相近,呈圆形分布。明亮的自然光照射,纯白背景,俯视角度拍摄。
任务要求
AI 模型需要满足以下要求:
- 图像中必须恰好包含8个红色草莓,每个草莓须为独立完整个体,不允许存在遮挡、残缺或出画导致数量无法确认的情况
- 所有草莓须清晰可见,形态完整,具备草莓的基本外形特征(如圆锥形轮廓、红色果面),大小相近
- 8个草莓须在白色餐盘上呈均匀圆形环状分布,整体排列轮廓构成完整的圆形
- 拍摄视角须为俯视角度(接近垂直向下),餐盘在画面中呈正圆形或近似正圆形
- 背景须为纯白色,光照明亮均匀(模拟自然光效果),画面整体清晰无明显噪点
评测结果
综合得分
该模型在此用例的得分为:67.5 分(满分 100 分),已通过
基础难度评测结果
- 得分:67.5 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一个纯白色的圆形瓷盘,平放在纯白色的背景上。盘中整齐地摆放着九颗鲜红色的草莓,其中八颗围成一圈,一颗位于圆心。这些草莓色泽红润,表面带有细小的籽点,在明亮的顶光照射下,果实顶端闪烁着晶莹的反光,显得十分新鲜。构图简洁,红色的水果与白色的器皿形成鲜明的色彩对比。然而,画面中存在明显的 AI 生成缺陷:所有草莓都完全缺失了顶部的绿色叶片(花萼),切口处平滑得不自然;部分草莓的形状过于规整,呈现出近乎完美的圆锥体;此外,盘子边缘的阴影投射与光线方向略有不符,且部分草莓与盘面的接触位置缺乏真实的物理阴影,导致果实看起来像是悬浮或粘贴在盘子上。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在物体视觉质量上表现不错,草莓个体渲染精细,但在两个最关键的维度上均出现明显失误:数量多出1个(9个而非8个),视角完全错误(斜侧视而非俯视)。这两项失误直接违背了提示词的核心测试目标——「测试模型生成八个物体」的数量准确性,以及「俯视角度」的构图要求。综合权重计算后,整体表现偏低,属于部分完成提示词要求的水平。 【GEMINI】该模型在执行定量指令上完全失败,将「8个」理解为「8+1」的结构。同时忽略了垂直俯视的构图要求,且草莓形态过于单一,缺乏自然生长的细节(如叶片)。虽然画面干净,但作为测试模型生成特定数量物体的样本,属于不及格表现。 【KIMI】该图像在数量准确性上表现完美,但在核心空间布局要求上存在严重偏差。提示词明确要求「圆形分布」,模型却生成了横向排列的矩阵式布局,这是不可接受的错误。尽管单个草莓视觉质量尚可,但布局失误导致整体未能完成用户意图。建议模型加强几何排列指令的理解能力,区分「圆形分布」(环形排列)与「在圆形餐盘上分布」(任意排列于圆形容器内)的差异。
进阶难度评测结果
- 得分:75.6 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一幅宁静的夜景,一排复古风格的欧式路灯沿着桥梁或河岸向远方延伸。画面色彩对比鲜明,背景是深邃的墨蓝色夜空,云层厚重且带有细腻的纹理;而路灯散发出温暖的橘黄色光芒,照亮了下方的地面。构图采用了极具纵深感的透视法,路灯由近及远逐渐缩小,营造出一种深邃的视觉引导效果。路灯的造型精致,带有黑色的金属支架和多边形的玻璃灯罩。 在 AI 生成的细节方面,存在一些逻辑和透视上的瑕疵:随着距离远去,后方几盏路灯的灯杆底座与护栏的衔接显得模糊且不自然,部分灯杆似乎直接悬浮或错位在护栏之上。此外,最远端的几盏灯在光影表现上略显生硬,缺乏真实环境中的光线衰减层次。尽管如此,整体画面依然传递出一种静谧、温馨的氛围。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】图像在氛围营造和透视构图上表现优秀,复古夜景的视觉质量较高。然而核心任务——精确生成8盏路灯——未能达标,按严格的75%灯体可见度标准仅有约6盏有效路灯,最远处两盏沦为残影,这是本图最致命的缺陷。低角度仰拍的视角表现也略显不足。综合来看,视觉质量与氛围出色,但关键数量要求的失败拉低了整体得分。 【GEMINI】图像在视觉氛围和艺术表现力上非常出色,准确捕捉了复古街道的静谧感。然而,作为一项测试模型生成特定数量物体的任务,该模型未能精准控制数量(生成了10盏而非8盏),且在远景透视的间距处理上略显局促,属于典型的「画得美但数不对」。 【KIMI】该图像在核心测试目标——「生成八个物体」上表现完美,8盏路灯数量精准、完整可见。但在空间布局的精细度上存在明显短板:仰拍视角执行不彻底导致画面缺乏应有的视觉张力,末端间距突变暴露AI对透视节奏的把控不足。氛围营造方面,前7盏路灯的光色表现优秀,但背景建筑的虚假感和远处光源的色偏拉低了整体质感。综合而言,这是一张「完成基本要求但缺乏精致度」的AI生成图像,适合作为数量控制的成功案例,但在空间构图和细节真实感上仍有提升空间。
困难难度评测结果
- 得分:82.0 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一个宁静的日式枯山水景观。画面主体是铺满细白沙子的地面,沙面上被耙制出流畅的 S 形波浪纹路,象征着流动的水。九块深灰色的扁平鹅卵石呈弧线形排列,仿佛是水面上浮现的踏脚石,从画面左下角延伸至右上角。背景是柔和的竹帘,阳光透过缝隙洒下,在沙地上形成了斑驳的阴影,营造出一种禅意与静谧的氛围。整体色调以米白色、灰色和淡黄色为主,构图具有延伸感。 在 AI 生成的细节方面,存在一些逻辑缺陷:画面右侧的沙纹在接近竹帘阴影处变得模糊且断裂,纹路的走向与鹅卵石的摆放位置缺乏自然的物理互动,部分石头的边缘与沙地的衔接显得过于生硬,缺乏真实的重力下陷感。此外,背景竹帘的透视关系略显扭曲,左上角的帘子纹理出现了不自然的重叠。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张图像在视觉质量和氛围营造上表现出色,白沙波纹、竹帘光影和景深处理均达到较高水准。然而核心测试任务——「生成恰好8个物体」——存在明显瑕疵:中部石头重叠区域导致数量计数存在歧义,无法确认严格满足8块要求。S形曲线排列也更接近单弧形,双向反转特征不明显。整体而言是一张视觉效果良好但关键要求完成度存疑的图像。 【GEMINI】该图像在数量控制和构图布局上表现优异,准确完成了提示词的核心要求。但在细节质感上,尤其是禅意庭院灵魂所在的「沙纹逻辑」上存在明显的人工合成痕迹,纹路与石头的交互不符合物理常识,导致视觉真实度有所打折。 【KIMI】该图像在核心数量要求上表现完美,8块鹅卵石清晰可数。但空间布局存在严重偏差——S形曲线完全未实现,且石头大小同质化严重,这两项缺陷直接违背提示词的关键美学要求。视觉氛围基本合格但精致度不足,沙纹和光影处理有提升空间。作为「测试模型生成八个物体」的任务,数量维度满分,但空间构图能力明显薄弱,整体属于「部分完成要求,有多处需要改进」的层级。
相关链接
您可以通过以下链接查看更多相关内容: