doubao-seedream-4-0 在「大理洱海苍山镂空顺字卡片生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:doubao-seedream-4-0
  • 用例名称:大理洱海苍山镂空顺字卡片生成
  • 测试类型:图像生成
  • 评测维度:VG-FramedPerspective

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张写实摄影风格的图像:第一人称视角,一只手拿着一张淡蓝色卡片,卡片中心镂空刻有汉字「顺」,透过镂空部分可以看到远处的洱海湖面与苍山。背景阳光明媚,清新风格。

任务要求

AI 模型需要满足以下要求:

  1. 画面呈现第一人称视角,可见持卡的手
  2. 卡片为淡蓝色,中心有镂空汉字「顺」
  3. 透过镂空部分能看到洱海湖面与苍山
  4. 整体画面清晰,光线明亮,风格清新写实

评测结果

综合得分

该模型在此用例的得分为:84.6 分(满分 100 分),已通过

基础难度评测结果

  • 得分:84.6 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一幅充满阳光的户外风景。画面前景中,一只左手捏着一张浅蓝色的正方形卡片,卡片中心镂空刻有一个汉字“顺”。透过镂空的字迹,可以看到背景中波光粼粼的水面。背景是一片开阔的湖泊或海面,远处有连绵的蓝色山脉,天空湛蓝清澈,右上角一轮烈日放射出耀眼的白光,光芒在水面上映照出细碎的金色亮斑。 这张图片具有明显的 AI 生成痕迹:首先是手部结构异常,拿卡片的手指比例不自然,大拇指与食指的连接处显得僵硬,且下方露出的其余手指数量和位置模糊不清,缺乏真实的骨骼感。其次,卡片上的“顺”字虽然清晰,但镂空边缘过于平滑且缺乏厚度感,与手部的光影衔接不够自然。此外,水面的波纹和远山的纹理略显重复,呈现出一种过度磨皮的数字平滑感。

图中展示了一幅充满阳光的户外风景。画面前景中,一只左手捏着一张浅蓝色的正方形卡片,卡片中心镂空刻有一个汉字“顺”。透过镂空的字迹,可以看到背景中波光粼粼的水面。背景是一片开阔的湖泊或海面,远处有连绵的蓝色山脉,天空湛蓝清澈,右上角一轮烈日放射出耀眼的白光,光芒在水面上映照出细碎的金色亮斑。

这张图片具有明显的 AI 生成痕迹:首先是手部结构异常,拿卡片的手指比例不自然,大拇指与食指的连接处显得僵硬,且下方露出的其余手指数量和位置模糊不清,缺乏真实的骨骼感。其次,卡片上的“顺”字虽然清晰,但镂空边缘过于平滑且缺乏厚度感,与手部的光影衔接不够自然。此外,水面的波纹和远山的纹理略显重复,呈现出一种过度磨皮的数字平滑感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像高质量地完成了提示词的核心要求:第一人称视角、手持淡蓝色镂空「顺」字卡片、透视洱海苍山背景、阳光明媚清新风格均得到完整呈现。镂空透视效果基本真实,色调统一和谐,整体接近真实摄影作品水准。主要不足在于镂空区域的光学细节略显简化,以及第一人称视角的沉浸感可进一步加强。综合来看,这是一张完成度较高的AI生成图像。 【GEMINI】这是一张视觉效果尚可的AI生成图,但在人体解剖结构和光学物理逻辑上暴露了模型处理复杂细节的能力不足。手部畸变是最大的减分项,破坏了写实摄影的沉浸感。 【KIMI】该图像在主体元素完整性上表现良好,基本完成了提示词的核心要求。但镂空透视效果作为技术难点暴露明显——AI 未能理解「镂空」作为三维空间操作的物理本质,仅实现了二维层面的「遮罩穿透」,导致该维度得分被拉低。整体画面质量处于可用水平,但材质真实感与光学一致性仍有提升空间。建议模型加强对于「实体材料剖面」与「空间穿透光学」的物理建模能力。

进阶难度评测结果

  • 得分:83.5 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只左手拿着一张浅蓝色亚麻质感的长方形卡片,背景是波光粼粼的湖泊和远处的群山。阳光从右上方照射,湖面上闪烁着耀眼的白色光斑。卡片中心有一个镂空的汉字“顺”,通过镂空处可以看到背景的湖水。卡片下方印有数字“2026”和一匹奔马的黑色剪影。整体色调以明亮的蓝色和白色为主,给人一种清新、宁静的感觉。 画面中存在明显的 AI 生成缺陷:首先,手部结构异常,大拇指的指甲形状不自然,且手指与卡片接触的部位缺乏合理的物理挤压感,像是悬浮在卡片边缘;其次,卡片上的镂空汉字“顺”笔画结构有误,左侧“川”部与右侧“页”部的连接处显得生硬且不符合常规书写逻辑;最后,卡片边缘的毛边效果分布过于均匀且细碎,带有明显的数字合成痕迹。

图中展示了一只左手拿着一张浅蓝色亚麻质感的长方形卡片,背景是波光粼粼的湖泊和远处的群山。阳光从右上方照射,湖面上闪烁着耀眼的白色光斑。卡片中心有一个镂空的汉字“顺”,通过镂空处可以看到背景的湖水。卡片下方印有数字“2026”和一匹奔马的黑色剪影。整体色调以明亮的蓝色和白色为主,给人一种清新、宁静的感觉。

画面中存在明显的 AI 生成缺陷:首先,手部结构异常,大拇指的指甲形状不自然,且手指与卡片接触的部位缺乏合理的物理挤压感,像是悬浮在卡片边缘;其次,卡片上的镂空汉字“顺”笔画结构有误,左侧“川”部与右侧“页”部的连接处显得生硬且不符合常规书写逻辑;最后,卡片边缘的毛边效果分布过于均匀且细碎,带有明显的数字合成痕迹。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张AI生成图像整体完成度相当高,六项关键要求全部得到满足,主体元素完整、材质质感出色、写实摄影风格到位。最主要的不足在于镂空区域内透出的背景以天空为主而非洱海湖山组合,略微削弱了「透视穿透」的景观特异性。但综合来看,这是一张接近专业水准的高质量生成图像,各维度均衡且无明显失误。 【GEMINI】图像在材质渲染和氛围营造上表现出了一定的水准,但在核心的透视逻辑和人体解剖结构上出现了典型的 AI 生成错误。手部结构的崩坏和镂空透视的平面化处理,使得这张图在写实摄影的评价标准下显得不够严谨。 【KIMI】该图像在概念执行上较为完整,成功呈现了提示词要求的核心场景:手持镂空「顺」字卡片透视洱海苍山。作为AI生成图像,其整体氛围与构图已达到可用水准。然而,在材质真实感与空间深度表现上仍存在典型AI缺陷:亚麻布纹理的「塑料均匀感」、镂空区域的厚度缺失、以及细节处的印刷质感平面化,均暴露了模型对物理世界材质与光影关系的理解局限。评分拉开差距的关键在于:完成「看起来像」容易,实现「真实感」仍难。

困难难度评测结果

  • 得分:77.1 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只手捏着一张浅蓝色亚麻质感的正方形织物,背景是波光粼粼的湖泊与远山。这张织物的中心被镂空剪裁出一个巨大的汉字「顺」,阳光透过镂空处和织物的缝隙洒下,形成明亮的波光。织物下方印有数字「2026」以及两匹马的黑色剪影。整体色调以清新的天蓝色和深蓝色为主,构图简洁且具有治愈感。 然而,画面中存在明显的 AI 生成缺陷:首先是镂空的汉字「顺」,其笔画结构不符合常规书法或字体逻辑,左侧的「川」字部首多出了一竖,右侧「页」字的内部结构也显得支离破碎,缺乏合理的连接。其次,左下角捏住织物的手指比例略显失调,指关节的纹路处理不够自然。此外,织物下方的马匹剪影与数字的透视关系略显生硬,与布料纹理的融合度欠佳。

图中展示了一只手捏着一张浅蓝色亚麻质感的正方形织物,背景是波光粼粼的湖泊与远山。这张织物的中心被镂空剪裁出一个巨大的汉字「顺」,阳光透过镂空处和织物的缝隙洒下,形成明亮的波光。织物下方印有数字「2026」以及两匹马的黑色剪影。整体色调以清新的天蓝色和深蓝色为主,构图简洁且具有治愈感。

然而,画面中存在明显的 AI 生成缺陷:首先是镂空的汉字「顺」,其笔画结构不符合常规书法或字体逻辑,左侧的「川」字部首多出了一竖,右侧「页」字的内部结构也显得支离破碎,缺乏合理的连接。其次,左下角捏住织物的手指比例略显失调,指关节的纹路处理不够自然。此外,织物下方的马匹剪影与数字的透视关系略显生硬,与布料纹理的融合度欠佳。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像整体完成度较高,成功实现了第一人称手持镂空汉字卡片透视洱海苍山的核心视觉效果,摄影写实风格突出,色调清新自然。主要短板集中在「苍山倒影」这一关键物理效果的缺失,以及镂空边缘切割质感的不足。前者是提示词中明确强调的重要细节,其缺失对水面倒影与光影物理合理性维度造成了明显扣分。综合来看,图像属于「基本完成要求但存在1-2处明显瑕疵」的水平,整体质量良好。 【GEMINI】该图像在视觉氛围和构图上表现良好,成功传达了清新自然的摄影风格。但在物理真实性与细节处理上存在明显短板,尤其是镂空透视的纵深感和水面物理倒影的缺失,使得图像在『写实摄影』这一核心要求上显得不够严谨,更偏向于合成感较强的数字插画。 【KIMI】该图像在执行层面呈现「形似而神不似」的特征:构图框架与色调氛围基本达标,但核心创意要求——镂空透视中的「水面倒影扭曲」——完全落空,导致空间逻辑崩塌。模型似乎将「透过镂空看到山」简单理解为「镂空是山的画框」,而非「镂空是水面倒影的窗口」。此外,实体材质的关键细节(卡片厚度、切割质感)缺失,暴露出AI对三维物体物理属性的理解局限。作为摄影概念图尚可,作为精确执行提示词的生成结果则不合格。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...