doubao-seedream-5-0 在「成都宽窄巷子镂空「和」字卡片」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:doubao-seedream-5-0
  • 用例名称:成都宽窄巷子镂空「和」字卡片
  • 测试类型:图像生成
  • 评测维度:VG-FramedPerspective

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张写实摄影风格的图像:一只手持着一张竹编纹理质感的卡片,卡片中心镂空刻有汉字「和」,透过镂空部分可以看到成都宽窄巷子的老建筑与红灯笼。

任务要求

AI 模型需要满足以下要求:

  1. 画面中有一只手持卡片的第一人称视角构图
  2. 卡片具有竹编纹理质感
  3. 卡片中心有镂空汉字「和」
  4. 透过镂空可见宽窄巷子老建筑与红灯笼
  5. 整体画面清晰,写实摄影风格

评测结果

综合得分

该模型在此用例的得分为:78.8 分(满分 100 分),已通过

基础难度评测结果

  • 得分:78.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只左手拿着一个正方形竹编装饰物的场景。装饰物中心是一个镂空的八角形窗棂形状,中间悬浮着一个木制的汉字“和”。背景是古色古香的中式建筑,屋檐下挂着红灯笼,整体色调温暖,充满了中国传统文化的气息。手部位于画面左下方,手指清晰,正捏着竹编框的边缘。 画面中存在明显的 AI 生成缺陷:首先,中间的“和”字在物理结构上是不合理的,它没有任何支撑点却悬浮在镂空区域中心,不符合重力常识。其次,竹编的纹路在边缘处处理得不够自然,部分编织线条出现了模糊或断裂。背景中的红灯笼和远处的建筑细节略显虚化,虽然营造了景深感,但灯笼的挂绳与屋檐的连接处逻辑模糊。此外,手部的大拇指指甲形状略显扁平,与真实手指的透视关系微有偏差。

图中展示了一只左手拿着一个正方形竹编装饰物的场景。装饰物中心是一个镂空的八角形窗棂形状,中间悬浮着一个木制的汉字“和”。背景是古色古香的中式建筑,屋檐下挂着红灯笼,整体色调温暖,充满了中国传统文化的气息。手部位于画面左下方,手指清晰,正捏着竹编框的边缘。

画面中存在明显的 AI 生成缺陷:首先,中间的“和”字在物理结构上是不合理的,它没有任何支撑点却悬浮在镂空区域中心,不符合重力常识。其次,竹编的纹路在边缘处处理得不够自然,部分编织线条出现了模糊或断裂。背景中的红灯笼和远处的建筑细节略显虚化,虽然营造了景深感,但灯笼的挂绳与屋檐的连接处逻辑模糊。此外,手部的大拇指指甲形状略显扁平,与真实手指的透视关系微有偏差。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像整体完成度较高,核心要素均有呈现:手持视角、竹编纹理卡片、镂空「和」字、中式古街背景与红灯笼一应俱全。竹编材质的质感表现是本图最大亮点。主要不足在于「和」字以立体浮雕形式呈现而非纯镂空穿透,导致透视穿透效果打折扣;背景场景的宽窄巷子地域辨识度有待提升。综合来看,图像基本忠实还原了提示词意图,属于完成度良好的生成结果。 【GEMINI】这张图像在构图和材质纹理的初步尝试上表现尚可,但在核心的「汉字书写逻辑」和「摄影光学模拟」上存在明显短板。AI 在处理镂空透视关系时,未能正确模拟景深效果,导致画面缺乏真实感。汉字结构的崩坏是最大的扣分项,这使得图像作为「展示汉字文化」的载体显得不够严谨。 【KIMI】该图像在氛围营造和主体材质表现上达到较高水准,但核心缺陷在于空间穿透关系的逻辑混乱——这是AI生成图像处理复杂透视时的典型软肋。提示词要求的「透过镂空可见宽窄巷子」这一关键空间关系未能准确实现,镂空内的背景更像是贴图叠加而非真实光学穿透。作为写实摄影风格的图像,这一透视矛盾使其难以通过专业视觉审查。

进阶难度评测结果

  • 得分:73.7 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一只右手拿着一块正方形木质工艺品的近景。这块工艺品采用了竹编纹理设计,中心是一个圆形的镂空,镂空处悬浮着一个金色的立体“和”字。工艺品下方印有黑色数字“2026”以及一个黑色的马匹剪影。背景是模糊处理的中国传统古镇街道,可以看到灰瓦白墙的建筑和悬挂着的红灯笼,整体色调温暖,呈现出黄昏或清晨的柔和光泽。在 AI 生成的细节方面,存在明显的逻辑错误:2026 年在中国农历中应为马年,但画面中悬浮的“和”字缺乏物理支撑结构,违背了重力常识;此外,手持工艺品的手指部分在边缘处显得有些不自然,与木板的接触面缺乏真实的受力挤压感,背景中的灯笼形状也略显扭曲。

图中展示了一只右手拿着一块正方形木质工艺品的近景。这块工艺品采用了竹编纹理设计,中心是一个圆形的镂空,镂空处悬浮着一个金色的立体“和”字。工艺品下方印有黑色数字“2026”以及一个黑色的马匹剪影。背景是模糊处理的中国传统古镇街道,可以看到灰瓦白墙的建筑和悬挂着的红灯笼,整体色调温暖,呈现出黄昏或清晨的柔和光泽。在 AI 生成的细节方面,存在明显的逻辑错误:2026 年在中国农历中应为马年,但画面中悬浮的“和”字缺乏物理支撑结构,违背了重力常识;此外,手持工艺品的手指部分在边缘处显得有些不自然,与木板的接触面缺乏真实的受力挤压感,背景中的灯笼形状也略显扭曲。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】图像在氛围营造和材质表现上表现优秀,竹编纹理细腻、背景虚化自然、色调温暖,整体视觉质量较高。然而最核心的「镂空穿透」概念未能实现——「和」字被渲染为金色浮雕而非透空镂刻,导致「透过镂空看到背景」这一关键视觉效果完全缺失。这是提示词最具创意和难度的核心要求,模型未能攻克这一技术难点,使得整体完成度打了较大折扣。 【GEMINI】图像在氛围营造上达到了预期,但在核心的「镂空」与「材质融合」等细节处理上表现出明显的 AI 生成痕迹。文字结构的崩坏和剪影贴图的廉价感严重拉低了作品的写实水准,未能达到专业摄影作品的严谨度。 【KIMI】该图像在概念层面完成了提示词的基本要求,但在核心的空间穿透关系上存在结构性失败——镂空与背景的合成痕迹明显,违背了物理光学规律。作为「写实摄影风格」的生成任务,透视逻辑的错误是致命伤。竹编材质与雕刻细节也未能达到以假乱真的标准,整体属于「远看尚可,近看破绽百出」的中等偏下水准。

困难难度评测结果

  • 得分:76.7 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中一只手拿稳着一个正方形的浅色竹编相框,背景是充满古风韵味的中国传统建筑。相框中心镂空,悬浮着一个木质的汉字“和”,透过镂空处可以看到远处的青瓦屋檐和红灯笼。相框底部印有黑色的数字“2026”以及一个奔马的剪影。整体色调温暖,夕阳的余晖洒在建筑上,营造出祥和的节日氛围。 画面中存在明显的 AI 生成缺陷:首先,手部动作虽然看起来自然,但手指的比例和关节连接处略显生硬;其次,镂空的“和”字在空间中缺乏物理支撑点,呈不合理的悬浮状态;最显著的错误在于生肖逻辑,2026 年在农历中应为马年(丙午年),但画面中奔马剪影的后腿线条模糊且结构紊乱。此外,背景中的红灯笼与屋檐的透视关系略显模糊,呈现出一种不真实的景深感。

图中一只手拿稳着一个正方形的浅色竹编相框,背景是充满古风韵味的中国传统建筑。相框中心镂空,悬浮着一个木质的汉字“和”,透过镂空处可以看到远处的青瓦屋檐和红灯笼。相框底部印有黑色的数字“2026”以及一个奔马的剪影。整体色调温暖,夕阳的余晖洒在建筑上,营造出祥和的节日氛围。

画面中存在明显的 AI 生成缺陷:首先,手部动作虽然看起来自然,但手指的比例和关节连接处略显生硬;其次,镂空的“和”字在空间中缺乏物理支撑点,呈不合理的悬浮状态;最显著的错误在于生肖逻辑,2026 年在农历中应为马年(丙午年),但画面中奔马剪影的后腿线条模糊且结构紊乱。此外,背景中的红灯笼与屋檐的透视关系略显模糊,呈现出一种不真实的景深感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】图像整体氛围营造较为成功,暖色调、Bokeh效果和人文气息均有良好表现。但核心构图要求存在根本性偏差:提示词要求「镂空刻有汉字和」并「透过镂空部分看到背景」,而图像实际呈现的是汉字悬挂于镂空框内的设计,导致框中景穿透感严重不足。这是影响评分的最关键问题。竹编材质质感基本到位但精细度有待提升。综合来看,图像完成了大部分视觉要素,但在最核心的「镂空框中景」构图逻辑上存在明显偏差。 【GEMINI】这张图像在氛围营造和基础构图上表现尚可,成功传达了温暖的人文气息。然而,在细节还原和空间透视逻辑上暴露了AI生成的典型弱点。作为一张强调「镂空卡片」的图像,其核心的镂空边缘处理和文字印刷质量未能达到写实摄影的严苛标准,导致画面缺乏足够的物理真实感,更像是一张精美的合成海报而非实拍照片。 【KIMI】该图像完成了提示词的核心概念——竹编卡片镂空「和」字形成框中景构图,但在执行层面存在多处AI生成的典型缺陷:空间透视逻辑混乱、光影方向自相矛盾、材质细节缺乏真实工艺痕迹。作为「写实摄影」定位的图像,其物理真实性与光学合理性均未达标,人文温度更多依赖色调营造而非细节质感。建议重点修正镂空文字的结构完整性、统一全图光照方向、增强手部与材质的真实纹理表现。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...