qwen-image-2.0 在「乌镇水乡镂空「宁」字玉石卡片」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:qwen-image-2.0
- 用例名称:乌镇水乡镂空「宁」字玉石卡片
- 测试类型:图像生成
- 评测维度:VG-FramedPerspective
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张写实摄影风格的图像:第一人称视角,一只手拿着一张淡绿色玉石质感的卡片,卡片中心镂空刻有汉字「宁」。柔和自然光照明。
任务要求
AI 模型需要满足以下要求:
- 画面呈现第一人称手持卡片的视角
- 卡片为淡绿色,具有玉石质感
- 卡片中心有镂空汉字「宁」
- 整体风格为写实摄影,光线柔和自然
- 画面清晰,主体突出
评测结果
综合得分
该模型在此用例的得分为:79.3 分(满分 100 分),已通过
基础难度评测结果
- 得分:79.3 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只肤色较深的手正握着一块长方形的淡绿色玉牌。玉牌质地温润,带有自然的翠绿色纹理,中心位置有一个镂空的汉字造型。背景是模糊的室内窗边,光线明亮且柔和。然而,画面中存在明显的 AI 生成缺陷:首先,手部结构严重畸形,玉牌右侧出现了四个手指,且指节连接处逻辑混乱,指甲形状不自然;其次,玉牌中心的镂空汉字并非真实的汉字,而是由扭曲、断裂的笔画组成的无意义符号,边缘切割痕迹也显得生硬且不符合物理常识。此外,左侧大拇指的比例与手掌连接处也存在透视上的扭曲,使得整只手看起来像是由多个不匹配的部分强行组合而成。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像高质量地完成了提示词的全部核心要求:第一人称手持视角、淡绿玉石质感卡片、镂空汉字「宁」、柔和自然光写实风格均得到准确呈现。玉石材质的半透明感与镂空透光效果是本图最突出的亮点,展现了对玉雕工艺视觉特征的精准理解。轻微不足在于手部比例略大及镂空边缘细节,但均属细节层面,不影响整体高完成度的评价。 【GEMINI】该图像在材质渲染和光影氛围上表现出较高的水准,成功营造了温润的玉石质感。然而,作为核心要求的『镂空汉字』生成完全失败,导致图像失去了语义价值。此外,手部细节的崩坏是典型的 AI 生成短板,严重影响了写实摄影的真实感。 【KIMI】该图像在概念层面完成了提示词的基本要求,但在物理真实性与光学一致性上存在多处硬伤。镂空文字的雕刻工艺表现、光源逻辑的连贯性、以及皮肤纹理的渲染稳定性均达不到写实摄影的标准。模型对「玉石温润质感」的理解停留在表面色彩模仿,未能捕捉次表面散射与天然矿物纹理的精髓。整体处于「形似而神不似」的中间地带,需要针对性优化材质系统与空间关系推理能力。
进阶难度评测结果
- 得分:79.4 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一只手在画面右下方捏着一块浅绿色的方形玉牌,玉牌中心镂空刻有一个汉字。背景是充满江南水乡风情的古镇景观,一条碧绿的小河穿过两岸白墙黛瓦的古建筑,河上有一艘木质摇橹船正缓缓行驶,船夫身穿蓝色上衣。整体色调清新自然,呈现出一种宁静的文化氛围。 然而,画面中存在明显的 AI 生成缺陷:首先,玉牌中心镂空的汉字结构极其混乱,并非标准的汉字,笔画断裂且逻辑不通,无法辨认具体字义。其次,右下角持物的手部结构异常,手指的比例和关节连接显得生硬,且指尖与玉牌的接触点缺乏真实的物理受力感。背景中的摇橹船细节也较为模糊,船身线条与水面的交接处略显失真,远处的建筑窗户和纹理存在一定的透视扭曲和像素粘连感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像高质量完成了提示词的全部核心要求:第一人称手持视角、淡绿色玉石卡片、镂空「宁」字、透过镂空可见乌镇河道与摇橹船、江南水乡湿润氛围与景深虚化、写实摄影风格与柔和自然光均得到充分体现。玉石材质表现尤为出彩,镂空透视关系处理自然合理。轻微不足在于字体风格略偏草书以及背景虚化程度可进一步加强,但整体属于高完成度作品。 【GEMINI】这是一张典型的「空有氛围,细节崩塌」的 AI 生成图像。虽然背景的江南水乡氛围营造得相当出色,且卡片材质本身质感尚可,但作为核心视觉焦点的「镂空汉字」完全失败,不仅字形错误,且完全没有处理好镂空透视这一光学难点,导致画面整体的真实感大打折扣。手部结构的畸变也进一步降低了画面的专业度。 【KIMI】该图像在概念呈现上基本符合提示词框架,但在核心的空间透视与光学真实感上存在显著缺陷。镂空透视关系的混乱是最致命的短板——它暴露了AI对三维空间穿透逻辑的理解不足,将「镂空」简单处理为二维蒙版而非真实物理穿透。景深控制的失败进一步削弱了摄影感,使画面呈现出尴尬的「全清晰」快照质感,而非大光圈虚化的高级感。玉石材质停留在表面色泽模仿,雕刻工艺的真实性缺失。整体属于「形似而神不似」的及格作品,距离高质量的写实摄影尚有距离。
困难难度评测结果
- 得分:78.3 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一双人手正举着一块浅绿色的半透明玉牌,背景是富有诗意的江南水乡。玉牌中心采用镂空工艺,刻有一个形似“宁”字的汉字,透过镂空处可以看到远方河面上行驶的小船。玉牌下方刻有数字“2026”以及两匹奔马的浮雕。背景中,两岸是典型的白墙黛瓦古建筑,河水呈深绿色,整体色调清新自然。 在 AI 生成的细节方面,存在几处明显的逻辑缺陷:首先,玉牌中心镂空的汉字笔画结构并不规范,并非标准汉字,且笔画在空间中呈现出一种不自然的悬浮感。其次,持牌人的手指细节略显生硬,指甲形状与皮肤纹理的衔接不够自然。最明显的异常在于透视关系,玉牌下方的“2026”数字与马匹浮雕的刻痕深度不一,且背景中的河岸建筑在靠近画面边缘处出现了轻微的结构扭曲。此外,玉牌边缘的厚度感在左右两侧并不完全对称。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张AI生成图像整体完成度相当高,几乎完整满足了提示词的所有关键要求。第一人称视角、玉石质感、镂空「宁」字透视、「2026」字样与马剪影装饰、江南水乡背景虚化、冷绿灰蓝色调等核心要素均有到位的呈现。最突出的成就在于镂空透视与景深层次的处理,透过「宁」字可见的河道摇橹船构图精准,层次分明。主要不足在于玉石材质的光泽层次略显单薄,以及底部马剪影细节稍显粗糙。综合而言,这是一张高质量的生成图像,写实摄影质感强,意境营造成功。 【GEMINI】这是一张典型的「远看有氛围,近看全是坑」的 AI 生成图。虽然在整体色调和背景氛围的营造上达到了预期的静谧感,但在核心的细节刻画上表现糟糕。特别是文字和装饰图案的生成能力极弱,导致卡片底部完全崩坏。玉石质感表现平庸,未能达到写实摄影要求的细腻程度。作为一张需要展示细节的特写图,其完成度远未达标。 【KIMI】该图像在概念构图上基本实现了提示词的核心创意——手持玉石卡片透视江南水乡,但在执行层面存在多处明显缺陷。最严重的问题在于细节完整性:「2026」字样与马剪影作为提示词明确要求的内容,呈现质量远低于可接受标准,右侧马匹几乎无法辨认。材质表现上,玉石的温润半透光感被塑料质感取代,镂空雕刻缺乏真实工艺痕迹。景深处理未能体现光学镜头的自然过渡,前后景关系暧昧。整体氛围虽有江南元素,但过曝天空与僵硬水面削弱了「烟雨温润」的意境。综合评估,该图像属于「部分完成要求,有多处需要改进」的层级,主要扣分点集中在细节完整性与材质真实度。
相关链接
您可以通过以下链接查看更多相关内容: