qwen-image-2.0-pro 在「常见物体」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:qwen-image-2.0-pro
- 用例名称:常见物体
- 测试类型:图像生成
- 评测维度:物体生成
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张图片:一把简洁的木椅子 要求: - 标准的四腿椅子 - 木质纹理清晰 - 简洁的背景
任务要求
AI 模型需要满足以下要求:
- 生成一把标准四腿木椅,需包含椅座、椅背及四条完整椅腿,各部件连接自然,无缺失或悬空
- 椅子整体比例符合真实家具尺寸,无明显透视变形或部件比例失调
- 木质纹理清晰可见,纹理走向自然合理,呈现真实木材质感,避免塑料感或金属感
- 椅子风格简洁朴素,不含雕花、软垫、镀金等装饰性元素
- 背景简洁干净(如纯色或浅色渐变),不含干扰主体的杂乱元素,椅子为画面绝对主体
评测结果
综合得分
该模型在此用例的得分为:84.7 分(满分 100 分),已通过
基础难度评测结果
- 得分:84.7 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一把极简风格的棕色实木椅子,背景为纯净的白色,光线柔和且均匀。这把椅子呈现出复古的质感,木材表面带有自然的纹理和深浅不一的色泽。构图上,椅子处于画面中心并略微向左侧偏转,展现出靠背、座面以及四条腿的结构。靠背由一块长方形木板组成,通过两根立柱连接到座面。然而,作为一张 AI 生成的图片,画面中存在明显的逻辑缺陷:最显著的问题在于椅腿的数量和布局,画面中一共出现了五条椅腿,其中左后方和右后方各多出了一截模糊的支撑结构,且与座面的连接处透视关系混乱,不符合物理常识。此外,左侧靠背立柱与座面的衔接处显得生硬,缺乏真实的榫卯或螺丝固定痕迹。尽管整体色调温馨,但这些结构上的异常揭示了其人工智能生成的本质。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张高质量的简洁木椅图像,全面满足提示词的各项要求。椅子结构完整,木质纹理真实自然,背景简洁干净,风格朴素无多余装饰。图像整体呈现出专业产品摄影级别的质感,椅子的实木材质感、使用痕迹和自然木纹均表现出色。细微不足在于椅腿纹理细节略逊于椅背,以及透视角度下后腿略显压缩,但这些均属轻微问题,不影响整体优秀的表现。 【GEMINI】这张图像在视觉风格和背景构图上表现优秀,精准捕捉了「简洁」的意图。然而,作为工业设计类物体,其核心的结构完整性(Structural Integrity)存在明显 AI 生成痕迹,尤其是椅腿连接处的逻辑错误和透视畸变,使其无法作为一张合格的产品展示图。木纹质感虽好,但在关键的物理衔接点上缺乏细节支撑。 【KIMI】这是一张「乍看合格、细究有瑕」的典型AI生成图像。它满足了提示词的基础要求——四腿、木椅、简洁背景——但在物理真实性和材质一致性上暴露了当前生成模型的典型局限:纹理的局部合理性 vs 全局连贯性的矛盾,以及三维结构理解上的透视瑕疵。作为「生成日常常见物体」的任务,其完成度处于「可用但不可信」的区间,适合快速预览场景,但无法通过专业视觉审查。
进阶难度评测结果
- 得分:79.9 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一台放置在深色木质桌面上的复古黑色打字机。打字机呈现出陈旧的质感,机身上有细微的磨损和灰尘,上方插着一张泛黄的旧纸张。背景是模糊的木质墙壁,整体色调偏向温暖的棕褐色,营造出一种怀旧的氛围。打字机的金属零件和圆形按键在光线下带有淡淡的金属光泽。 然而,画面中存在明显的 AI 生成缺陷:最显著的问题在于键盘区域,按键上的字母排列混乱且毫无规律,出现了许多重复且无法辨认的虚假字符,完全不符合真实的键盘布局。此外,打字机顶部的机械结构显得过于复杂且逻辑不通,左侧的金属拉杆悬浮在半空中,没有合理的连接支点。纸张边缘的裁剪也显得有些生硬,与滚筒的衔接处缺乏真实的物理受力感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张质量相当高的老式打字机图像,三大核心部件齐全,金属质感与复古氛围的还原堪称优秀。主要不足集中在键盘布局的历史准确性上——按键字母排列不符合已知历史键盘规律,以及边缘按键因景深虚化导致字符辨识度下降。整体而言,图像在视觉质量和提示词完成度上表现良好,是一张接近优秀的生成结果。 【GEMINI】这是一张在氛围感和材质表现上非常出色,但在机械结构逻辑和细节严谨性上表现欠佳的作品。作为视觉设计,它捕捉到了老式打字机的神韵,但作为工业产品复刻,其键盘字符的乱码和拨杆结构的畸形是不可忽视的低级错误,完全背离了「字符清晰」和「物理逻辑正确」的关键要求。 【KIMI】这是一张『远看惊艳、近看崩溃』的典型AI生成图像。在缩略图尺度下,复古氛围与整体构图能够欺骗视觉;但一旦聚焦核心机械结构,打字杆区域的『金属糊』质感与键盘空间变形立即暴露AI对复杂机械原理的理解缺失。模型完成了『有一台老式打字机』的表层任务,却在『金属质感』与『机械结构合理性』两个关键要求上打了折扣。68-78的维度分布体现了『氛围及格、材质与结构不及格』的AI生成典型短板。
困难难度评测结果
- 得分:79.7 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一枚机械手表内部机芯的特写镜头。画面以银色和金色为主色调,构图紧凑,充满了复杂的金属零件。我们可以看到多个大小不一的齿轮相互交错,表面带有细腻的放射状拉丝纹理。机芯中点缀着几颗粉红色的宝石轴承,以及细小的螺丝。左下方是一个金色的摆轮,配有纤细的游丝。整体光影效果营造出一种冷峻的工业机械美感。 然而,作为一张 AI 生成的图片,画面中存在明显的逻辑和结构缺陷。首先,齿轮之间的咬合关系并不符合真实的物理机械原理,部分齿轮的边缘显得模糊且重叠异常。其次,机芯夹板上的文字刻印模糊不清,呈现出杂乱且无意义的符号,无法辨认。此外,左侧的表冠(调时旋钮)与表壳的连接处透视关系生硬,右侧出现的金属凸起物也缺乏明确的功能结构,显示出 AI 在处理复杂精密机械逻辑时的局限性。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张技术质量相当高的机械手表机芯微距摄影图像,金属质感、景深效果和构图均达到专业商业摄影水准。然而,图像与提示词存在一个根本性偏差:提示词要求「拆解展示」的爆炸图效果,而图像呈现的是完整组装状态下的机芯背面视图。这一核心意图的未满足是最主要的扣分点。若将提示词理解为「展示内部机芯」(而非严格的拆解爆炸图),则整体表现可达85分以上;但按照提示词字面要求严格评判,structural_integrity维度因拆解逻辑缺失而无法给高分。 【GEMINI】这是一张视觉冲击力很强的微距摄影风格图像,在材质表现和光影氛围上达到了专业摄影水准。然而,作为机械主题,其核心的「结构逻辑」存在硬伤,齿轮间的传动关系经不起推敲,游丝部分的细节坍塌是主要的失分项。整体属于「远看惊艳,近看失真」的作品。 【KIMI】该图像在「看起来像机械表机芯」的表层任务上基本合格,但作为「拆解展示」的专业图像存在严重结构性缺陷。最核心的扣分点在于擒纵机构的完全缺失——这相当于拍摄汽车发动机却省略了火花塞系统。齿轮系的「悬浮感」与红宝石轴承的「装饰性镶嵌」暴露出AI对机械原理的理解停留在视觉模仿层面。金属质感的「塑料化」倾向在放大观察时尤为明显。建议评分落在70分区间,体现「形似而神不似」的AI生成典型特征:满足非专业观众的视觉预期,但无法通过专业制表师的审视。
相关链接
您可以通过以下链接查看更多相关内容: