qwen-image-2.0-pro 在「蒸汽朋克探险家立绘设计」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:qwen-image-2.0-pro
  • 用例名称:蒸汽朋克探险家立绘设计
  • 测试类型:图像生成
  • 评测维度:游戏概念图

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张蒸汽朋克风格的男性探险家立绘。 角色要求: - 男性探险家,气质沉稳干练 - 佩戴黄铜护目镜 - 背负皮革背包 - 身上有蒸汽动力装置 风格要求: - 整体为蒸汽朋克美学风格 - 色彩沉稳,以棕色、铜色、深褐色为主调 - 线条干练清晰

任务要求

AI 模型需要满足以下要求:

  1. 画面中有一名男性探险家角色
  2. 角色佩戴黄铜护目镜
  3. 角色背负皮革背包
  4. 角色身上有蒸汽动力装置元素
  5. 整体风格符合蒸汽朋克美学,色调沉稳

评测结果

综合得分

该模型在此用例的得分为:86.7 分(满分 100 分),已通过

基础难度评测结果

  • 得分:86.7 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中是一幅具有蒸汽朋克风格的男性半身肖像画,采用复古的钢笔淡彩手绘风格。图中男子面容英俊,神情坚毅,留着棕色短发,额头上架着一副黄铜质感的防风护目镜。他穿着一件棕色皮革外套,内搭浅色衬衫,胸前装饰着精密的金属齿轮徽章。他的背上背着一个复杂的皮革背包,背包上方延伸出两根正在冒着白烟的铜质烟囱管,充满了工业时代的机械感。背景是简洁的米白色旧纸张质感,使主体人物更加突出。在 AI 生成的细节方面,可以观察到一些逻辑缺陷:男子右肩处的背包背带与衣服的衔接显得有些生硬,且背包上方的金属管道结构在透视和连接逻辑上略显混乱,部分细小的管道似乎凭空出现或消失,缺乏明确的物理支撑结构。

画面中是一幅具有蒸汽朋克风格的男性半身肖像画,采用复古的钢笔淡彩手绘风格。图中男子面容英俊,神情坚毅,留着棕色短发,额头上架着一副黄铜质感的防风护目镜。他穿着一件棕色皮革外套,内搭浅色衬衫,胸前装饰着精密的金属齿轮徽章。他的背上背着一个复杂的皮革背包,背包上方延伸出两根正在冒着白烟的铜质烟囱管,充满了工业时代的机械感。背景是简洁的米白色旧纸张质感,使主体人物更加突出。在 AI 生成的细节方面,可以观察到一些逻辑缺陷:男子右肩处的背包背带与衣服的衔接显得有些生硬,且背包上方的金属管道结构在透视和连接逻辑上略显混乱,部分细小的管道似乎凭空出现或消失,缺乏明确的物理支撑结构。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张高质量的蒸汽朋克风格男性探险家立绘,提示词的五项关键要求全部得到满足且执行到位。蒸汽朋克美学还原精准,色调统一,机械装备细节丰富,角色气质符合预期。手绘插画风格与水彩上色的结合赋予画面独特的艺术质感。轻微不足在于背景过于简洁以及右侧装置的空间层次感,但均不影响整体评价。综合加权得分约为92分,属于优秀级别的生成结果。 【GEMINI】这是一张视觉冲击力极强的蒸汽朋克插画,在风格还原和气质塑造上达到了极高水准。然而,作为一名挑剔的评审,不能忽视其在机械逻辑和服饰结构上的硬伤,尤其是背包肩带的断裂式生成,反映了 AI 在处理复杂遮挡与连接关系时的典型缺陷。 【KIMI】该图像基本完成了蒸汽朋克探险家的角色构建,核心装备齐全且色调沉稳。但作为「立绘」定位,机械装置的复杂度与功能性表达明显薄弱——蒸汽朋克的灵魂在于精密机械的「可信的虚构」,而非简单的烟囱堆砌。画面线条整体干练,但局部交叠区域的模糊处理暴露了AI对复杂空间关系的解析不足。综合而言,这是一张及格线以上的风格化肖像,但距离「沉稳干练的探险家」所需的机械可信度与场景沉浸感仍有差距。

进阶难度评测结果

  • 得分:83.5 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展现了一幅具有蒸汽朋克风格的人物肖像画,背景是泛黄的旧纸张纹理,上面绘有模糊的机械齿轮草图。画面中心是一位面容坚毅的中年男性,他留着深褐色短发和胡茬,额头上戴着一副黄铜质感的防风护目镜。他身穿棕色皮夹克和白色衬衫,背着一个沉重的皮革背包,背包上连接着复杂的黄铜管道系统,几根排气管正冒出白色的蒸汽。在男性的胸前,还悬挂着由齿轮和透镜组成的精密机械装置。整幅画采用复古的钢笔淡彩风格,色调以棕、金、米色为主。画面中存在明显的 AI 生成缺陷:背景左侧的文字笔画杂乱,无法辨认,纯属乱码;人物胸前的齿轮结构逻辑混乱,相互咬合的关系不符合物理常识;此外,右侧排气管冒出的蒸汽与管口的衔接处显得生硬,缺乏自然的透视感。

图中展现了一幅具有蒸汽朋克风格的人物肖像画,背景是泛黄的旧纸张纹理,上面绘有模糊的机械齿轮草图。画面中心是一位面容坚毅的中年男性,他留着深褐色短发和胡茬,额头上戴着一副黄铜质感的防风护目镜。他身穿棕色皮夹克和白色衬衫,背着一个沉重的皮革背包,背包上连接着复杂的黄铜管道系统,几根排气管正冒出白色的蒸汽。在男性的胸前,还悬挂着由齿轮和透镜组成的精密机械装置。整幅画采用复古的钢笔淡彩风格,色调以棕、金、米色为主。画面中存在明显的 AI 生成缺陷:背景左侧的文字笔画杂乱,无法辨认,纯属乱码;人物胸前的齿轮结构逻辑混乱,相互咬合的关系不符合物理常识;此外,右侧排气管冒出的蒸汽与管口的衔接处显得生硬,缺乏自然的透视感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张高质量的蒸汽朋克风格男性探险家立绘,几乎完整满足了提示词的所有要求。角色气质、装备细节、背景设计与整体风格均表现优秀。主要不足在于蒸汽动力装置的机械逻辑略显薄弱,管道走向更偏装饰性而非功能性,以及背景左侧的文字标注略显突兀。整体而言是一张完成度很高的作品,充分展现了蒸汽朋克美学与插画概念图的融合能力。 【GEMINI】这是一张视觉冲击力很强的蒸汽朋克插画,在色彩、氛围和材质表现上达到了极高水准。然而,作为硬核蒸汽朋克风格,其核心的机械逻辑(Steam-powered apparatus)存在明显硬伤,管道的断裂和齿轮的无效堆砌拉低了专业评分。背景的羊皮纸概念图设计非常出彩,成功提升了整体的艺术格调。 【KIMI】该图像在角色气质与基础色调上基本满足提示词要求,但作为蒸汽朋克风格立绘的核心——机械装备的细节真实性与功能性逻辑——存在显著缺陷。皮革质感与蒸汽装置的设计合理性是此类题材的评判关键,而本作在这两方面表现平庸,暴露出AI对复杂机械结构理解不足、仅能堆砌视觉符号的局限。背景处理流于表面,未能形成统一的艺术语言。综合评定为「基本可用但经不起推敲」的中等水准。

困难难度评测结果

  • 得分:70.3 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中呈现了一幅具有蒸汽朋克风格的人物设计草图,背景是泛黄的复古羊皮纸,点缀着机械齿轮和地图的线稿。主角是一位中年男性冒险家,他面容深邃,留着胡茬,头顶戴着一副带有铜锈绿色的防风护目镜。他身穿棕色皮质大衣和粗花呢背心,背着一个巨大的皮革背包,包上连接着复杂的黄铜蒸汽装置,正冒出白色烟雾。画面中分布着多处手写体标注,试图营造设计说明的氛围。然而,作为 AI 生成的图片,画面存在明显的逻辑缺陷:最显著的是文字部分,虽然笔画模仿了汉字,但全是无法辨认的乱码,没有任何实际含义。此外,背景左侧的齿轮线稿透视混乱,与背包连接的金属管道结构在空间上显得生硬且不合常理,部分烟雾的升腾方向与排气口位置衔接得不够自然。整体色调以棕、古铜和米色为主,充满了怀旧的工业幻想色彩。

画面中呈现了一幅具有蒸汽朋克风格的人物设计草图,背景是泛黄的复古羊皮纸,点缀着机械齿轮和地图的线稿。主角是一位中年男性冒险家,他面容深邃,留着胡茬,头顶戴着一副带有铜锈绿色的防风护目镜。他身穿棕色皮质大衣和粗花呢背心,背着一个巨大的皮革背包,包上连接着复杂的黄铜蒸汽装置,正冒出白色烟雾。画面中分布着多处手写体标注,试图营造设计说明的氛围。然而,作为 AI 生成的图片,画面存在明显的逻辑缺陷:最显著的是文字部分,虽然笔画模仿了汉字,但全是无法辨认的乱码,没有任何实际含义。此外,背景左侧的齿轮线稿透视混乱,与背包连接的金属管道结构在空间上显得生硬且不合常理,部分烟雾的升腾方向与排气口位置衔接得不够自然。整体色调以棕、古铜和米色为主,充满了怀旧的工业幻想色彩。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在风格氛围营造和角色面部塑造上有较好表现,蒸汽朋克的整体美学方向正确。然而存在一个根本性的构图失误:提示词明确要求全身立绘,图像却仅呈现上半身,这是对核心需求的直接违背。此外,AI生成中文文字的失真问题严重损害了概念设计图的专业感,蒸汽装置的机械结构合理性也有待提升。综合来看,这是一张「氛围对但执行有明显缺陷」的作品,未能达到专业概念艺术设计图的水准。 【GEMINI】这是一张视觉冲击力很强的半身肖像,但在执行「专业概念艺术设计图」这一指令上存在明显偏差。最核心的问题在于构图未达全身要求,且作为设计图核心的机械结构缺乏逻辑支撑,齿轮与管道的连接流于表面装饰,文字标注的乱码也降低了作品的专业深度。 【KIMI】这是一张「局部精美但整体失焦」的AI生成图像。模型在材质渲染(皮革、金属、蒸汽)方面展现技术实力,却在核心构图要求上犯下「半身截断」的低级错误——提示词明确要求的「全身立绘」被完全忽视。中文乱码标签暴露了文本生成能力的短板,使「概念设计图」的设定沦为装饰性噱头而非功能性叙事。装备细节虽丰富,但结构性逻辑(管道连接、齿轮咬合)经不起推敲。建议重新生成时强制约束全身构图比例,并采用英文或符号替代中文标注以避免乱码问题。当前图像更适合作为「角色头像素材」而非「概念设计立绘」使用。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...