qwen-image-2.0-pro 在「微缩模型汉字「北京」字体生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:qwen-image-2.0-pro
- 用例名称:微缩模型汉字「北京」字体生成
- 测试类型:图像生成
- 评测维度:文字渲染
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张以汉字「北京」为主体的微缩模型风格图像。 要求: - 汉字「北京」的每一笔画由微缩的京味物件搭建,例如红墙金瓦屋脊、胡同灰砖、糖葫芦串、银杏叶等 - 整体呈现微距拍摄质感,焦点区域清晰 - 背景为纯白色,无任何文字
任务要求
AI 模型需要满足以下要求:
- 画面中可清晰辨认汉字「北京」两个字的字形
- 笔画由京味微缩物件(如红墙、灰砖、糖葫芦、银杏叶等)构成
- 背景为纯白色,无多余文字或图案
- 整体画面清晰,字形结构完整
评测结果
综合得分
该模型在此用例的得分为:88.7 分(满分 100 分),已通过
基础难度评测结果
- 得分:88.7 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了由各种北京特色元素拼凑而成的“北京”二字,背景为纯白色。这两个汉字呈现出一种微缩景观或手工模型的质感,主要色调为故宫红、琉璃金和城墙灰。字体的笔画由微型的古建筑屋檐、红墙、灰色砖墙、华表柱、红彤彤的糖葫芦以及几片金黄的银杏叶组成。整体构图居中,光影柔和。然而,画面中存在明显的 AI 生成缺陷:汉字结构并不标准,尤其是“北”字的左半部分和“京”字的下半部分,笔画逻辑混乱,出现了断裂和不自然的堆砌;部分糖葫芦的竹签悬空或穿透了建筑模型;屋檐的瓦片纹路在细节处显得模糊且不规则,缺乏真实物理结构的合理性。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像出色地完成了提示词的核心要求:以红墙金瓦、糖葫芦、银杏叶、灰砖等典型京味微缩物件构建「北京」两字笔画,字形清晰可辨,元素主题高度契合,背景纯白整洁。整体呈现出精致的微缩模型质感,是一张高完成度的创意文字图像。细微不足在于局部笔画因元素堆叠略显拥挤,但不影响整体阅读与欣赏体验。 【GEMINI】这是一张在材质表现力和主题契合度上表现优异,但在汉字结构理解上存在明显缺陷的作品。模型成功捕捉了「京味」物件的视觉特征和微缩模型的质感,但在构建复杂汉字笔画时,出现了结构性解体,尤其是「京」字的底部完全失去了字形支撑,导致可读性受损。作为以汉字为主体的设计,字形结构的准确性是其核心短板。 【KIMI】该图像在主题元素选取与画面整洁度上表现优异,成功构建了京味微缩模型的视觉概念。核心短板在于字形结构的精确性——AI在将具象物件映射到抽象笔画时,过度追求元素的丰富性而牺牲了字形的可读性,尤其是「北」字弯钩与「京」字底部的处理存在明显结构变形。作为汉字艺术化表达的作品,字形可读性应为首要考量,当前表现仅达及格线以上。建议在生成时加强对汉字骨架结构的约束,或降低元素堆叠密度以保留笔画清晰度。
进阶难度评测结果
- 得分:79.3 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了由各种北京特色元素组合而成的“北京”两个汉字,背景为纯白色。左侧的“北”字由红墙、金色的琉璃瓦顶以及灰色的砖石城墙构成,展现了古建筑的韵味。右侧的“京”字则融入了更多民俗元素:顶部和中部横梁上点缀着晶莹剔透、裹着糖衣的红色冰糖葫芦,字体的右侧装饰着几片金黄色的银杏叶,下方还配有两个装满货物的木制微型独轮车。整体色彩以朱红、金黄和灰色为主,风格具有创意且充满文化气息。 画面中存在明显的 AI 生成缺陷:首先,汉字结构严重变形,“北”字的笔画断开且比例失调,“京”字的下半部分结构模糊,无法形成正确的字形。其次,冰糖葫芦的竹签穿插逻辑混乱,部分竹签悬空或无端消失。此外,右侧的小木车轮廓模糊,与字体的衔接处透视关系异常,银杏叶的边缘也显得不够自然。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张图像整体完成度较高,成功将「北京」两字以微缩模型形式呈现,六大核心元素全部准确落位,京味文化特征鲜明,字形识别度良好。最主要的不足在于微距浅景深效果未能充分实现,画面整体清晰度过于均匀,缺乏真实微距镜头的焦外虚化特征;其次是「京」字区域部分元素与字体笔画颜色相近导致的轻微粘连感。综合来看,这是一张基本完成提示词核心要求、具有较高完成度的图像,但在摄影质感的精细化呈现上仍有提升空间。 【GEMINI】图像在视觉风格和元素契合度上表现优异,精准捕捉了「京味」微缩模型的质感。然而,作为以文字为主体的创意图像,其核心败笔在于对汉字结构的解构过于随意,导致「北」字形体残缺。同时,在微距视角下,糖葫芦竹签等细微处的物理逻辑错误被放大,削弱了真实感。 【KIMI】这是一张「概念到位、执行偏航」的AI生成图像。模型准确理解了「京味元素拼贴汉字」的核心创意,红墙金瓦与糖葫芦的符号选择精准;但在关键的「微距摄影质感」维度完全失控,浅景深缺失使整个画面沦为扁平的3D渲染图而非提示词要求的「真实微距镜头拍摄效果」。元素独立性方面,糖葫芦与银杏叶的材质处理暴露出AI在模拟半透明/高反光表面时的典型缺陷——过度平滑的噪点替代了真实光学纹理。若用于概念展示尚可,作为摄影模拟则不合格。
困难难度评测结果
- 得分:75.3 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中呈现了由北京特色元素拼凑而成的“北京”两个汉字,背景为纯白色。左侧的“北”字由红墙、金黄色琉璃瓦顶和青灰色砖墙组成,展现了古建筑的质感。右侧的“京”字则巧妙地融合了红色的糖葫芦、黄色的银杏叶以及两辆木制小推车。整体色调以红、灰、金黄为主,具有浓郁的文化韵味。然而,画面中存在明显的 AI 生成缺陷:左侧“北”字的笔画结构逻辑混乱,琉璃瓦的排列方向与建筑常理不符;右侧“京”字上方的糖葫芦竹签悬空穿过,缺乏合理的物理支撑;底部的木制小车轮廓模糊,且与汉字笔画的衔接处透视异常,显得不够自然。此外,银杏叶的生长位置也显得较为随意,缺乏真实的植物生长逻辑。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张图像在创意概念和元素选取上高度契合提示词的北京主题设定,红墙金瓦、胡同灰砖、糖葫芦、小推车、银杏叶的组合具有强烈的京味文化符号感。微缩模型的制作质量较高,单个元素的细节表现出色。然而,最核心的技术要求——极浅景深与前后虚化——完全未能实现,这是与提示词最严重的偏差。此外「京」字下半部分笔画结构不完整,部分元素粘连问题也存在。综合来看,图像在视觉呈现上有一定吸引力,但对提示词技术规格的执行存在明显缺口。 【GEMINI】这是一张在摄影质感和材质渲染上表现卓越,但在汉字结构理解和笔画逻辑上存在明显缺陷的作品。模型成功捕捉了「京味」元素的细节,却在构建「北」字时出现了严重的形变和笔画缺失,未能完全达成提示词中「精确铺设」和「物理独立」的结构化要求。 【KIMI】该图像在概念创意层面有可取之处,但作为严格遵循提示词的微距摄影生成任务,存在多处致命失误:最核心的「极浅景深」技术要求完全未实现,「元素独立不粘连」的硬性规定被糖葫芦的融化拉丝严重违背,「京」字字形结构变形导致可读性下降。这些并非细节瑕疵,而是对提示词关键要求的系统性偏离。模型似乎更关注元素的堆砌呈现,而非精确控制摄影光学特性与物理规则,暴露出对「微距镜头」「景深」「物理独立」等概念的理解流于表面。
相关链接
您可以通过以下链接查看更多相关内容: