qwen-image-2.0-pro 在「微缩模型汉字「北京」字体生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：qwen-image-2.0-pro
用例名称：微缩模型汉字「北京」字体生成
测试类型：图像生成
评测维度：文字渲染

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一张以汉字「北京」为主体的微缩模型风格图像。要求： - 汉字「北京」的每一笔画由微缩的京味物件搭建，例如红墙金瓦屋脊、胡同灰砖、糖葫芦串、银杏叶等 - 整体呈现微距拍摄质感，焦点区域清晰 - 背景为纯白色，无任何文字

任务要求

AI 模型需要满足以下要求：

画面中可清晰辨认汉字「北京」两个字的字形
笔画由京味微缩物件（如红墙、灰砖、糖葫芦、银杏叶等）构成
背景为纯白色，无多余文字或图案
整体画面清晰，字形结构完整

评测结果

综合得分

该模型在此用例的得分为：88.7 分（满分 100 分），已通过

基础难度评测结果

得分：88.7 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了由各种北京特色元素拼凑而成的“北京”二字，背景为纯白色。这两个汉字呈现出一种微缩景观或手工模型的质感，主要色调为故宫红、琉璃金和城墙灰。字体的笔画由微型的古建筑屋檐、红墙、灰色砖墙、华表柱、红彤彤的糖葫芦以及几片金黄的银杏叶组成。整体构图居中，光影柔和。然而，画面中存在明显的 AI 生成缺陷：汉字结构并不标准，尤其是“北”字的左半部分和“京”字的下半部分，笔画逻辑混乱，出现了断裂和不自然的堆砌；部分糖葫芦的竹签悬空或穿透了建筑模型；屋檐的瓦片纹路在细节处显得模糊且不规则，缺乏真实物理结构的合理性。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像出色地完成了提示词的核心要求：以红墙金瓦、糖葫芦、银杏叶、灰砖等典型京味微缩物件构建「北京」两字笔画，字形清晰可辨，元素主题高度契合，背景纯白整洁。整体呈现出精致的微缩模型质感，是一张高完成度的创意文字图像。细微不足在于局部笔画因元素堆叠略显拥挤，但不影响整体阅读与欣赏体验。【GEMINI】这是一张在材质表现力和主题契合度上表现优异，但在汉字结构理解上存在明显缺陷的作品。模型成功捕捉了「京味」物件的视觉特征和微缩模型的质感，但在构建复杂汉字笔画时，出现了结构性解体，尤其是「京」字的底部完全失去了字形支撑，导致可读性受损。作为以汉字为主体的设计，字形结构的准确性是其核心短板。【KIMI】该图像在主题元素选取与画面整洁度上表现优异，成功构建了京味微缩模型的视觉概念。核心短板在于字形结构的精确性——AI在将具象物件映射到抽象笔画时，过度追求元素的丰富性而牺牲了字形的可读性，尤其是「北」字弯钩与「京」字底部的处理存在明显结构变形。作为汉字艺术化表达的作品，字形可读性应为首要考量，当前表现仅达及格线以上。建议在生成时加强对汉字骨架结构的约束，或降低元素堆叠密度以保留笔画清晰度。

进阶难度评测结果

得分：79.3 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了由各种北京特色元素组合而成的“北京”两个汉字，背景为纯白色。左侧的“北”字由红墙、金色的琉璃瓦顶以及灰色的砖石城墙构成，展现了古建筑的韵味。右侧的“京”字则融入了更多民俗元素：顶部和中部横梁上点缀着晶莹剔透、裹着糖衣的红色冰糖葫芦，字体的右侧装饰着几片金黄色的银杏叶，下方还配有两个装满货物的木制微型独轮车。整体色彩以朱红、金黄和灰色为主，风格具有创意且充满文化气息。画面中存在明显的 AI 生成缺陷：首先，汉字结构严重变形，“北”字的笔画断开且比例失调，“京”字的下半部分结构模糊，无法形成正确的字形。其次，冰糖葫芦的竹签穿插逻辑混乱，部分竹签悬空或无端消失。此外，右侧的小木车轮廓模糊，与字体的衔接处透视关系异常，银杏叶的边缘也显得不够自然。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这张图像整体完成度较高，成功将「北京」两字以微缩模型形式呈现，六大核心元素全部准确落位，京味文化特征鲜明，字形识别度良好。最主要的不足在于微距浅景深效果未能充分实现，画面整体清晰度过于均匀，缺乏真实微距镜头的焦外虚化特征；其次是「京」字区域部分元素与字体笔画颜色相近导致的轻微粘连感。综合来看，这是一张基本完成提示词核心要求、具有较高完成度的图像，但在摄影质感的精细化呈现上仍有提升空间。【GEMINI】图像在视觉风格和元素契合度上表现优异，精准捕捉了「京味」微缩模型的质感。然而，作为以文字为主体的创意图像，其核心败笔在于对汉字结构的解构过于随意，导致「北」字形体残缺。同时，在微距视角下，糖葫芦竹签等细微处的物理逻辑错误被放大，削弱了真实感。【KIMI】这是一张「概念到位、执行偏航」的AI生成图像。模型准确理解了「京味元素拼贴汉字」的核心创意，红墙金瓦与糖葫芦的符号选择精准；但在关键的「微距摄影质感」维度完全失控，浅景深缺失使整个画面沦为扁平的3D渲染图而非提示词要求的「真实微距镜头拍摄效果」。元素独立性方面，糖葫芦与银杏叶的材质处理暴露出AI在模拟半透明/高反光表面时的典型缺陷——过度平滑的噪点替代了真实光学纹理。若用于概念展示尚可，作为摄影模拟则不合格。

困难难度评测结果

得分：75.3 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

画面中呈现了由北京特色元素拼凑而成的“北京”两个汉字，背景为纯白色。左侧的“北”字由红墙、金黄色琉璃瓦顶和青灰色砖墙组成，展现了古建筑的质感。右侧的“京”字则巧妙地融合了红色的糖葫芦、黄色的银杏叶以及两辆木制小推车。整体色调以红、灰、金黄为主，具有浓郁的文化韵味。然而，画面中存在明显的 AI 生成缺陷：左侧“北”字的笔画结构逻辑混乱，琉璃瓦的排列方向与建筑常理不符；右侧“京”字上方的糖葫芦竹签悬空穿过，缺乏合理的物理支撑；底部的木制小车轮廓模糊，且与汉字笔画的衔接处透视异常，显得不够自然。此外，银杏叶的生长位置也显得较为随意，缺乏真实的植物生长逻辑。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这张图像在创意概念和元素选取上高度契合提示词的北京主题设定，红墙金瓦、胡同灰砖、糖葫芦、小推车、银杏叶的组合具有强烈的京味文化符号感。微缩模型的制作质量较高，单个元素的细节表现出色。然而，最核心的技术要求——极浅景深与前后虚化——完全未能实现，这是与提示词最严重的偏差。此外「京」字下半部分笔画结构不完整，部分元素粘连问题也存在。综合来看，图像在视觉呈现上有一定吸引力，但对提示词技术规格的执行存在明显缺口。【GEMINI】这是一张在摄影质感和材质渲染上表现卓越，但在汉字结构理解和笔画逻辑上存在明显缺陷的作品。模型成功捕捉了「京味」元素的细节，却在构建「北」字时出现了严重的形变和笔画缺失，未能完全达成提示词中「精确铺设」和「物理独立」的结构化要求。【KIMI】该图像在概念创意层面有可取之处，但作为严格遵循提示词的微距摄影生成任务，存在多处致命失误：最核心的「极浅景深」技术要求完全未实现，「元素独立不粘连」的硬性规定被糖葫芦的融化拉丝严重违背，「京」字字形结构变形导致可读性下降。这些并非细节瑕疵，而是对提示词关键要求的系统性偏离。模型似乎更关注元素的堆砌呈现，而非精确控制摄影光学特性与物理规则，暴露出对「微距镜头」「景深」「物理独立」等概念的理解流于表面。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

进阶难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

困难难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

相关链接

反馈评测问题