qwen-image-2.0-pro 在「韩式婚礼「백년해로」书法场景生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：qwen-image-2.0-pro
用例名称：韩式婚礼「백년해로」书法场景生成
测试类型：图像生成
评测维度：书法艺术表现

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一幅韩式传统婚礼场景图像。场景要求： - 背景是红色喜庆屏风 - 屏风中心用金色墨水书写韩文「백년해로」（百年偕老） - 字体圆润饱满，清晰可辨

任务要求

AI 模型需要满足以下要求：

画面中有红色喜庆屏风作为主体背景
屏风中心有韩文「백년해로」字样
文字使用金色呈现
字体圆润饱满，笔画清晰可辨
整体画面具有韩式传统婚礼氛围

评测结果

综合得分

该模型在此用例的得分为：80.3 分（满分 100 分），已通过

基础难度评测结果

得分：80.3 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一面充满传统东亚婚礼氛围的红色绸缎屏风。屏风主体为鲜艳的红色，中心用金色颜料书写着四个巨大的韩文字符“백년해로”，寓意“百年偕老”。屏风的四个角落及顶部装饰有精致的粉色牡丹花刺绣，花朵错落有致，带有绿叶点缀。底部中央有一个圆形的金色刺绣边框，内嵌红色的“囍”字。屏风两侧由黑色的木质立柱支撑，柱头带有金色的圆球装饰，背景隐约可见木质的格栅窗棂，营造出一种古朴庄重的室内环境。在 AI 生成的细节方面，存在一些明显的逻辑缺陷：首先，中间的韩文字符笔画显得过于厚重且边缘模糊，缺乏真实书法的力度感与连贯性；其次，底部的“囍”字结构略显扭曲，左右并不完全对称；此外，屏风边缘与两侧立柱的连接处显得生硬，缺乏真实的物理悬挂或固定逻辑，绸缎表面的光影折射与刺绣的立体感在细节处也显得不够自然。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像高质量地完成了提示词的全部核心要求：红色喜庆屏风、金色韩文「백년해로」书法、圆润饱满的字体以及韩式传统婚礼氛围均得到出色呈现。文字准确性是本次测试的核心考察点，图像表现优异，四字清晰可辨且字形正确。场景还原度超出预期，刺绣花卉、立柱、格子窗等细节元素极大丰富了画面的文化内涵。整体而言，这是一幅接近完美的生成结果，仅存在极小的细节瑕疵，综合表现优秀。【GEMINI】这是一张视觉上非常精美、具有极高装饰性的图像，但在核心任务——韩文书法准确性上表现不佳。模型在处理复杂文字结构时，依然倾向于生成「看起来像文字」的图形，而非准确的文字。对于需要精准传达信息的场景，该模型尚需改进。【KIMI】该图像在基础视觉呈现上具备一定完成度，但在核心要求「韩文准确性」上出现严重失误，字形错误导致文字难以辨识；同时文化元素的混杂（中韩符号混用）暴露了模型对韩式传统婚礼场景理解的浅薄。作为「韩式传统婚礼场景」的生成任务，此结果未能通过文化准确性检验，属于「形似而神不似」的典型AI生成缺陷。

进阶难度评测结果

得分：79.2 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

画面中展示了一块充满传统喜庆氛围的红色屏风或挂幅，背景似乎是一个古朴的室内空间。挂幅主体为鲜艳的大红色，正中心用金色书法字体书写了四个韩文字符“백년해로”，寓意“百年偕老”。挂幅的四个角落装饰着精致的粉色和橙色牡丹花纹，并点缀着金色的云纹和圆形的“囍”字图案。左右两侧各有一根黑色的金属支撑杆。在 AI 生成的细节方面，存在一些明显的逻辑缺陷：首先，画面最下方的圆形“囍”字图案中，文字结构发生了扭曲和重叠，并非标准的汉字形态；其次，金色韩文书法的笔触边缘显得有些模糊，且与布料纹理的融合不够自然，带有明显的数字涂抹感；最后，挂幅顶部的边缘线条不够平直，左右两侧的支撑杆在透视和光影表现上略显僵硬，缺乏真实物体的质感。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像整体较好地完成了提示词的核心要求：红色喜庆屏风、金色韩文「백년해로」、传统花纹装饰均得到充分体现，文化氛围浓郁，构图合理。主要不足在于金色文字的金属闪烁质感未能完全实现，更接近厚涂金漆而非真正的金属光泽效果，这是与提示词明确要求存在偏差的核心问题。装饰元素和整体画面质量表现优秀，文字准确性良好。综合来看属于基本完成要求、有局部瑕疵的水准。【GEMINI】该图像在氛围营造和材质表现上表现出色，但在核心的文字书写准确性上仍有提升空间。作为装饰性图像，其视觉效果良好，但若用于正式场合，文字结构的严谨性是必须解决的短板。【KIMI】该图像在基础视觉呈现上及格，但在核心要求上存在明显短板。最致命的是「金属闪烁质感」的完全缺失——金色文字沦为普通渐变填充，这是材质表现的彻底失败。其次，「囍」字的文化误植暴露了模型对韩式/中式婚礼符号的混淆，属于不应出现的常识性错误。字形虽可辨识但书法骨力不足，装饰元素风格混杂。整体而言，模型完成了「有红色屏风、有韩文、有花纹」的表层要求，却未能实现提示词对质感、文化氛围的深层诉求，属于「形似神不似」的典型案例。

困难难度评测结果

得分：— 分
通过状态：未通过

模型生成产物

以下是该模型针对此任务的实际生成内容：

系统报错（阶段=模型生成; 模块=app.services.inference.call_text_model; provider=dashscope; model=qwen-image-2.0-pro）：Rate limit exceeded after 5 retries

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【GEMINI】由于模型返回「图像生成失败」，未能执行任何视觉生成任务，因此所有维度均无法评估，评分为 0 分。【CLAUDE】本次候选输出为「图像生成失败，无法评分」，模型未能生成任何图像内容，所有评分维度均得0分。任务要求生成一幅包含韩文书法、金属箔质感、丝绸底面光泽、传统韩式装饰纹样及婚礼场景景深的精致图像，但由于生成失败，上述所有功能要求均未得到满足。建议排查图像生成模块的故障原因，确保后续任务能够正常输出。【KIMI】候选输出明确显示「图像生成失败，无法评分」，未产生任何实际图像内容。因此所有评分维度均无法进行评估，统一计为0分。该结果属于完全的生成失败案例，不具备任何可评分的视觉元素。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

进阶难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

困难难度评测结果

模型生成产物

AI 评审点评

相关链接

反馈评测问题