qwen-image-2.0-pro 在「韩式婚礼「백년해로」书法场景生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:qwen-image-2.0-pro
- 用例名称:韩式婚礼「백년해로」书法场景生成
- 测试类型:图像生成
- 评测维度:书法艺术表现
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一幅韩式传统婚礼场景图像。 场景要求: - 背景是红色喜庆屏风 - 屏风中心用金色墨水书写韩文「백년해로」(百年偕老) - 字体圆润饱满,清晰可辨
任务要求
AI 模型需要满足以下要求:
- 画面中有红色喜庆屏风作为主体背景
- 屏风中心有韩文「백년해로」字样
- 文字使用金色呈现
- 字体圆润饱满,笔画清晰可辨
- 整体画面具有韩式传统婚礼氛围
评测结果
综合得分
该模型在此用例的得分为:80.3 分(满分 100 分),已通过
基础难度评测结果
- 得分:80.3 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一面充满传统东亚婚礼氛围的红色绸缎屏风。屏风主体为鲜艳的红色,中心用金色颜料书写着四个巨大的韩文字符“백년해로”,寓意“百年偕老”。屏风的四个角落及顶部装饰有精致的粉色牡丹花刺绣,花朵错落有致,带有绿叶点缀。底部中央有一个圆形的金色刺绣边框,内嵌红色的“囍”字。屏风两侧由黑色的木质立柱支撑,柱头带有金色的圆球装饰,背景隐约可见木质的格栅窗棂,营造出一种古朴庄重的室内环境。 在 AI 生成的细节方面,存在一些明显的逻辑缺陷:首先,中间的韩文字符笔画显得过于厚重且边缘模糊,缺乏真实书法的力度感与连贯性;其次,底部的“囍”字结构略显扭曲,左右并不完全对称;此外,屏风边缘与两侧立柱的连接处显得生硬,缺乏真实的物理悬挂或固定逻辑,绸缎表面的光影折射与刺绣的立体感在细节处也显得不够自然。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像高质量地完成了提示词的全部核心要求:红色喜庆屏风、金色韩文「백년해로」书法、圆润饱满的字体以及韩式传统婚礼氛围均得到出色呈现。文字准确性是本次测试的核心考察点,图像表现优异,四字清晰可辨且字形正确。场景还原度超出预期,刺绣花卉、立柱、格子窗等细节元素极大丰富了画面的文化内涵。整体而言,这是一幅接近完美的生成结果,仅存在极小的细节瑕疵,综合表现优秀。 【GEMINI】这是一张视觉上非常精美、具有极高装饰性的图像,但在核心任务——韩文书法准确性上表现不佳。模型在处理复杂文字结构时,依然倾向于生成「看起来像文字」的图形,而非准确的文字。对于需要精准传达信息的场景,该模型尚需改进。 【KIMI】该图像在基础视觉呈现上具备一定完成度,但在核心要求「韩文准确性」上出现严重失误,字形错误导致文字难以辨识;同时文化元素的混杂(中韩符号混用)暴露了模型对韩式传统婚礼场景理解的浅薄。作为「韩式传统婚礼场景」的生成任务,此结果未能通过文化准确性检验,属于「形似而神不似」的典型AI生成缺陷。
进阶难度评测结果
- 得分:79.2 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中展示了一块充满传统喜庆氛围的红色屏风或挂幅,背景似乎是一个古朴的室内空间。挂幅主体为鲜艳的大红色,正中心用金色书法字体书写了四个韩文字符“백년해로”,寓意“百年偕老”。挂幅的四个角落装饰着精致的粉色和橙色牡丹花纹,并点缀着金色的云纹和圆形的“囍”字图案。左右两侧各有一根黑色的金属支撑杆。 在 AI 生成的细节方面,存在一些明显的逻辑缺陷:首先,画面最下方的圆形“囍”字图案中,文字结构发生了扭曲和重叠,并非标准的汉字形态;其次,金色韩文书法的笔触边缘显得有些模糊,且与布料纹理的融合不够自然,带有明显的数字涂抹感;最后,挂幅顶部的边缘线条不够平直,左右两侧的支撑杆在透视和光影表现上略显僵硬,缺乏真实物体的质感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像整体较好地完成了提示词的核心要求:红色喜庆屏风、金色韩文「백년해로」、传统花纹装饰均得到充分体现,文化氛围浓郁,构图合理。主要不足在于金色文字的金属闪烁质感未能完全实现,更接近厚涂金漆而非真正的金属光泽效果,这是与提示词明确要求存在偏差的核心问题。装饰元素和整体画面质量表现优秀,文字准确性良好。综合来看属于基本完成要求、有局部瑕疵的水准。 【GEMINI】该图像在氛围营造和材质表现上表现出色,但在核心的文字书写准确性上仍有提升空间。作为装饰性图像,其视觉效果良好,但若用于正式场合,文字结构的严谨性是必须解决的短板。 【KIMI】该图像在基础视觉呈现上及格,但在核心要求上存在明显短板。最致命的是「金属闪烁质感」的完全缺失——金色文字沦为普通渐变填充,这是材质表现的彻底失败。其次,「囍」字的文化误植暴露了模型对韩式/中式婚礼符号的混淆,属于不应出现的常识性错误。字形虽可辨识但书法骨力不足,装饰元素风格混杂。整体而言,模型完成了「有红色屏风、有韩文、有花纹」的表层要求,却未能实现提示词对质感、文化氛围的深层诉求,属于「形似神不似」的典型案例。
困难难度评测结果
- 得分:— 分
- 通过状态:未通过
模型生成产物
以下是该模型针对此任务的实际生成内容:
系统报错(阶段=模型生成; 模块=app.services.inference.call_text_model; provider=dashscope; model=qwen-image-2.0-pro):Rate limit exceeded after 5 retries
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【GEMINI】由于模型返回「图像生成失败」,未能执行任何视觉生成任务,因此所有维度均无法评估,评分为 0 分。 【CLAUDE】本次候选输出为「图像生成失败,无法评分」,模型未能生成任何图像内容,所有评分维度均得0分。任务要求生成一幅包含韩文书法、金属箔质感、丝绸底面光泽、传统韩式装饰纹样及婚礼场景景深的精致图像,但由于生成失败,上述所有功能要求均未得到满足。建议排查图像生成模块的故障原因,确保后续任务能够正常输出。 【KIMI】候选输出明确显示「图像生成失败,无法评分」,未产生任何实际图像内容。因此所有评分维度均无法进行评估,统一计为0分。该结果属于完全的生成失败案例,不具备任何可评分的视觉元素。
相关链接
您可以通过以下链接查看更多相关内容: