qwen-image-2.0 在「竹林竹简隶书场景生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:qwen-image-2.0
  • 用例名称:竹林竹简隶书场景生成
  • 测试类型:图像生成
  • 评测维度:书法艺术表现

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一片翠绿幽深的竹林场景,林间有一张石桌,桌上展开一卷竹简,竹简上以隶书书写「深林人不知,明月来相照」。

任务要求

AI 模型需要满足以下要求:

  1. 画面中有翠绿的竹林背景
  2. 林间有一张石桌
  3. 石桌上有展开的竹简
  4. 竹简上有「深林人不知,明月来相照」文字
  5. 文字字形具备隶书基本特征

评测结果

综合得分

该模型在此用例的得分为:82.8 分(满分 100 分),已通过

基础难度评测结果

  • 得分:82.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展现了一幅宁静的竹林景观。画面前景是一个粗糙的灰色石台,台上平铺着一副展开的黄色竹简,竹简两端卷起,上面用黑色隶书写着王维的诗句“深林人不知,明月来相照”。背景是茂密翠绿的竹林,阳光从竹叶缝隙间洒下,形成明亮的斑驳光影,林间有一条蜿蜒的小径向深处延伸,整体色调以清新的绿色和温暖的木色为主。在 AI 生成的细节方面,存在明显的逻辑缺陷:首先,竹简上的文字是横向排列的,这不符合古代竹简纵向书写的传统习惯;其次,文字像是直接悬浮或粘贴在竹片表面,没有随竹片的凹凸起伏产生自然的透视或形变;最后,背景中部分竹子的生长方向略显杂乱,石台边缘的纹理处理也显得有些生硬,缺乏真实的厚重感。

图中展现了一幅宁静的竹林景观。画面前景是一个粗糙的灰色石台,台上平铺着一副展开的黄色竹简,竹简两端卷起,上面用黑色隶书写着王维的诗句“深林人不知,明月来相照”。背景是茂密翠绿的竹林,阳光从竹叶缝隙间洒下,形成明亮的斑驳光影,林间有一条蜿蜒的小径向深处延伸,整体色调以清新的绿色和温暖的木色为主。在 AI 生成的细节方面,存在明显的逻辑缺陷:首先,竹简上的文字是横向排列的,这不符合古代竹简纵向书写的传统习惯;其次,文字像是直接悬浮或粘贴在竹片表面,没有随竹片的凹凸起伏产生自然的透视或形变;最后,背景中部分竹子的生长方向略显杂乱,石台边缘的纹理处理也显得有些生硬,缺乏真实的厚重感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在场景还原度和画面质量方面表现优秀,竹林、石桌、竹简三大元素完整呈现,氛围营造到位,整体视觉效果精良。文字内容完全正确是重要亮点。核心不足在于书体呈现:提示词明确要求「隶书」,但图中文字明显为楷书或行楷风格,缺乏隶书特有的扁平字形和蚕头雁尾笔画特征,这是最主要的扣分项。综合来看,图像完成度较高,但书体识别与呈现的精准度有待提升。 【GEMINI】这是一张完成度很高的 AI 生成图像,场景构建能力极强,但在特定艺术风格(隶书)的精准表达上仍有欠缺。模型目前仅实现了文字的「字面正确」,未能理解「隶书」这一书法风格的视觉逻辑。 【KIMI】该图像基本完成了提示词的核心要求,但在书法字形的专业性上存在明显短板——隶书的关键笔法特征缺失,这是AI生成文字内容的典型软肋。竹简与石桌的物理质感也有提升空间。综合而言,作为意境图合格,作为书法与传统器物展示则不够严谨。

进阶难度评测结果

  • 得分:70.3 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一个宁静的竹林场景。画面前景是一块粗糙的灰色石台,台上平铺着一副展开的竹简。竹简色泽金黄,上面刻有两行黑色的简体中文字符,内容为王维的诗句“深林人不知,明月来相照”。背景是茂密的翠绿竹林,阳光穿过竹叶缝隙,在地面和竹简上洒下斑驳的光影,营造出一种清幽的意境。构图采用中心对称,视线从前景的竹简延伸至远方模糊的林间小径。 在 AI 生成的细节方面,存在明显的逻辑错误:首先,竹简上的文字出现了严重的拼写和笔画错误,第一句本应是“深林人不知”,图中却误写成了“探林人不知”,且“探”字的笔画结构扭曲;其次,竹简的构造不符合物理常识,左右两端的卷轴部分呈现出不自然的螺旋状堆叠,且竹片的连接处显得模糊生硬;最后,背景中部分竹竿的生长方向和粗细变化略显突兀,缺乏真实的透视感。

图中展示了一个宁静的竹林场景。画面前景是一块粗糙的灰色石台,台上平铺着一副展开的竹简。竹简色泽金黄,上面刻有两行黑色的简体中文字符,内容为王维的诗句“深林人不知,明月来相照”。背景是茂密的翠绿竹林,阳光穿过竹叶缝隙,在地面和竹简上洒下斑驳的光影,营造出一种清幽的意境。构图采用中心对称,视线从前景的竹简延伸至远方模糊的林间小径。

在 AI 生成的细节方面,存在明显的逻辑错误:首先,竹简上的文字出现了严重的拼写和笔画错误,第一句本应是“深林人不知”,图中却误写成了“探林人不知”,且“探”字的笔画结构扭曲;其次,竹简的构造不符合物理常识,左右两端的卷轴部分呈现出不自然的螺旋状堆叠,且竹片的连接处显得模糊生硬;最后,背景中部分竹竿的生长方向和粗细变化略显突兀,缺乏真实的透视感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在场景营造和道具设计上表现较好,竹林幽深氛围到位,竹简造型精致,文字内容完整无误。但核心失分点在于文字字形——提示词明确要求隶书「蚕头燕尾、字形扁平」,而图中文字明显缺乏这些书法特征,更接近楷书或印刷体风格,这是最主要的缺陷。此外石桌光斑效果也未达到提示词要求。综合来看,场景部分完成较好,但书法字形这一核心考察点未能达标。 【GEMINI】图像在场景氛围的营造上表现出色,成功捕捉了幽深竹林的意境。然而,作为核心要求的文字部分表现糟糕,不仅内容出现错别字,且书法特征未能达到隶书的基本要求。文字与竹简的融合度也未能达到专业视觉设计的标准,导致整体作品在细节上显得粗糙。 【KIMI】本图在场景氛围营造上达到基本可用水平,但在最核心的「隶书书法」要求上遭遇严重失败——字体特征与提示词要求完全背离,且存在明显的文字结构错误。作为以「竹简书法」为核心卖点的图像,文字维度的崩塌使其整体价值大幅折损。建议模型加强对中国传统书法字形结构的学习,特别是隶书波磔笔法的形态记忆,同时改善文字与载体的物理融合效果。

困难难度评测结果

  • 得分:70.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展现了一个静谧的深夜竹林场景。画面前景是一张粗糙的青灰色石台,台上平铺着一幅展开的棕褐色竹简,竹简上刻有两行黑色的简体中文字:“深林人不知,明月来相照”。背景是密集的翠绿竹林,一条幽深的小径向远处延伸。天空中悬挂着一轮圆润明亮的满月,散发出清冷的白光,照亮了竹叶的边缘。构图采用中心对称视角,营造出一种宁静的古风意境。 在 AI 生成细节方面,画面存在明显的逻辑与文字缺陷:竹简上的文字排列并不符合古代竹简从右向左、单行单列的书写习惯,且文字跨越了竹片的缝隙,显得不够自然;竹简右侧的卷轴部分结构模糊,纹理衔接生硬;此外,背景中月亮周围的光晕处理较为简单,与竹林间的光影投射关系略显违和,缺乏真实的光学透视感。

图中展现了一个静谧的深夜竹林场景。画面前景是一张粗糙的青灰色石台,台上平铺着一幅展开的棕褐色竹简,竹简上刻有两行黑色的简体中文字:“深林人不知,明月来相照”。背景是密集的翠绿竹林,一条幽深的小径向远处延伸。天空中悬挂着一轮圆润明亮的满月,散发出清冷的白光,照亮了竹叶的边缘。构图采用中心对称视角,营造出一种宁静的古风意境。

在 AI 生成细节方面,画面存在明显的逻辑与文字缺陷:竹简上的文字排列并不符合古代竹简从右向左、单行单列的书写习惯,且文字跨越了竹片的缝隙,显得不够自然;竹简右侧的卷轴部分结构模糊,纹理衔接生硬;此外,背景中月亮周围的光晕处理较为简单,与竹林间的光影投射关系略显违和,缺乏真实的光学透视感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在场景氛围营造和构图方面表现出色,竹林月夜的意境较为到位,竹简材质细节也较为精良。然而最核心的文字呈现存在严重缺陷——竹简上的诗句字序错乱,且隶书特征不够明显,这是本次测试最关键的失分点。月光在竹简上的银白光晕和文字光泽感也未能充分体现。综合来看,场景生成能力较强,但文字内容的准确性和书法字体特征的精准呈现是明显短板。 【GEMINI】这是一张典型的「远看有氛围,近看全是坑」的 AI 生成图。画面整体氛围和构图达到了及格线以上,但作为核心要求的「书法文字」完全失败,不仅内容错误,且笔画结构呈现出明显的 AI 乱码特征,这在专业视觉设计中是不可接受的硬伤。 【KIMI】本图作为AI生成图像,在场景氛围的表层营造上具备一定完成度,但在核心要求——隶书书法的文字准确性、字形特征与光泽表现上存在严重缺陷。文字内容的结构错误与书体特征的完全缺失,使其无法满足「测试模型对隶书书法文字视觉呈现能力」的测试目标。月光意境因背景过亮、冷暖分离而流于表面,整体更接近文化主题的摄影布景而非诗意图景的沉浸体验。建议分数区间:60-70分,主要扣分点集中于文字维度。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...