qwen-image-2.0-pro 在「圆珠笔速写风格日记页生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:qwen-image-2.0-pro
  • 用例名称:圆珠笔速写风格日记页生成
  • 测试类型:图像生成
  • 评测维度:书法艺术表现

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张笔记本内页,上面用蓝色圆珠笔随意书写了一段日记内容,字迹潦草但自然。

任务要求

AI 模型需要满足以下要求:

  1. 画面中有清晰可辨的笔记本内页
  2. 文字使用蓝色圆珠笔书写风格
  3. 字迹呈现潦草、自然的手写感
  4. 整体画面清晰,构图合理

评测结果

综合得分

该模型在此用例的得分为:54.0 分(满分 100 分),未通过

基础难度评测结果

  • 得分:54.0 分
  • 通过状态:未通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一本摊开在木质桌面上的横线笔记本,镜头以俯视的特写角度聚焦在右侧页面。页面呈现柔和的米白色,上面有约十行用蓝色圆珠笔书写的英文手写体文字。这些文字看起来字迹工整、流畅,带有连笔,给人一种真实书写的错觉。背景的木纹桌面带有自然的棕色调,并伴有浅浅的景深虚化效果,使画面中心的手写内容更加突出。 然而,作为一张 AI 生成的图片,画面中存在明显的逻辑缺陷:页面上的文字虽然看起来像英文单词,但仔细辨认会发现它们全是无意义的字母组合,并非真实的语言,例如“Dryiaion”、“urchnge”等词汇。此外,部分横线与文字的交汇处显得不够自然,且笔记本左侧边缘的装订处细节模糊,缺乏真实的纸张厚度感和物理结构。整体构图虽然美观,但文字内容的荒诞揭示了其 AI 生成的本质。

图中展示了一本摊开在木质桌面上的横线笔记本,镜头以俯视的特写角度聚焦在右侧页面。页面呈现柔和的米白色,上面有约十行用蓝色圆珠笔书写的英文手写体文字。这些文字看起来字迹工整、流畅,带有连笔,给人一种真实书写的错觉。背景的木纹桌面带有自然的棕色调,并伴有浅浅的景深虚化效果,使画面中心的手写内容更加突出。

然而,作为一张 AI 生成的图片,画面中存在明显的逻辑缺陷:页面上的文字虽然看起来像英文单词,但仔细辨认会发现它们全是无意义的字母组合,并非真实的语言,例如“Dryiaion”、“urchnge”等词汇。此外,部分横线与文字的交汇处显得不够自然,且笔记本左侧边缘的装订处细节模糊,缺乏真实的纸张厚度感和物理结构。整体构图虽然美观,但文字内容的荒诞揭示了其 AI 生成的本质。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在场景构建层面完成了基本框架——笔记本内页、蓝色笔迹、横线格均有呈现,但在两个核心要求上存在严重失败:其一,文字内容为AI生成的无意义乱码,完全无法体现「日记内容」;其二,圆珠笔特有的油墨质感(积墨、断墨、透印)几乎为零,笔迹质感更接近数字字体而非真实圆珠笔。这两个问题直接导致图像无法完成提示词的核心测试目标——「测试模型对圆珠笔特有油墨质感的模拟能力」。

进阶难度评测结果

  • 得分:70.8 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一本米白色横格笔记本的近景特写,页面上写满了深蓝色的钢笔手写体文字。纸张质感柔和,背景带有淡淡的阴影,营造出一种真实书写的氛围。画面构图聚焦于纸张中心,字迹呈现出圆润的草书风格,墨水在纸上略有晕染。然而,这张图片存在明显的 AI 生成缺陷:首先,所有的英文单词均为无意义的乱码,字母组合逻辑混乱,无法拼读出真实的词汇;其次,文字的排列极不自然,部分字母相互重叠或断裂,墨水的晕染痕迹在某些地方显得突兀且不符合物理规律;此外,背景中隐约透出的背面字迹与正面文字完全无法对应,呈现出一种虚幻的重影感。整幅画面虽然模拟了手写的视觉美感,但内容完全丧失了语言逻辑。

图中展示了一本米白色横格笔记本的近景特写,页面上写满了深蓝色的钢笔手写体文字。纸张质感柔和,背景带有淡淡的阴影,营造出一种真实书写的氛围。画面构图聚焦于纸张中心,字迹呈现出圆润的草书风格,墨水在纸上略有晕染。然而,这张图片存在明显的 AI 生成缺陷:首先,所有的英文单词均为无意义的乱码,字母组合逻辑混乱,无法拼读出真实的词汇;其次,文字的排列极不自然,部分字母相互重叠或断裂,墨水的晕染痕迹在某些地方显得突兀且不符合物理规律;此外,背景中隐约透出的背面字迹与正面文字完全无法对应,呈现出一种虚幻的重影感。整幅画面虽然模拟了手写的视觉美感,但内容完全丧失了语言逻辑。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在纸张透印效果和整体构图质量上表现较好,具备一定的真实感。然而最核心的问题在于书写内容完全是无意义的乱码字母,而非提示词要求的「日记内容」,这是对提示词意图的根本性偏离。圆珠笔质感方面,积墨有所体现但断墨效果不足;手写自然度因内容问题和字形过于规整而大打折扣。综合来看,图像完成了部分技术性要求,但在内容语义层面存在重大缺陷。 【GEMINI】该图像在基础质感和光影表现上达到了一定水准,但在模拟圆珠笔书写细节和物理透印效果上显得力不从心。AI 痕迹较重,尤其是透印处理和油墨质感的物理属性模拟,未能达到专业摄影级别的真实感。 【KIMI】该图像在「看起来像手写笔记」的表层任务上勉强及格,但在提示词明确要求的细节执行上存在系统性缺陷。最严重的问题在于AI将「潦草」误解为「乱码」——真实的人类潦草书写仍遵循语言规律,而此图的字母组合完全随机;同时将「圆珠笔质感」简化为「蓝色墨水+末端黑点」,忽略了中段断墨这一关键特征。透印效果的平行对齐问题暴露了AI对三维物体(纸张双面)的空间理解不足。整体属于「概念正确、执行偏差」的典型案例,在严格评审下不应获得安全分。

困难难度评测结果

  • 得分:63.7 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一张近距离拍摄的笔记本页面,纸张呈现温暖的米白色,上面有浅灰色的横线。一支蓝色的圆珠笔斜放在笔记本的右上角,笔身带有透明质感和防滑握柄。画面构图采用了浅景深效果,焦点集中在纸张中央的几行深蓝色手写体文字上,笔迹显得略微凸起且带有墨水未干的亮泽感。然而,这张图片存在明显的 AI 生成缺陷:纸上的文字虽然看起来像英文,但实际上是由杂乱、无意义的字母拼凑而成的虚假单词,无法拼读或理解。此外,背景中的文字笔画模糊且扭曲,纸张边缘的纹理也显得有些不自然,呈现出一种逻辑混乱的视觉特征。

图中展示了一张近距离拍摄的笔记本页面,纸张呈现温暖的米白色,上面有浅灰色的横线。一支蓝色的圆珠笔斜放在笔记本的右上角,笔身带有透明质感和防滑握柄。画面构图采用了浅景深效果,焦点集中在纸张中央的几行深蓝色手写体文字上,笔迹显得略微凸起且带有墨水未干的亮泽感。然而,这张图片存在明显的 AI 生成缺陷:纸上的文字虽然看起来像英文,但实际上是由杂乱、无意义的字母拼凑而成的虚假单词,无法拼读或理解。此外,背景中的文字笔画模糊且扭曲,纸张边缘的纹理也显得有些不自然,呈现出一种逻辑混乱的视觉特征。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在整体场景构建和光影氛围上表现尚可,但在提示词最核心的技术要求上存在明显不足。圆珠笔特有的断墨细节完全缺失,积墨点呈现失真(过于夸张且缺乏光泽),最关键的纸张透印效果完全未能实现。这三项均为提示词明确要求的核心细节,缺失程度较为严重。图像整体更像是对钢笔书写场景的模拟,而非圆珠笔的精细质感再现。构图和场景完整性是相对较强的维度,但核心油墨细节的失败拉低了整体评分。 【GEMINI】该图像在构图和基础光影氛围上表现合格,但在微观细节的模拟上未能达到专业摄影级的真实感。最核心的失分点在于完全忽略了「透印」这一关键提示,且圆珠笔笔迹的质感过于单一,缺乏书写工具的物理特性,导致图像看起来更像是一张精美的数字插画而非真实的摄影作品。 【KIMI】这是一张在核心要求上严重失败的AI生成图像。模型未能理解「日记内容」意味着可读的、有意义的文字,输出了一堆形似英文的字符垃圾;同时完全遗漏了「断墨」这一圆珠笔最关键的特征,透印效果也沦为简单的蓝色雾气。尽管光影和构图有基本框架,但油墨质感与纸张物理的双重失真,使图像在专业审视下不堪一击。评分需严厉以拉开模型差距——完成提示词不是可选项。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...