混元生图 3.0 在「静夜思诗意与行书书法融合生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:混元生图 3.0
- 用例名称:静夜思诗意与行书书法融合生成
- 测试类型:图像生成
- 评测维度:书法艺术表现
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一幅中国古典风格画面: - 画面中有一位身着唐代长袍的诗人立于窗前 - 窗外可见明亮的圆月 - 画面右侧以行书纵向书写李白的《静夜思》全诗(床前明月光,疑是地上霜。举头望明月,低头思故乡。) - 整体风格为中国水墨画风
任务要求
AI 模型需要满足以下要求:
- 画面中有身着唐代长袍的诗人形象
- 窗外有明亮的圆月
- 画面右侧有纵向排列的行书文字
- 书法内容为《静夜思》全诗,文字可辨认
- 整体呈现中国水墨画风格
评测结果
综合得分
该模型在此用例的得分为:63.0 分(满分 100 分),已通过
基础难度评测结果
- 得分:63.0 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展现了一幅具有中国传统水墨画风格的艺术作品。画面左侧,一位身着浅灰色宽大古装、头扎发髻的文人正侧身而立,他抬头仰望着窗外一轮硕大的明月,神情深沉且富有思索感。背景是古朴的木质窗框,窗外透出淡蓝色的夜空。画面右侧占据了约一半的空间,书写着三行黑色的毛笔书法文字,右下角还盖有一枚红色的方形印章。整体色调以灰、白、黑为主,辅以淡淡的蓝色,营造出一种宁静、怀旧的意境。 在 AI 生成的细节方面,存在明显的逻辑缺陷:首先是文字部分,虽然字迹模仿了书法形态,但大多是无法辨认的错字或臆造字,并不具备实际含义;其次,人物伸出的右手手指比例失调,指尖显得过于尖细且排列生硬;左侧窗框的木质纹理与结构在边缘处显得模糊且不连贯;此外,人物的发髻与头部的连接处也略显生硬,缺乏自然的毛发质感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图在人物场景还原和水墨风格方面表现尚可,诗人立于窗前望月的画面构建基本到位。然而,权重最高(40%)的「书法文字呈现」维度出现了致命性失败——右侧纵向文字完全不是《静夜思》原文,而是AI无法正确生成汉字所产生的乱码内容,这是本次测试最核心的考察点之一,却彻底落空。这一缺陷严重拉低了整体得分,也暴露出当前AI模型在中文书法文字生成方面的根本性短板。 【GEMINI】该图像在视觉氛围营造上表现尚可,但在核心任务——文字生成上表现极差。AI 无法准确输出指定诗词,导致作品失去了文化内涵的支撑。此外,人物细节处理上的解剖学错误也拉低了作品的专业度。 【KIMI】本图在视觉氛围上 superficially 接近中国水墨画,但核心任务——书写《静夜思》——彻底失败。右侧书法区域成为整幅画的「致命伤」:AI生成的伪汉字以假乱真地排列,对不熟悉中文的观众具有欺骗性,但对目标受众而言是不可接受的文本灾难。这种「形似神非」的生成结果,暴露了模型在中文文字生成上的根本缺陷。人物与场景虽可辨识,但无法弥补文字内容的完全偏离。建议重新生成时强制约束书法内容为真实诗句,或采用后期合成真实书法字帖。
进阶难度评测结果
- 得分:61.5 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展现了一幅具有中国传统水墨画风格的场景。画面左侧,一位身着浅灰色古装长袍、头挽发髻、留着长须的中年男子正倚窗而立,神情忧郁地望向窗外的夜色。窗外是一轮硕大圆润的明月,高悬在深蓝色的夜空中,月光洒在被白雪覆盖的平原和枯树上,营造出一种清冷寂寥的意境。画面右侧是一面斑驳的白墙,上面书写着三行黑色草书汉字。 在 AI 生成的细节方面,存在明显的逻辑和结构缺陷:最显著的是画面右侧的文字,虽然笔触模仿了书法,但字形扭曲,大多是无法辨认的“伪汉字”,缺乏实际含义。此外,男子的右手搭在窗台上,手指的线条模糊且比例略显不自然,与衣袖的衔接处也显得生硬。窗框的线条在左上角与树枝交汇处处理得不够细腻,存在透视上的轻微混乱。整幅画作色彩以灰、白、蓝为主,成功捕捉了古诗词中的愁思氛围,但细节经不起推敲。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在场景营造和人物塑造方面表现尚可,月色霜景的氛围渲染基本达标,人物造型符合唐代文人形象。然而,作为本次测试核心考察点的「书法质量与排版」维度出现严重失败——AI生成的书法文字内容与《静夜思》原文严重不符,大量字符变形错误,无法完整呈现全诗,这一致命缺陷直接拉低了整体评分。书法权重占40%,此维度的严重失分使整体表现大幅下滑,综合加权得分约为62分,属于「部分完成要求,有多处需要改进」的水平。 【GEMINI】这是一幅视觉意境极佳但核心功能缺失的作品。模型在绘画风格、氛围营造和人物造型上表现出色,展现了极高的审美水准;然而,在处理文字内容这一核心指令时表现极差,生成的乱码不仅无法阅读,更直接摧毁了画作作为“诗画合一”作品的艺术价值。 【KIMI】这幅作品在视觉表层呈现了中国画的形似,但在核心要求——书法文本的准确生成上遭遇灾难性失败。AI未能正确输出《静夜思》的文字内容,代之以不可辨识的乱码字符,这使得整幅作品的文化叙事功能完全崩塌。尽管场景氛围与人物形象有基本框架,但书法维度的38分严重拉低整体质量。对于「融合诗意意境与书法」的提示词目标,模型仅完成了不到一半的任务,属于典型的「形式模仿、内容失效」案例。建议优先改进文本生成模块的汉字结构准确性,以及书法与画面的有机融合算法。
相关链接
您可以通过以下链接查看更多相关内容: