doubao-seedream-5-0 在「自动铅笔手写体数学草稿纸生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:doubao-seedream-5-0
- 用例名称:自动铅笔手写体数学草稿纸生成
- 测试类型:图像生成
- 评测维度:书法艺术表现
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张数学草稿纸,上面用自动铅笔(0.5mm)书写了几行数学公式,线条纤细均匀,整体呈现铅笔手写的自然质感。
任务要求
AI 模型需要满足以下要求:
- 画面中有一张草稿纸
- 纸上有铅笔手写的数学公式
- 线条纤细,符合0.5mm铅笔的粗细特征
- 整体呈现手写感,非印刷体
- 画面清晰,内容可辨认
评测结果
综合得分
该模型在此用例的得分为:64.0 分(满分 100 分),已通过
基础难度评测结果
- 得分:64.0 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中是一张带有浅米色方格背景的电子草稿纸,上面用黑色手写体书写了几行数学微积分公式。构图简洁,文字居中偏左排列。内容涉及函数定义、导数、极限以及不定积分的计算。 然而,作为一张 AI 生成的图片,画面中存在明显的逻辑和书写缺陷。首先,最后一行不定积分的计算结果中,最后一项本应是「2e 的负 t 次方」,但 AI 将其错误地简化为了「2e」,且字母 e 的写法与前文不一致,显得扭曲变形。其次,倒数第二行的极限符号「lim」下方,趋于无穷大的符号书写模糊,看起来像两个重叠的圆圈。此外,整体手写笔触虽然模仿了真实感,但部分字母如「f」和「t」的连笔处显得生硬且不符合书写习惯,背景的方格线在文字边缘处有轻微的渲染不自然感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在草稿纸场景营造上有一定基础,方格纸质感和手写风格的整体协调性尚可。但核心问题在于:线条完全不符合0.5mm铅笔的特征——既无铅笔灰色调,又无石墨质感,粗细也明显偏大,更像钢笔书写。这是对提示词核心要求的根本性偏差。此外,最后一行数学公式存在书写混乱问题,影响内容准确性。综合来看,图像仅部分完成了提示词要求,铅笔质感的模拟是最大失分点。
进阶难度评测结果
- 得分:74.0 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张模拟手写笔记的近景照片,背景是带有浅灰色横格线的米白色纸张。画面中用黑色字迹书写了关于微积分中极限计算的数学推导过程,涉及正弦函数的泰勒级数展开。光线从右上方照射,在纸面左侧投下了柔和的阴影,营造出真实的纸质感。 然而,画面中存在明显的 AI 生成缺陷,主要体现在文字和逻辑的混乱。首先,中文书法风格虽然流畅,但出现了严重的错别字和生造字,例如「化简」被写成了「化输」,且部分汉字的笔画结构扭曲不自然。其次,数学公式的排版存在逻辑断层,第一行的极限符号(lim)与括号的位置关系显得生硬。最明显的错误在于第四行的分式,左侧括号内的分子与分母比例失调,且分母的数字「6」位置偏移,与分式线并未对齐。此外,纸张边缘的横格线在阴影处略显模糊,透视关系在细节处不够严谨。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】图像在内容混排合理性方面表现优秀,数学公式与中文注解的逻辑布局自然,内容正确可辨。线条质感基本达标但手写随机感略显不足。最大的缺陷在于石墨光泽还原——这是本次测试的核心考察点,图中铅笔线条完全缺乏石墨在侧光下的金属反光质感,侧光效果仅停留在纸面背景层面,未能渗透到笔迹本身,导致整体真实感大打折扣。
困难难度评测结果
- 得分:64.5 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张近距离拍摄的白色纸张,上面布满了手写的数学公式和中文注释。左上角露出一支银色金属质感的自动铅笔的一部分。纸上的内容涉及微积分,包括导数定义、定积分的线性性质以及单调有界定理等。字迹呈现黑色,排版略显拥挤,背景光线柔和,营造出一种学习笔记的氛围。然而,作为一张 AI 生成的图片,画面中存在明显的逻辑和书写缺陷:部分数学公式存在严重的计算错误(如 sin x 在 0 到 π 上的积分结果标注错误),中文汉字的笔画结构扭曲变形,部分字符看起来像是无意义的符号组合。此外,公式的排版逻辑混乱,多处出现重复的“令 x 趋向于 a”字样,且部分数学符号(如积分号和极限符号)的形态不规范,体现了 AI 在处理复杂文本和逻辑推导时的局限性。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图在内容层面(数学公式种类、中文注解混排)完成度尚可,但在光影与材质层面几乎完全失败。提示词的核心测试目标是「极细硬笔线条及石墨反光质感的模拟能力」,而图中既无侧光效果,又无石墨光泽,线条更像签字笔而非0.5mm铅笔,颗粒感和材质对比均缺失。此外涂改痕迹的缺失也使草稿真实感大打折扣。综合来看,图像在视觉质感还原方面与提示词要求存在较大差距,属于「内容框架完成但核心质感未达标」的情况。
相关链接
您可以通过以下链接查看更多相关内容: