doubao-seedream-5-0 在「自动铅笔手写体数学草稿纸生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：doubao-seedream-5-0
用例名称：自动铅笔手写体数学草稿纸生成
测试类型：图像生成
评测维度：书法艺术表现

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一张数学草稿纸，上面用自动铅笔（0.5mm）书写了几行数学公式，线条纤细均匀，整体呈现铅笔手写的自然质感。

任务要求

AI 模型需要满足以下要求：

画面中有一张草稿纸
纸上有铅笔手写的数学公式
线条纤细，符合0.5mm铅笔的粗细特征
整体呈现手写感，非印刷体
画面清晰，内容可辨认

评测结果

综合得分

该模型在此用例的得分为：64.0 分（满分 100 分），已通过

基础难度评测结果

得分：64.0 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

画面中是一张带有浅米色方格背景的电子草稿纸，上面用黑色手写体书写了几行数学微积分公式。构图简洁，文字居中偏左排列。内容涉及函数定义、导数、极限以及不定积分的计算。然而，作为一张 AI 生成的图片，画面中存在明显的逻辑和书写缺陷。首先，最后一行不定积分的计算结果中，最后一项本应是「2e 的负 t 次方」，但 AI 将其错误地简化为了「2e」，且字母 e 的写法与前文不一致，显得扭曲变形。其次，倒数第二行的极限符号「lim」下方，趋于无穷大的符号书写模糊，看起来像两个重叠的圆圈。此外，整体手写笔触虽然模仿了真实感，但部分字母如「f」和「t」的连笔处显得生硬且不符合书写习惯，背景的方格线在文字边缘处有轻微的渲染不自然感。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像在草稿纸场景营造上有一定基础，方格纸质感和手写风格的整体协调性尚可。但核心问题在于：线条完全不符合0.5mm铅笔的特征——既无铅笔灰色调，又无石墨质感，粗细也明显偏大，更像钢笔书写。这是对提示词核心要求的根本性偏差。此外，最后一行数学公式存在书写混乱问题，影响内容准确性。综合来看，图像仅部分完成了提示词要求，铅笔质感的模拟是最大失分点。

进阶难度评测结果

得分：74.0 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一张模拟手写笔记的近景照片，背景是带有浅灰色横格线的米白色纸张。画面中用黑色字迹书写了关于微积分中极限计算的数学推导过程，涉及正弦函数的泰勒级数展开。光线从右上方照射，在纸面左侧投下了柔和的阴影，营造出真实的纸质感。然而，画面中存在明显的 AI 生成缺陷，主要体现在文字和逻辑的混乱。首先，中文书法风格虽然流畅，但出现了严重的错别字和生造字，例如「化简」被写成了「化输」，且部分汉字的笔画结构扭曲不自然。其次，数学公式的排版存在逻辑断层，第一行的极限符号（lim）与括号的位置关系显得生硬。最明显的错误在于第四行的分式，左侧括号内的分子与分母比例失调，且分母的数字「6」位置偏移，与分式线并未对齐。此外，纸张边缘的横格线在阴影处略显模糊，透视关系在细节处不够严谨。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】图像在内容混排合理性方面表现优秀，数学公式与中文注解的逻辑布局自然，内容正确可辨。线条质感基本达标但手写随机感略显不足。最大的缺陷在于石墨光泽还原——这是本次测试的核心考察点，图中铅笔线条完全缺乏石墨在侧光下的金属反光质感，侧光效果仅停留在纸面背景层面，未能渗透到笔迹本身，导致整体真实感大打折扣。

困难难度评测结果

得分：64.5 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一张近距离拍摄的白色纸张，上面布满了手写的数学公式和中文注释。左上角露出一支银色金属质感的自动铅笔的一部分。纸上的内容涉及微积分，包括导数定义、定积分的线性性质以及单调有界定理等。字迹呈现黑色，排版略显拥挤，背景光线柔和，营造出一种学习笔记的氛围。然而，作为一张 AI 生成的图片，画面中存在明显的逻辑和书写缺陷：部分数学公式存在严重的计算错误（如 sin x 在 0 到 π 上的积分结果标注错误），中文汉字的笔画结构扭曲变形，部分字符看起来像是无意义的符号组合。此外，公式的排版逻辑混乱，多处出现重复的“令 x 趋向于 a”字样，且部分数学符号（如积分号和极限符号）的形态不规范，体现了 AI 在处理复杂文本和逻辑推导时的局限性。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图在内容层面（数学公式种类、中文注解混排）完成度尚可，但在光影与材质层面几乎完全失败。提示词的核心测试目标是「极细硬笔线条及石墨反光质感的模拟能力」，而图中既无侧光效果，又无石墨光泽，线条更像签字笔而非0.5mm铅笔，颗粒感和材质对比均缺失。此外涂改痕迹的缺失也使草稿真实感大打折扣。综合来看，图像在视觉质感还原方面与提示词要求存在较大差距，属于「内容框架完成但核心质感未达标」的情况。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

进阶难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

困难难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

相关链接

反馈评测问题