Google: Gemini 2.5 Flash Image (Nano Banana) 在「自动铅笔手写体数学草稿纸生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：Google: Gemini 2.5 Flash Image (Nano Banana)
用例名称：自动铅笔手写体数学草稿纸生成
测试类型：图像生成
评测维度：书法艺术表现

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一张数学草稿纸，上面用自动铅笔（0.5mm）书写了几行数学公式，线条纤细均匀，整体呈现铅笔手写的自然质感。

任务要求

AI 模型需要满足以下要求：

画面中有一张草稿纸
纸上有铅笔手写的数学公式
线条纤细，符合0.5mm铅笔的粗细特征
整体呈现手写感，非印刷体
画面清晰，内容可辨认

评测结果

综合得分

该模型在此用例的得分为：72.67 分（满分 100 分），已通过

基础难度评测结果

得分：72.67 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一张带有蓝色细格纹的淡黄色纸张，纸面上有明显的折痕和不平整的纹理。纸上用黑色手写体书写着标题“Calculus II Notes”（微积分2笔记），下方排列着几行数学公式。这些公式试图模仿多元微积分的内容，涉及极坐标变换、散度定理等概念，但存在明显的 AI 生成缺陷。画面中的数学符号逻辑混乱且书写畸形：积分符号（∫）被错误地绘制成了类似字母“J”或“f”的重叠形状；希腊字母 phi (φ) 的书写不规范；部分公式中出现了意义不明的箭头和长横线。最底部的散度定理公式中，原本应为积分号的部分被画成了带有箭头的奇怪弧线，且字母排列拥挤。右侧纸张空白处还随机漂浮着几个孤立的数学符号，如 Sigma (Σ) 和 Delta (Δ)，与主内容缺乏逻辑联系。整体构图虽然模拟了真实笔记的随性感，但符号的结构性错误揭示了其 AI 生成的本质。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像基本完成了草稿纸手写数学公式的场景构建，纸张质感和手写风格有一定真实感。但核心问题在于线条质感未能准确还原0.5mm自动铅笔的特征——线条偏粗偏黑，缺乏铅笔特有的灰色石墨质感。此外，数学公式内容存在多处书写错误和不完整之处，影响内容准确性评分。整体而言，场景氛围营造尚可，但在提示词最核心的「铅笔线条质感」这一要求上表现不足。

进阶难度评测结果

得分：63.2 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

画面中展示了一个学习或办公的近景桌面。主体是一张带有浅色方格的米黄色纸张，纸面布满了明显的褶皱，上面有用黑色水笔书写的文字、数学公式和坐标系草图。背景中，左上方有一本翻开的厚书，右上方露出了计算器的一部分按键。整体色调偏暖，光线柔和，营造出一种勤奋钻研的氛围。然而，这张图片存在明显的 AI 生成缺陷。首先，纸上的文字虽然看起来像汉字，但大多是无法辨认的“伪汉字”，结构扭曲且没有实际意义，例如“导粉”、“现记力”等词组显得生造且逻辑不通。其次，数学公式的逻辑完全错误，括号嵌套异常，坐标轴上的标注也模糊不清。此外，背景中书本的文字呈现为模糊的线条，计算器的按键布局和边缘线条也显得不够严谨。这些细节揭示了画面是由人工智能模拟生成的，而非真实拍摄。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像基本完成了草稿纸场景的还原，侧光照明和手写混排内容均有较好表现。主要短板在于石墨金属光泽的模拟——这是本次测试的核心考察点之一，铅笔线条在侧光下应有的石墨反光特征未能有效呈现，仅停留在普通铅笔线条的视觉效果层面。此外，强光遮挡部分内容也是一个明显瑕疵。整体属于基本完成要求但核心质感还原有明显不足的水平。【GEMINI】该图像在视觉氛围（纸张与光影）上达到了一定水准，但在核心的「书写内容」与「书写质感」上表现糟糕。作为数学草稿纸，其文字与公式的不可读性使其完全失去了实用价值，且线条质感未能达到0.5mm铅笔的真实细腻度。【KIMI】本图像在核心测试目标——极细硬笔线条及石墨反光质感——上表现失败。线条质感维度，0.5mm铅笔的纤细均匀被粗细分化、锯齿断裂取代；石墨光泽维度，侧光仅作用于纸张阴影而非笔画本身，完全未实现「灰色金属光泽」这一关键光学特征；内容混排维度，中文错字与无意义公式暴露了AI对书写语义的理解缺失。方格纸底纹虽有一定真实感，但无法弥补主体书写内容的系统性缺陷。

困难难度评测结果

得分：68.5 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一张模拟手写数学笔记的纸张，右上角斜放着一支蓝色的自动铅笔。纸上布满了密密麻麻的数学公式，包括极限符号、根号、分式以及一些中文字符。整体色调为柔和的米白色，光线从右侧投射，在铅笔下方留下了清晰的阴影。然而，画面中存在非常明显的 AI 生成缺陷。首先，文字内容完全不符合逻辑：中文字符大多是无意义的“伪汉字”或错别字，例如反复出现的“旋惜法状型”和“印诵有租星定理”，字形扭曲且无法解读。其次，数学公式逻辑混乱，极限符号“lim”被错误地拼写为“lix”或“lid”，希腊字母 epsilon（ε）的写法也极不规范。此外，部分公式的横线与根号连接处出现了断裂或重叠的透视异常，纸张中间还有一处模糊的灰色涂改痕迹，看起来像是未处理好的像素色块，这些都揭示了图片是由 AI 拼凑生成的虚假场景。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像在场景构图和内容密度方面基本达标，铅笔笔杆的融入是一个明显亮点。然而，提示词的核心测试目标——「极细硬笔线条及石墨反光质感的模拟能力」——几乎完全失败：强侧光效果缺失、石墨金属光泽不存在、纸张纹理不可见、石墨颗粒感缺失，这四项均是提示词明确要求的关键视觉特征，却无一实现。此外，部分数学公式内容存在逻辑混乱，涂改痕迹也基本缺失。综合来看，图像仅完成了「形似」（有字、有笔、有纸），而未能完成「质似」（光影、材质、颗粒感），与提示词的核心测试意图存在较大偏差。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

进阶难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

困难难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

相关链接

反馈评测问题