Google: Gemini 2.5 Flash Image (Nano Banana) 在「自动铅笔手写体数学草稿纸生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:Google: Gemini 2.5 Flash Image (Nano Banana)
  • 用例名称:自动铅笔手写体数学草稿纸生成
  • 测试类型:图像生成
  • 评测维度:书法艺术表现

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

生成一张数学草稿纸,上面用自动铅笔(0.5mm)书写了几行数学公式,线条纤细均匀,整体呈现铅笔手写的自然质感。

任务要求

AI 模型需要满足以下要求:

  1. 画面中有一张草稿纸
  2. 纸上有铅笔手写的数学公式
  3. 线条纤细,符合0.5mm铅笔的粗细特征
  4. 整体呈现手写感,非印刷体
  5. 画面清晰,内容可辨认

评测结果

综合得分

该模型在此用例的得分为:72.67 分(满分 100 分),已通过

基础难度评测结果

  • 得分:72.67 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一张带有蓝色细格纹的淡黄色纸张,纸面上有明显的折痕和不平整的纹理。纸上用黑色手写体书写着标题“Calculus II Notes”(微积分2笔记),下方排列着几行数学公式。这些公式试图模仿多元微积分的内容,涉及极坐标变换、散度定理等概念,但存在明显的 AI 生成缺陷。 画面中的数学符号逻辑混乱且书写畸形:积分符号(∫)被错误地绘制成了类似字母“J”或“f”的重叠形状;希腊字母 phi (φ) 的书写不规范;部分公式中出现了意义不明的箭头和长横线。最底部的散度定理公式中,原本应为积分号的部分被画成了带有箭头的奇怪弧线,且字母排列拥挤。右侧纸张空白处还随机漂浮着几个孤立的数学符号,如 Sigma (Σ) 和 Delta (Δ),与主内容缺乏逻辑联系。整体构图虽然模拟了真实笔记的随性感,但符号的结构性错误揭示了其 AI 生成的本质。

图中展示了一张带有蓝色细格纹的淡黄色纸张,纸面上有明显的折痕和不平整的纹理。纸上用黑色手写体书写着标题“Calculus II Notes”(微积分2笔记),下方排列着几行数学公式。这些公式试图模仿多元微积分的内容,涉及极坐标变换、散度定理等概念,但存在明显的 AI 生成缺陷。

画面中的数学符号逻辑混乱且书写畸形:积分符号(∫)被错误地绘制成了类似字母“J”或“f”的重叠形状;希腊字母 phi (φ) 的书写不规范;部分公式中出现了意义不明的箭头和长横线。最底部的散度定理公式中,原本应为积分号的部分被画成了带有箭头的奇怪弧线,且字母排列拥挤。右侧纸张空白处还随机漂浮着几个孤立的数学符号,如 Sigma (Σ) 和 Delta (Δ),与主内容缺乏逻辑联系。整体构图虽然模拟了真实笔记的随性感,但符号的结构性错误揭示了其 AI 生成的本质。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像基本完成了草稿纸手写数学公式的场景构建,纸张质感和手写风格有一定真实感。但核心问题在于线条质感未能准确还原0.5mm自动铅笔的特征——线条偏粗偏黑,缺乏铅笔特有的灰色石墨质感。此外,数学公式内容存在多处书写错误和不完整之处,影响内容准确性评分。整体而言,场景氛围营造尚可,但在提示词最核心的「铅笔线条质感」这一要求上表现不足。

进阶难度评测结果

  • 得分:63.2 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

画面中展示了一个学习或办公的近景桌面。主体是一张带有浅色方格的米黄色纸张,纸面布满了明显的褶皱,上面有用黑色水笔书写的文字、数学公式和坐标系草图。背景中,左上方有一本翻开的厚书,右上方露出了计算器的一部分按键。整体色调偏暖,光线柔和,营造出一种勤奋钻研的氛围。 然而,这张图片存在明显的 AI 生成缺陷。首先,纸上的文字虽然看起来像汉字,但大多是无法辨认的“伪汉字”,结构扭曲且没有实际意义,例如“导粉”、“现记力”等词组显得生造且逻辑不通。其次,数学公式的逻辑完全错误,括号嵌套异常,坐标轴上的标注也模糊不清。此外,背景中书本的文字呈现为模糊的线条,计算器的按键布局和边缘线条也显得不够严谨。这些细节揭示了画面是由人工智能模拟生成的,而非真实拍摄。

画面中展示了一个学习或办公的近景桌面。主体是一张带有浅色方格的米黄色纸张,纸面布满了明显的褶皱,上面有用黑色水笔书写的文字、数学公式和坐标系草图。背景中,左上方有一本翻开的厚书,右上方露出了计算器的一部分按键。整体色调偏暖,光线柔和,营造出一种勤奋钻研的氛围。

然而,这张图片存在明显的 AI 生成缺陷。首先,纸上的文字虽然看起来像汉字,但大多是无法辨认的“伪汉字”,结构扭曲且没有实际意义,例如“导粉”、“现记力”等词组显得生造且逻辑不通。其次,数学公式的逻辑完全错误,括号嵌套异常,坐标轴上的标注也模糊不清。此外,背景中书本的文字呈现为模糊的线条,计算器的按键布局和边缘线条也显得不够严谨。这些细节揭示了画面是由人工智能模拟生成的,而非真实拍摄。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像基本完成了草稿纸场景的还原,侧光照明和手写混排内容均有较好表现。主要短板在于石墨金属光泽的模拟——这是本次测试的核心考察点之一,铅笔线条在侧光下应有的石墨反光特征未能有效呈现,仅停留在普通铅笔线条的视觉效果层面。此外,强光遮挡部分内容也是一个明显瑕疵。整体属于基本完成要求但核心质感还原有明显不足的水平。 【GEMINI】该图像在视觉氛围(纸张与光影)上达到了一定水准,但在核心的「书写内容」与「书写质感」上表现糟糕。作为数学草稿纸,其文字与公式的不可读性使其完全失去了实用价值,且线条质感未能达到0.5mm铅笔的真实细腻度。 【KIMI】本图像在核心测试目标——极细硬笔线条及石墨反光质感——上表现失败。线条质感维度,0.5mm铅笔的纤细均匀被粗细分化、锯齿断裂取代;石墨光泽维度,侧光仅作用于纸张阴影而非笔画本身,完全未实现「灰色金属光泽」这一关键光学特征;内容混排维度,中文错字与无意义公式暴露了AI对书写语义的理解缺失。方格纸底纹虽有一定真实感,但无法弥补主体书写内容的系统性缺陷。

困难难度评测结果

  • 得分:68.5 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一张模拟手写数学笔记的纸张,右上角斜放着一支蓝色的自动铅笔。纸上布满了密密麻麻的数学公式,包括极限符号、根号、分式以及一些中文字符。整体色调为柔和的米白色,光线从右侧投射,在铅笔下方留下了清晰的阴影。 然而,画面中存在非常明显的 AI 生成缺陷。首先,文字内容完全不符合逻辑:中文字符大多是无意义的“伪汉字”或错别字,例如反复出现的“旋惜法状型”和“印诵有租星定理”,字形扭曲且无法解读。其次,数学公式逻辑混乱,极限符号“lim”被错误地拼写为“lix”或“lid”,希腊字母 epsilon(ε)的写法也极不规范。此外,部分公式的横线与根号连接处出现了断裂或重叠的透视异常,纸张中间还有一处模糊的灰色涂改痕迹,看起来像是未处理好的像素色块,这些都揭示了图片是由 AI 拼凑生成的虚假场景。

图中展示了一张模拟手写数学笔记的纸张,右上角斜放着一支蓝色的自动铅笔。纸上布满了密密麻麻的数学公式,包括极限符号、根号、分式以及一些中文字符。整体色调为柔和的米白色,光线从右侧投射,在铅笔下方留下了清晰的阴影。

然而,画面中存在非常明显的 AI 生成缺陷。首先,文字内容完全不符合逻辑:中文字符大多是无意义的“伪汉字”或错别字,例如反复出现的“旋惜法状型”和“印诵有租星定理”,字形扭曲且无法解读。其次,数学公式逻辑混乱,极限符号“lim”被错误地拼写为“lix”或“lid”,希腊字母 epsilon(ε)的写法也极不规范。此外,部分公式的横线与根号连接处出现了断裂或重叠的透视异常,纸张中间还有一处模糊的灰色涂改痕迹,看起来像是未处理好的像素色块,这些都揭示了图片是由 AI 拼凑生成的虚假场景。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该图像在场景构图和内容密度方面基本达标,铅笔笔杆的融入是一个明显亮点。然而,提示词的核心测试目标——「极细硬笔线条及石墨反光质感的模拟能力」——几乎完全失败:强侧光效果缺失、石墨金属光泽不存在、纸张纹理不可见、石墨颗粒感缺失,这四项均是提示词明确要求的关键视觉特征,却无一实现。此外,部分数学公式内容存在逻辑混乱,涂改痕迹也基本缺失。综合来看,图像仅完成了「形似」(有字、有笔、有纸),而未能完成「质似」(光影、材质、颗粒感),与提示词的核心测试意图存在较大偏差。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...