Google: Nano Banana Pro (Gemini 3 Pro Image Preview) 在「卡通风格」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:Google: Nano Banana Pro (Gemini 3 Pro Image Preview)
  • 用例名称:卡通风格
  • 测试类型:图像生成
  • 评测维度:风格还原

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

用卡通风格绘制一个微笑的太阳,圆形的脸部,简单的五官由黑色线条构成,周围有8-10条放射状的光芒,整体使用明亮的黄色和橙色,背景是纯净的天蓝色,风格类似儿童简笔画。

任务要求

AI 模型需要满足以下要求:

  1. 图像必须呈现卡通/儿童简笔画风格,线条简洁夸张,不得出现写实光影、精细纹理或半写实元素
  2. 太阳必须具有清晰的圆形脸部轮廓,面部五官(眼睛、嘴巴等)由简洁的黑色线条构成,且表情为明确的微笑
  3. 太阳周围须有放射状均匀分布的光芒,数量应在8-10条之间(允许±1条的视觉误差)
  4. 太阳主体色彩以明亮黄色和橙色为主,背景须为纯净天蓝色,整体色彩鲜艳饱和,符合儿童插画配色风格
  5. 画面不得出现文字水印、UI元素或与卡通太阳主题无关的额外物体,背景保持简洁纯净

评测结果

综合得分

该模型在此用例的得分为:83.6 分(满分 100 分),已通过

基础难度评测结果

  • 得分:83.6 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展示了一幅模仿儿童蜡笔画风格的简笔画,背景是纯净的明亮天蓝色。画面中心是一个巨大的圆形太阳,由明黄色和橙色的笔触涂抹而成,中心带有一张可爱的笑脸:两条弯弯的黑色弧线代表闭上的眼睛,中间一个小黑点是鼻子,下方是一道宽宽的向上扬起的黑色弧线,代表灿烂的笑容,脸颊两侧还有两团橙色的红晕。太阳周围发散出十条波浪状的光芒,每条光芒都由黄、橙两色线条交织组成。作为一张 AI 生成的图片,其缺陷主要体现在光芒的分布上:虽然整体呈放射状,但光芒的长短和弯曲弧度缺乏自然的对称性,部分线条的末端出现了不自然的断裂或重叠。此外,太阳圆形的边缘线条略显杂乱,笔触的质感在某些区域显得过于平滑,失去了真实蜡笔画那种随机的颗粒感。

图中展示了一幅模仿儿童蜡笔画风格的简笔画,背景是纯净的明亮天蓝色。画面中心是一个巨大的圆形太阳,由明黄色和橙色的笔触涂抹而成,中心带有一张可爱的笑脸:两条弯弯的黑色弧线代表闭上的眼睛,中间一个小黑点是鼻子,下方是一道宽宽的向上扬起的黑色弧线,代表灿烂的笑容,脸颊两侧还有两团橙色的红晕。太阳周围发散出十条波浪状的光芒,每条光芒都由黄、橙两色线条交织组成。作为一张 AI 生成的图片,其缺陷主要体现在光芒的分布上:虽然整体呈放射状,但光芒的长短和弯曲弧度缺乏自然的对称性,部分线条的末端出现了不自然的断裂或重叠。此外,太阳圆形的边缘线条略显杂乱,笔触的质感在某些区域显得过于平滑,失去了真实蜡笔画那种随机的颗粒感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像基本完成了提示词的核心要求,卡通微笑太阳的主题明确,色彩方案优秀,手绘蜡笔风格统一。最主要的硬伤是光芒数量超出要求范围(约12-13条 vs 要求8-10条),以及光芒分布对称性不足。风格上蜡笔排线纹理略显复杂,与「儿童简笔画」的极简定位有轻微偏差。综合来看是一张完成度较好但存在可量化偏差的作品。 【GEMINI】这是一张视觉效果非常出色的儿童风格插画,在风格化表现和色彩运用上几乎无可挑剔。然而,作为AI生成图像,它在执行具体的数量指令(8-10条光芒)时出现了明显的偏差,多出了2-4条光芒,这在严苛的评审标准下是主要的扣分项。 【KIMI】该图像在色彩执行和风格基调上表现优秀,但核心指标「光芒数量」出现硬性偏差(12条 vs 8-10条),且分布对称性欠佳。作为AI生成图像,在「简单计数任务」上出现此类错误值得警惕,反映出模型对精确数量约束的理解仍存漏洞。整体属于「基本完成要求但有关键瑕疵」层级。

进阶难度评测结果

  • 得分:75.6 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展现了一个充满童话色彩的梦幻森林,整体采用明亮的马卡龙色调和可爱的卡通画风。画面前方并排站立着三棵巨大的拟人化大树,它们的树冠像棉花糖一样蓬松,颜色从左至右分别为粉色、蓝色和黄色。每棵树的树干上都长着一双圆圆的大眼睛和微笑的嘴巴,表情憨态可掬。地面是淡黄色的草地,点缀着许多发光的彩色小蘑菇,两只浅棕色的小兔子正在草地上欢快地奔跑。右下角有一条流淌着的七彩虹色小溪。 在 AI 生成的细节方面,存在一些明显的逻辑缺陷:中间蓝色大树的树干底部线条显得有些生硬,与地面的衔接不够自然;右侧黄色大树下方的彩虹小溪在边缘处出现了透视异常,色彩层级与河岸的交界显得模糊;此外,草地上散落的一些细小黑色线条(疑似杂草)分布得比较随意,缺乏规律感,部分蘑菇的透视角度也略显扭曲。

图中展现了一个充满童话色彩的梦幻森林,整体采用明亮的马卡龙色调和可爱的卡通画风。画面前方并排站立着三棵巨大的拟人化大树,它们的树冠像棉花糖一样蓬松,颜色从左至右分别为粉色、蓝色和黄色。每棵树的树干上都长着一双圆圆的大眼睛和微笑的嘴巴,表情憨态可掬。地面是淡黄色的草地,点缀着许多发光的彩色小蘑菇,两只浅棕色的小兔子正在草地上欢快地奔跑。右下角有一条流淌着的七彩虹色小溪。

在 AI 生成的细节方面,存在一些明显的逻辑缺陷:中间蓝色大树的树干底部线条显得有些生硬,与地面的衔接不够自然;右侧黄色大树下方的彩虹小溪在边缘处出现了透视异常,色彩层级与河岸的交界显得模糊;此外,草地上散落的一些细小黑色线条(疑似杂草)分布得比较随意,缺乏规律感,部分蘑菇的透视角度也略显扭曲。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这张图像在元素完整性和色彩方案上完成度较高,3棵拟人化大树、卡通兔子、彩色蘑菇均到位,糖果色系执行良好。但在两个核心要求上存在明显失分:其一是蘑菇发光效果完全缺失,这是提示词的明确要求;其二是风格执行偏离《探险活宝》的扁平化无渐变原则,树冠和背景的渐变处理是最突出的风格问题。整体更接近通用可爱卡通风格,而非特定的《探险活宝》美术风格。 【GEMINI】图像在元素还原上表现出色,准确捕捉了拟人化大树和糖果色系的核心要求。然而,作为一名挑剔的评审,该作品在执行《探险活宝》这一特定美术风格时存在明显偏差,主要体现在过度使用渐变阴影而非扁平色块,以及线条粗细控制失当。画面构图略显呆板,缺乏插画应有的灵动空间感。 【KIMI】该图像在《探险活宝》风格的表层模仿上具备基础完成度,三棵棉花糖质感的大树和糖果色系是主要亮点。但作为严格评审,「发光蘑菇不发光」属于指令还原的重大缺陷,描边粗细不一和背景风格割裂则暴露AI生成时的注意力分散问题。整体处于「基本完成但瑕疵明显」的区间,未能达到精致交付标准。

困难难度评测结果

  • 得分:77.6 分
  • 通过状态:已通过

模型生成产物

该模型生成了以下图片:

图片内容描述(由 AI 生成,供你参考)

图中展现了一个充满赛博朋克风格的卡通未来城市街道。画面色彩鲜艳,以紫色、蓝色和霓虹绿为主调。前景中有三个并排向前走的角色:左侧是一个圆滚滚的灰色机器人,胸口透出齿轮图案;中间是一个穿着宇航服的绿色三眼章鱼外星人;右侧是一个半机械人战士,拥有强壮的肌肉和喷气背包。背景是密集的未来建筑,包括带有霓虹招牌的“网络寿司店”和“银河游戏厅”,甚至还有一座古风塔楼点缀其间。天空中飞翔着两架紫色的小型飞船。 在 AI 生成细节方面,画面整体构图稳定,但仍存在一些逻辑瑕疵。例如,左侧巨大的机器人建筑与下方街道的透视关系略显生硬;右侧半机械人的手部与武器融合得不够自然,手指线条模糊。此外,背景中部分霓虹灯牌上的装饰性符号显得杂乱,缺乏实际意义,且最右侧游戏厅内部的机器细节呈现出一种随机的堆砌感。

图中展现了一个充满赛博朋克风格的卡通未来城市街道。画面色彩鲜艳,以紫色、蓝色和霓虹绿为主调。前景中有三个并排向前走的角色:左侧是一个圆滚滚的灰色机器人,胸口透出齿轮图案;中间是一个穿着宇航服的绿色三眼章鱼外星人;右侧是一个半机械人战士,拥有强壮的肌肉和喷气背包。背景是密集的未来建筑,包括带有霓虹招牌的“网络寿司店”和“银河游戏厅”,甚至还有一座古风塔楼点缀其间。天空中飞翔着两架紫色的小型飞船。

在 AI 生成细节方面,画面整体构图稳定,但仍存在一些逻辑瑕疵。例如,左侧巨大的机器人建筑与下方街道的透视关系略显生硬;右侧半机械人的手部与武器融合得不够自然,手指线条模糊。此外,背景中部分霓虹灯牌上的装饰性符号显得杂乱,缺乏实际意义,且最右侧游戏厅内部的机器细节呈现出一种随机的堆砌感。
在新标签页中查看原图

注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】这是一张整体完成度较高的赛博朋克Q版卡通城市插画,色彩方案、风格融合、场景氛围均表现出色。然而最致命的问题是角色比例——提示词核心要求的2头身比例完全未能实现,三个角色均呈现3-4头身的普通卡通比例,这是对核心指令的明显偏离。重复出现的「NEON-BOTS HUB」标牌也暴露了生成逻辑的缺陷。综合来看,场景设计能力强但角色比例执行失准,属于「场景优秀、角色比例失控」的典型AI生成问题。 【GEMINI】这是一张视觉表现力极强的插画,完美捕捉了赛博朋克与卡通风格的融合精髓。色彩、线条和构图均表现出极高的专业水准。唯一的遗憾在于对「2头身」这一量化比例指令的执行不够严谨,导致角色造型偏向常规卡通而非极致Q版,但在整体商业插画质量上仍属上乘。 【KIMI】该图像在色彩氛围和基础构图上达到及格线,但作为「测试模型生成卡通风格图像」的产出,其核心指标完成度不足。建筑数量、角色比例等可量化要求未达标,风格融合存在写实与卡通的割裂感,改造人角色的美漫写实倾向尤为突兀。模型似乎更擅长处理「看起来像赛博朋克」的视觉符号,而非严格遵循「Q版卡通」的比例与造型约束。建议加强对2头身比例、色块阴影、建筑数量等硬性指标的控制能力。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...