Google: Nano Banana Pro (Gemini 3 Pro Image Preview) 在「食物」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:Google: Nano Banana Pro (Gemini 3 Pro Image Preview)
- 用例名称:食物
- 测试类型:图像生成
- 评测维度:物体生成
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张图片:一个看起来很美味的汉堡 要求: - 层次分明(面包、肉饼、蔬菜等) - 看起来新鲜诱人 - 食物摄影风格
任务要求
AI 模型需要满足以下要求:
- 生成一张汉堡的食物摄影风格图片,画面主体为单个完整汉堡
- 汉堡须呈现清晰的垂直层次结构,从下至上至少包含:底部面包、肉饼、蔬菜(生菜、番茄等至少2种)、酱料、顶部面包盖
- 食材色泽需体现新鲜感:面包呈金黄色、肉饼呈焦褐烤色、蔬菜色彩鲜亮,整体具有强烈视觉食欲感
- 采用专业食物摄影构图:近景或特写视角,主体清晰对焦并配合背景虚化(浅景深效果),光线自然且具有立体感
评测结果
综合得分
该模型在此用例的得分为:85.0 分(满分 100 分),已通过
基础难度评测结果
- 得分:85.0 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中展示了一个令人垂涎欲滴的巨型培根芝士汉堡,它被放置在厚实的木制砧板中央。汉堡由上至下依次是金黄油亮的布里欧修面包、融化的橙色切达芝士、焦脆的培根片、鲜绿的生菜、两片红番茄、紫洋葱圈、厚实的烤牛肉饼,以及正在向下滴落的特制酱料。汉堡两侧散落着金黄色的炸薯条,背景右侧有一杯带泡沫的浅色啤酒,整体色调温暖且饱和。然而,画面中存在明显的 AI 生成缺陷:汉堡右侧的薯条透视关系混乱,部分薯条似乎悬浮或生硬地嵌入木板中;汉堡底部的酱料滴落形状过于规整且缺乏重力感;背景中的物体模糊不清,且左侧的白色瓶状物结构扭曲,缺乏真实的细节支撑。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这是一张执行质量极高的AI食物摄影图像,几乎完美地满足了提示词的所有要求。汉堡结构完整、层次分明、食材新鲜感强烈,专业食物摄影的构图与景深处理均达到商业级水准。主要瑕疵集中在「过于完美」带来的轻微人工感——薯条的克隆均匀感和打光的过度完美是AI生成图像的典型特征,但这些问题不影响整体的视觉冲击力与提示词完成度。综合加权得分约为93分,属于同类任务中的顶级表现。 【GEMINI】这是一张视觉冲击力很强的食物摄影作品,在色彩和光影氛围上达到了专业水准。但在严苛的结构审查下,底部酱汁的物理逻辑错误和中层食材的边缘融合问题暴露了其AI生成的本质。整体而言,它成功营造了「美味」的初印象,但在细节真实度上仍有提升空间。 【KIMI】该图像作为AI生成的食物摄影,在第一眼观感上具备较强的视觉冲击力,但经不起专业审视。核心问题在于「过度理想化」与「结构不稳定」的矛盾——食材形态过于完美(薯条、面包光泽)反而暴露生成痕迹,同时酱料位置、洋葱厚度等结构性选择违背了真实食物物理逻辑。提示词要求的「层次分明」仅达到表面堆叠,未实现各层级的清晰空间界定;「新鲜诱人」在肉饼和番茄上表现不足。整体属于「快餐式视觉」而非「精致食物摄影」,适合远距离浏览但禁不起放大细究。
进阶难度评测结果
- 得分:79.8 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一把古典吉他斜靠在室内的一把旧扶手椅上。房间充满了复古和温馨的气息,背景中有木质家具、盆栽植物和温暖的阳光。吉他的面板呈现出自然的木色,琴身侧边颜色较深,琴孔周围有精致的环形花纹。扶手椅是棕褐色的丝绒材质,表面有明显的磨损和破旧痕迹。阳光从右侧洒入,在木地板和家具上留下了斑驳的光影。 然而,画面中存在明显的 AI 生成缺陷:首先,吉他的琴弦结构逻辑混乱,琴头处只有五个调音旋钮,且琴弦与旋钮的连接方式模糊不清,琴颈上的品格线分布也不够严谨。其次,琴码处的琴弦排列异常,看起来像是直接消失在木头里,而非正常固定。此外,背景中左侧木柜的边缘与扶手椅的衔接处透视略显生硬,右侧盆栽的枝叶生长路径也显得不够自然。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张图像整体质量较高,古典吉他的三大结构部件基本完整,木质纹理表现尤为出色,面板直纹、侧背板深色纹理与琴颈材质的差异化处理展现了极强的真实感。六根琴弦数量准确,粗细层次分明。主要瑕疵集中在构图层面——琴头略微超出画框导致调音旋钮未能完整呈现,这是对「结构完整性」要求的轻微违背。若构图稍作调整使琴头完整入画,该图像可达到接近满分的水准。 【GEMINI】这张图像在材质渲染上达到了极高水准,但在核心的物理结构——尤其是乐器灵魂所在的琴弦和调音机构上出现了严重的AI幻觉。琴弦的逻辑混乱直接破坏了作为「古典吉他」的功能性表达,属于典型的『画皮难画骨』。 【KIMI】该图像基本完成了「古典吉他」的核心生成任务,主体结构完整、琴弦数量正确、面板纹理具备一定真实感。但作为挑剔的评审,必须指出其在「琴弦粗细层次」「侧板纹理细节」「琴桥工艺」三个关键视觉节点上存在明显瑕疵——这些正是区分AI生成与真实摄影的专业门槛。侧板的塑料质感与琴弦的等粗化处理,暴露了模型对乐器材质细节的理解不足。整体处于「可用但经不起放大审视」的水平。
困难难度评测结果
- 得分:78.7 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展现了一只威猛的西方巨龙,它正伫立在乱石嶙峋的山巅。巨龙拥有暗红色的坚硬鳞片和巨大的皮质双翼,翼膜在火光映衬下呈现出半透明的橘红色。这只龙拥有两个头:上方的头仰天咆哮,下方的头正向山谷喷射炽热的火焰。背景是阴云密布的雷雨天,闪电划破深灰色的天空,山峦间流淌着滚烫的岩浆,整体色调以深褐、暗红和明亮的火橙色为主,营造出一种史诗般的灾难感。在 AI 生成细节方面,存在明显的逻辑缺陷:巨龙的身体结构模糊,左侧翅膀的骨架连接处显得生硬且不符合解剖学;最明显的错误在于尾部,画面左下方出现了一条带有尖刺的长尾,但在巨龙后腿之间又莫名多出了一段类似尾巴的肢体,导致身体末端连接混乱。此外,巨龙右前爪的脚趾数量和抓握姿态也显得不够自然。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张AI生成的西方龙图像在语义完成度和视觉表现力上表现较好,史诗画风的营造尤为成功。然而最致命的缺陷是出现了「双头」结构错误——画面中同时存在两个龙头,这是AI图像生成中常见的解剖幻觉问题,严重拉低了结构准确性评分。翅膀根部连接模糊和前肢遮挡问题进一步削弱了生物结构的可信度。综合来看,这是一张视觉冲击力强但存在明显结构性缺陷的作品,适合作为概念参考图,但不适合作为精确的角色设计稿使用。 【GEMINI】这是一张视觉冲击力极强但经不起细节推敲的作品。在色彩、材质和氛围营造上达到了顶尖插画的水准,完美契合了「史诗感」的要求。然而,AI 在处理复杂生物结构时的通病在此画中暴露无遗,尤其是颈部与头部的连接畸变严重破坏了形象的完整性,翅膀的透视逻辑也存在硬伤。 【KIMI】这是一张典型的「第一眼惊艳、细究则溃」的AI生成图像。模型在氛围营造和宏观构图上表现合格,但在核心的生物结构逻辑上犯了致命错误——双头龙的擅自引入不仅偏离提示词,更暴露了其在复杂解剖结构处理上的根本缺陷。喷火特效的光照交互缺失是另一处专业硬伤,显示出模型对物理光影关系的理解停留在表面模仿。作为插画草稿或可接受,但作为完成度要求高的史诗画风作品,其结构准确性和光影真实感均未达标。
相关链接
您可以通过以下链接查看更多相关内容: