Google: Nano Banana Pro (Gemini 3 Pro Image Preview) 在「食物」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：Google: Nano Banana Pro (Gemini 3 Pro Image Preview)
用例名称：食物
测试类型：图像生成
评测维度：物体生成

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一张图片：一个看起来很美味的汉堡要求： - 层次分明（面包、肉饼、蔬菜等） - 看起来新鲜诱人 - 食物摄影风格

任务要求

AI 模型需要满足以下要求：

生成一张汉堡的食物摄影风格图片，画面主体为单个完整汉堡
汉堡须呈现清晰的垂直层次结构，从下至上至少包含：底部面包、肉饼、蔬菜（生菜、番茄等至少2种）、酱料、顶部面包盖
食材色泽需体现新鲜感：面包呈金黄色、肉饼呈焦褐烤色、蔬菜色彩鲜亮，整体具有强烈视觉食欲感
采用专业食物摄影构图：近景或特写视角，主体清晰对焦并配合背景虚化（浅景深效果），光线自然且具有立体感

评测结果

综合得分

该模型在此用例的得分为：85.0 分（满分 100 分），已通过

基础难度评测结果

得分：85.0 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

画面中展示了一个令人垂涎欲滴的巨型培根芝士汉堡，它被放置在厚实的木制砧板中央。汉堡由上至下依次是金黄油亮的布里欧修面包、融化的橙色切达芝士、焦脆的培根片、鲜绿的生菜、两片红番茄、紫洋葱圈、厚实的烤牛肉饼，以及正在向下滴落的特制酱料。汉堡两侧散落着金黄色的炸薯条，背景右侧有一杯带泡沫的浅色啤酒，整体色调温暖且饱和。然而，画面中存在明显的 AI 生成缺陷：汉堡右侧的薯条透视关系混乱，部分薯条似乎悬浮或生硬地嵌入木板中；汉堡底部的酱料滴落形状过于规整且缺乏重力感；背景中的物体模糊不清，且左侧的白色瓶状物结构扭曲，缺乏真实的细节支撑。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这是一张执行质量极高的AI食物摄影图像，几乎完美地满足了提示词的所有要求。汉堡结构完整、层次分明、食材新鲜感强烈，专业食物摄影的构图与景深处理均达到商业级水准。主要瑕疵集中在「过于完美」带来的轻微人工感——薯条的克隆均匀感和打光的过度完美是AI生成图像的典型特征，但这些问题不影响整体的视觉冲击力与提示词完成度。综合加权得分约为93分，属于同类任务中的顶级表现。【GEMINI】这是一张视觉冲击力很强的食物摄影作品，在色彩和光影氛围上达到了专业水准。但在严苛的结构审查下，底部酱汁的物理逻辑错误和中层食材的边缘融合问题暴露了其AI生成的本质。整体而言，它成功营造了「美味」的初印象，但在细节真实度上仍有提升空间。【KIMI】该图像作为AI生成的食物摄影，在第一眼观感上具备较强的视觉冲击力，但经不起专业审视。核心问题在于「过度理想化」与「结构不稳定」的矛盾——食材形态过于完美（薯条、面包光泽）反而暴露生成痕迹，同时酱料位置、洋葱厚度等结构性选择违背了真实食物物理逻辑。提示词要求的「层次分明」仅达到表面堆叠，未实现各层级的清晰空间界定；「新鲜诱人」在肉饼和番茄上表现不足。整体属于「快餐式视觉」而非「精致食物摄影」，适合远距离浏览但禁不起放大细究。

进阶难度评测结果

得分：79.8 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一把古典吉他斜靠在室内的一把旧扶手椅上。房间充满了复古和温馨的气息，背景中有木质家具、盆栽植物和温暖的阳光。吉他的面板呈现出自然的木色，琴身侧边颜色较深，琴孔周围有精致的环形花纹。扶手椅是棕褐色的丝绒材质，表面有明显的磨损和破旧痕迹。阳光从右侧洒入，在木地板和家具上留下了斑驳的光影。然而，画面中存在明显的 AI 生成缺陷：首先，吉他的琴弦结构逻辑混乱，琴头处只有五个调音旋钮，且琴弦与旋钮的连接方式模糊不清，琴颈上的品格线分布也不够严谨。其次，琴码处的琴弦排列异常，看起来像是直接消失在木头里，而非正常固定。此外，背景中左侧木柜的边缘与扶手椅的衔接处透视略显生硬，右侧盆栽的枝叶生长路径也显得不够自然。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这张图像整体质量较高，古典吉他的三大结构部件基本完整，木质纹理表现尤为出色，面板直纹、侧背板深色纹理与琴颈材质的差异化处理展现了极强的真实感。六根琴弦数量准确，粗细层次分明。主要瑕疵集中在构图层面——琴头略微超出画框导致调音旋钮未能完整呈现，这是对「结构完整性」要求的轻微违背。若构图稍作调整使琴头完整入画，该图像可达到接近满分的水准。【GEMINI】这张图像在材质渲染上达到了极高水准，但在核心的物理结构——尤其是乐器灵魂所在的琴弦和调音机构上出现了严重的AI幻觉。琴弦的逻辑混乱直接破坏了作为「古典吉他」的功能性表达，属于典型的『画皮难画骨』。【KIMI】该图像基本完成了「古典吉他」的核心生成任务，主体结构完整、琴弦数量正确、面板纹理具备一定真实感。但作为挑剔的评审，必须指出其在「琴弦粗细层次」「侧板纹理细节」「琴桥工艺」三个关键视觉节点上存在明显瑕疵——这些正是区分AI生成与真实摄影的专业门槛。侧板的塑料质感与琴弦的等粗化处理，暴露了模型对乐器材质细节的理解不足。整体处于「可用但经不起放大审视」的水平。

困难难度评测结果

得分：78.7 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展现了一只威猛的西方巨龙，它正伫立在乱石嶙峋的山巅。巨龙拥有暗红色的坚硬鳞片和巨大的皮质双翼，翼膜在火光映衬下呈现出半透明的橘红色。这只龙拥有两个头：上方的头仰天咆哮，下方的头正向山谷喷射炽热的火焰。背景是阴云密布的雷雨天，闪电划破深灰色的天空，山峦间流淌着滚烫的岩浆，整体色调以深褐、暗红和明亮的火橙色为主，营造出一种史诗般的灾难感。在 AI 生成细节方面，存在明显的逻辑缺陷：巨龙的身体结构模糊，左侧翅膀的骨架连接处显得生硬且不符合解剖学；最明显的错误在于尾部，画面左下方出现了一条带有尖刺的长尾，但在巨龙后腿之间又莫名多出了一段类似尾巴的肢体，导致身体末端连接混乱。此外，巨龙右前爪的脚趾数量和抓握姿态也显得不够自然。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】这张AI生成的西方龙图像在语义完成度和视觉表现力上表现较好，史诗画风的营造尤为成功。然而最致命的缺陷是出现了「双头」结构错误——画面中同时存在两个龙头，这是AI图像生成中常见的解剖幻觉问题，严重拉低了结构准确性评分。翅膀根部连接模糊和前肢遮挡问题进一步削弱了生物结构的可信度。综合来看，这是一张视觉冲击力强但存在明显结构性缺陷的作品，适合作为概念参考图，但不适合作为精确的角色设计稿使用。【GEMINI】这是一张视觉冲击力极强但经不起细节推敲的作品。在色彩、材质和氛围营造上达到了顶尖插画的水准，完美契合了「史诗感」的要求。然而，AI 在处理复杂生物结构时的通病在此画中暴露无遗，尤其是颈部与头部的连接畸变严重破坏了形象的完整性，翅膀的透视逻辑也存在硬伤。【KIMI】这是一张典型的「第一眼惊艳、细究则溃」的AI生成图像。模型在氛围营造和宏观构图上表现合格，但在核心的生物结构逻辑上犯了致命错误——双头龙的擅自引入不仅偏离提示词，更暴露了其在复杂解剖结构处理上的根本缺陷。喷火特效的光照交互缺失是另一处专业硬伤，显示出模型对物理光影关系的理解停留在表面模仿。作为插画草稿或可接受，但作为完成度要求高的史诗画风作品，其结构准确性和光影真实感均未达标。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

进阶难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

困难难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

相关链接

反馈评测问题