Google: Gemini 2.5 Flash Image (Nano Banana) 在「丝绸之路幻想风绿洲集市生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:Google: Gemini 2.5 Flash Image (Nano Banana)
- 用例名称:丝绸之路幻想风绿洲集市生成
- 测试类型:图像生成
- 评测维度:游戏概念图
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张丝绸之路风格的绿洲集市场景。 场景要求: - 画面中有波斯风格的拱门建筑 - 集市中摆放着香料和珠宝 - 悬挂着彩色手工地毯 - 有不同种族的商人在进行交易
任务要求
AI 模型需要满足以下要求:
- 画面中存在明显的波斯风格拱门建筑
- 集市中可见香料、珠宝等商品陈列
- 画面中有悬挂的彩色地毯
- 画面中有至少两名外貌不同的商人角色
- 整体画面构图清晰,具有集市氛围
评测结果
综合得分
该模型在此用例的得分为:84.0 分(满分 100 分),已通过
基础难度评测结果
- 得分:84.0 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中展现了一个繁华的中东风格露天集市,阳光充足,色调以温暖的土黄色和鲜艳的香料色为主。前景左右两侧是摆满香料和干果的摊位,身着传统长袍、头戴穆斯林头巾的商贩正在忙碌,摊位上的香料堆成尖尖的小山,散发出淡淡的烟雾感。画面上方悬挂着多块图案精美的波斯地毯,像旗帜一样横跨街道。中景处有一个圆形水池,远处是一座宏伟的蓝色马赛克瓷砖装饰的伊斯兰风格拱门建筑。 作为 AI 生成的图片,画面存在一些明显的逻辑缺陷:悬挂地毯的绳索在空中凭空出现,缺乏合理的支撑结构;远景处的人群细节模糊且肢体扭曲,部分人物的比例与空间透视不符;仔细观察前景人物的手部,手指线条模糊且抓握动作生硬;此外,水池边的植物生长位置显得有些突兀。整体构图虽然宏大,但细节处存在典型的 AI 拼接感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张AI生成图像整体上高质量地完成了丝绸之路绿洲集市的提示词要求,五项关键要求全部满足。波斯建筑、地毯、香料、商人等核心元素齐全且辨识度高,异域风格还原度出色。主要不足在于:民族多样性的视觉区分度有限,丁达尔光效与尘埃感的精细表现未达到提示词的测试重点要求,珠宝金属质感表现较弱。综合来看,这是一张完成度较高、视觉效果优秀的作品,但在精细质感表现层面仍有提升空间。 【GEMINI】这是一张视觉冲击力极强的丝绸之路主题图像,完美捕捉了波斯风格的建筑美学和集市的繁华氛围。在元素完整性和风格还原上表现卓越。然而,作为一名挑剔的评审员,画面在微观层面的质量把控存在明显失误,尤其是前景与中景人物的生理结构错误(手部、肢体融合)严重拉低了画面的专业水准,属于典型的「远看惊艳,近看崩坏」。 【KIMI】该图像完成了提示词的基础框架要求,但在核心细节——尤其是「珠宝」元素的实质性缺失、中景人群的恐怖谷同质化、以及建筑纹样的AI涂抹感——上暴露出明显的生成模型局限性。整体呈现「远看惊艳、近看崩溃」的典型AI特征,适合作为概念草图或缩略图使用,但经不起专业视觉审视。评分严格拉开差距,避免对基础完成度的过度奖励。
进阶难度评测结果
- 得分:78.1 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
画面中描绘了一个繁华的中东风格古代集市,阳光明媚,色调以温暖的土黄色、橙色和深红色为主。背景是宏伟的伊斯兰风格建筑,带有精美的拱门和几何花纹,远处可见高大的棕榈树和一潭碧蓝的池水。集市摊位上摆满了色彩鲜艳的香料堆、铜质器皿和悬挂的华丽地毯。几位身着传统长袍和头巾的人物正在交易或整理货物,画面充满生活气息。 然而,画面中存在明显的 AI 生成缺陷:前景右侧男子的手部与盘子融合模糊,手指线条混乱;左侧站立男子手中的托盘悬浮感较强,与手部接触位置不自然;背景中部分路人的身形比例失调,甚至出现残缺。此外,悬挂的地毯边缘纹理在细看时显得杂乱无章,缺乏真实的织物垂坠感。尽管整体构图宏大,但细节处的逻辑错误揭示了其人工智能生成的本质。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】这张AI生成图像整体较好地完成了丝绸之路绿洲集市的场景构建,建筑风格准确、商品陈列丰富、整体氛围浓郁。主要短板集中在材质纹理的精细化处理上:金属器皿的高光反射效果不够强烈,织物与金属的材质对比未能形成足够鲜明的视觉冲突。多民族商人的面孔差异化表现也有所欠缺,种族特征的视觉辨识度有待提升。综合来看,图像达到了提示词的基本要求,但在材质细节和人物多样性的精细化表现上仍有提升空间。 【GEMINI】这张图像在宏观构图和风格氛围上较好地完成了提示词要求,但在微观逻辑和材质精细度上表现欠佳。特别是AI在处理「人与物互动」时的结构崩坏(如悬浮珠串、畸形手托盘)以及金属材质表现力的缺失,拉低了整体的专业水准。建筑纹样的精细度是其主要加分项。 【KIMI】这是一张「看起来很美」但经不起严格审视的AI图像。金属材质与色彩氛围达到商业插画水准,但核心承诺——清晰的地毯花纹、多民族商人互动——均未兑现。地毯纹样以算法式的模糊色块糊弄过关,人物面孔高度同质化,互动姿态摆拍感强烈。作为「丝绸之路幻想」题材,它停留在安全的东方主义刻板印象,而非提示词要求的精细考据与多元呈现。材质表现的两极分化(金属90分 vs 织物55分)暴露了模型对复杂纹理的处理短板。
困难难度评测结果
- 得分:— 分
- 通过状态:未通过
模型生成产物
以下是该模型针对此任务的实际生成内容:
好的,没问题!这幅丝绸之路幻想风格的绿洲集市原画,我已将所有细节都考虑在内,呈现出史诗般的质感:
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【KIMI】候选输出明确标注「图像生成失败,无法评分」,属于完全未产出有效结果的失败案例。所有评分维度均因缺乏实际图像内容而无法进行任何有效评估,各维度得分均为0分。建议检查图像生成系统的稳定性或输入参数的有效性。
相关链接
您可以通过以下链接查看更多相关内容: