Google: Gemini 2.5 Flash Image (Nano Banana) 在「旅行路线图插画生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:Google: Gemini 2.5 Flash Image (Nano Banana)
- 用例名称:旅行路线图插画生成
- 测试类型:图像生成
- 评测维度:PPT 设计
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张 16:9 比例的步行一日路线图插画。 内容要求: - 顶部标题为「步行一日小路线」 - 画面中间有一条竖向或横向线条,线条上有四个圆点节点 - 四个节点旁分别标注以下中文行程文字: - 「早上:漫步老街,感受晨间烟火气」 - 「中午:在街边小馆享用一碗热汤面」 - 「下午:逛逛书店,挑一本喜欢的书」 - 「傍晚:坐在公园长椅上看夕阳」 - 每段文字紧贴对应节点
任务要求
AI 模型需要满足以下要求:
- 画面比例为 16:9
- 顶部有标题「步行一日小路线」
- 画面中有连接四个圆点节点的线条
- 四个节点旁均有对应的中文时间段行程描述(早上、中午、下午、傍晚)
- 文字内容与节点位置基本对应
评测结果
综合得分
该模型在此用例的得分为:60.0 分(满分 100 分),已通过
基础难度评测结果
- 得分:60.0 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张采用米黄色纸张纹理作为背景的插画,主题似乎是关于一日生活计划的流程图。画面上方有一行黑色书法字体,中间是一条贯穿左右的红色波浪线,线上分布着四个彩色圆圈,下方分别对应四个生活场景的插画和文字描述。插画风格简约,包含古建筑、面条、书架和公园长椅。 画面中存在明显的 AI 生成缺陷,主要体现在文字逻辑的严重混乱。虽然字体看起来像中文,但大部分词汇是无法理解的乱码或错别字,例如标题中的“齿衍一日小敦栓”,以及下方描述中的“导边”、“中边”、“享用一叽热汤面”等。此外,插画细节也存在异常:最左侧建筑上方的烟雾线条生硬,面条碗上的筷子悬浮且比例失调,书架上的书籍线条模糊且重叠,最右侧公园场景中的太阳光芒分布不均。整张图片虽然构图整洁,但内容因文字错误而失去了实际的传达意义。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图在构图结构和视觉风格上完成度尚可,横向时间线、四节点布局、配套插图等形式要素基本到位。然而,最核心的文字内容几乎全部失败——标题和四段行程文字均充斥严重错别字与乱码,完全无法正确传达提示词要求的信息。文字准确性是本次任务的核心考察点(权重45%),而该维度得分极低,导致整体评价不及格。这是AI图像生成中文字渲染能力不足的典型案例。 【GEMINI】该图像在视觉构图和插画意象上表现良好,但在核心的文字生成任务上遭遇了毁灭性的失败。AI 完全无法正确处理中文汉字的结构,导致所有文本内容均变为无意义的乱码或错别字组合,严重违背了提示词的功能性要求。作为一张路线图,文字信息的失效使其失去了基本的使用价值。 【KIMI】这是一张在视觉构图上勉强合格,但在核心文字生成上严重失败的 AI 图像。模型完全未能正确生成中文文字,标题和四段行程描述出现大量乱码、错字,导致用户无法获取任何有效的行程信息。虽然图标与场景意图基本匹配,但文字标签的错误使得「步行一日路线图」的功能性完全丧失。这反映了当前 AI 模型在中文字符生成,尤其是复杂排版场景下的显著短板。建议重新生成并重点校验文字内容。
进阶难度评测结果
- 得分:52.5 分
- 通过状态:未通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张采用手绘插画风格的“一日生活清单”,背景为米白色,点缀着淡雅的花草和云朵装饰。画面中心有一条贯穿左右的淡绿色时间轴,分布着五个彩色圆点。轴线上方和下方各有两个圆角矩形框,分别对应四个时间点:早上8点是包子和热粥,中午12点是一碗热汤面,下午3点是堆叠的书籍与眼镜,晚上6点则是公园长椅与落日。整张图片色调柔和,给人一种温馨治愈的视觉感受。然而,画面中存在明显的 AI 生成缺陷,主要体现在文字内容上:标题及各框内的文字虽然看起来像汉字,但实际上大多是无法辨认的乱码或生僻字组合,逻辑不通,且部分笔画扭曲变形。此外,12点插图中的筷子穿透了碗缘,透视关系略显生硬。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在版式结构和视觉风格上基本达到要求,时间线布局、节点颜色区分、手绘图标风格均有一定水准。然而,最核心的文字准确性存在灾难性失败——标题和四段行程文字几乎全部为乱码或错别字,中文文字生成能力严重不足,导致整张图像的实用价值几乎为零。这是AI图像生成中文内容时的典型失败案例,文字错误之严重远超可接受范围。 【GEMINI】这是一张在视觉美学上表现出色,但在功能性(文字传达)上完全失败的作品。作为插画师,我认可其构图和色彩表现;但作为视觉设计师,该图像因无法准确呈现中文信息且逻辑节点对齐错误,属于严重的生成事故。AI 在处理复杂中文长句时的局限性在此图中暴露无遗。 【KIMI】这是一张在视觉框架上勉强合格,但在核心文字生成上彻底失败的AI图像。提示词明确要求「严格按照以下文字生成」,但模型输出的标题和四段行程文字几乎全部为乱码或错字,完全无法传达用户意图。作为「步行一日路线图」的信息载体,文字内容的100%错误使该图像失去基本功能价值。虽然配色和手绘风格达标,图标匹配度部分正确,但文字灾难是不可接受的致命缺陷。
困难难度评测结果
- 得分:66.5 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张米黄色背景的旅游行程规划图,风格清新简约。画面中央有一条蜿蜒的灰色曲线,象征着旅行路线,点缀着脚印、树木和古建筑小图标。路线周围分布着四个时间节点,分别配有插画和文字说明:左上角是古镇街景,右上角是一碗热面,左下角是正在读书的小孩,右下角是湖边长椅与落日。整体色调柔和,使用了草绿、砖红、深蓝和姜黄等色块进行区分。 然而,画面中存在明显的 AI 生成缺陷,主要体现为严重的文字错误。标题和正文中的汉字大多是扭曲、残缺或根本不存在的“伪汉字”,例如“践行”被写成“距行”,“什刹海”变成了无法辨认的乱码组合。此外,右上角面条碗中的筷子透视异常,像是直接插在碗缘而非自然放置。这些文字和细节的逻辑错误表明该图是由 AI 模仿人类排版生成,但不具备实际阅读功能。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在视觉结构和风格层面完成度较高,S形时间线、节点形状配色、手绘插图、整体手账风格均基本符合提示词要求。然而,图像最致命的缺陷在于中文文字渲染质量极差——标题、时段标签、行程描述、地点名称、底部信息全部出现严重错别字和乱码,几乎没有一处文字能够正确传达提示词要求的内容。对于一张以文字信息为核心的路线图插画而言,文字准确性是最基础也是最重要的要求,而该图像在这一维度几乎完全失败。综合来看,图像「形似而神不似」——视觉框架搭建成功,但内容信息层面严重失真,实用价值极低。 【GEMINI】这是一张在视觉设计、排版构图和色彩搭配上表现极佳,但在文字准确性上彻底失败的作品。图像完美捕捉了日系手账的精髓,节点形状和空间对应关系完全符合提示词要求。然而,作为核心信息的中文文本出现了大面积的错别字和乱码,导致其作为路线图的功能性完全丧失。这种「形似而神非」的表现是目前 AI 生成中文排版插画的典型短板。 【KIMI】这是一张典型的「视觉风格过关、核心信息崩盘」的 AI 生成失败案例。画面在配色、插画风格、装饰元素上基本达到了日系手账的视觉效果,但文字层的全面崩溃使其作为「路线图」的功能完全丧失——用户无法从中读取任何有效的行程信息。这种「看起来像那么回事但完全不能用」的问题在文本生成图像中极为致命。模型似乎在处理结构化中文文本(尤其是包含竖线分隔符的三层信息格式)时出现了严重的编码或解码错误,导致几乎全部汉字被替换为形近乱码或完全无意义的字符。从专业评审角度,这张图像在「文字准确性」维度属于严重事故级别,必须给出极低分数以拉开模型差距。建议模型优化方向:强化中文文本的语义保持能力,特别是在结构化信息(时间|描述|地点)和长文本生成场景下的字符准确性。
相关链接
您可以通过以下链接查看更多相关内容: