Google: Gemini 2.5 Flash Image (Nano Banana) 在「旅行路线图插画生成」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：Google: Gemini 2.5 Flash Image (Nano Banana)
用例名称：旅行路线图插画生成
测试类型：图像生成
评测维度：PPT 设计

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

生成一张 16:9 比例的步行一日路线图插画。内容要求： - 顶部标题为「步行一日小路线」 - 画面中间有一条竖向或横向线条，线条上有四个圆点节点 - 四个节点旁分别标注以下中文行程文字： - 「早上：漫步老街，感受晨间烟火气」 - 「中午：在街边小馆享用一碗热汤面」 - 「下午：逛逛书店，挑一本喜欢的书」 - 「傍晚：坐在公园长椅上看夕阳」 - 每段文字紧贴对应节点

任务要求

AI 模型需要满足以下要求：

画面比例为 16:9
顶部有标题「步行一日小路线」
画面中有连接四个圆点节点的线条
四个节点旁均有对应的中文时间段行程描述（早上、中午、下午、傍晚）
文字内容与节点位置基本对应

评测结果

综合得分

该模型在此用例的得分为：60.0 分（满分 100 分），已通过

基础难度评测结果

得分：60.0 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一张采用米黄色纸张纹理作为背景的插画，主题似乎是关于一日生活计划的流程图。画面上方有一行黑色书法字体，中间是一条贯穿左右的红色波浪线，线上分布着四个彩色圆圈，下方分别对应四个生活场景的插画和文字描述。插画风格简约，包含古建筑、面条、书架和公园长椅。画面中存在明显的 AI 生成缺陷，主要体现在文字逻辑的严重混乱。虽然字体看起来像中文，但大部分词汇是无法理解的乱码或错别字，例如标题中的“齿衍一日小敦栓”，以及下方描述中的“导边”、“中边”、“享用一叽热汤面”等。此外，插画细节也存在异常：最左侧建筑上方的烟雾线条生硬，面条碗上的筷子悬浮且比例失调，书架上的书籍线条模糊且重叠，最右侧公园场景中的太阳光芒分布不均。整张图片虽然构图整洁，但内容因文字错误而失去了实际的传达意义。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图在构图结构和视觉风格上完成度尚可，横向时间线、四节点布局、配套插图等形式要素基本到位。然而，最核心的文字内容几乎全部失败——标题和四段行程文字均充斥严重错别字与乱码，完全无法正确传达提示词要求的信息。文字准确性是本次任务的核心考察点（权重45%），而该维度得分极低，导致整体评价不及格。这是AI图像生成中文字渲染能力不足的典型案例。【GEMINI】该图像在视觉构图和插画意象上表现良好，但在核心的文字生成任务上遭遇了毁灭性的失败。AI 完全无法正确处理中文汉字的结构，导致所有文本内容均变为无意义的乱码或错别字组合，严重违背了提示词的功能性要求。作为一张路线图，文字信息的失效使其失去了基本的使用价值。【KIMI】这是一张在视觉构图上勉强合格，但在核心文字生成上严重失败的 AI 图像。模型完全未能正确生成中文文字，标题和四段行程描述出现大量乱码、错字，导致用户无法获取任何有效的行程信息。虽然图标与场景意图基本匹配，但文字标签的错误使得「步行一日路线图」的功能性完全丧失。这反映了当前 AI 模型在中文字符生成，尤其是复杂排版场景下的显著短板。建议重新生成并重点校验文字内容。

进阶难度评测结果

得分：52.5 分
通过状态：未通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一张采用手绘插画风格的“一日生活清单”，背景为米白色，点缀着淡雅的花草和云朵装饰。画面中心有一条贯穿左右的淡绿色时间轴，分布着五个彩色圆点。轴线上方和下方各有两个圆角矩形框，分别对应四个时间点：早上8点是包子和热粥，中午12点是一碗热汤面，下午3点是堆叠的书籍与眼镜，晚上6点则是公园长椅与落日。整张图片色调柔和，给人一种温馨治愈的视觉感受。然而，画面中存在明显的 AI 生成缺陷，主要体现在文字内容上：标题及各框内的文字虽然看起来像汉字，但实际上大多是无法辨认的乱码或生僻字组合，逻辑不通，且部分笔画扭曲变形。此外，12点插图中的筷子穿透了碗缘，透视关系略显生硬。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像在版式结构和视觉风格上基本达到要求，时间线布局、节点颜色区分、手绘图标风格均有一定水准。然而，最核心的文字准确性存在灾难性失败——标题和四段行程文字几乎全部为乱码或错别字，中文文字生成能力严重不足，导致整张图像的实用价值几乎为零。这是AI图像生成中文内容时的典型失败案例，文字错误之严重远超可接受范围。【GEMINI】这是一张在视觉美学上表现出色，但在功能性（文字传达）上完全失败的作品。作为插画师，我认可其构图和色彩表现；但作为视觉设计师，该图像因无法准确呈现中文信息且逻辑节点对齐错误，属于严重的生成事故。AI 在处理复杂中文长句时的局限性在此图中暴露无遗。【KIMI】这是一张在视觉框架上勉强合格，但在核心文字生成上彻底失败的AI图像。提示词明确要求「严格按照以下文字生成」，但模型输出的标题和四段行程文字几乎全部为乱码或错字，完全无法传达用户意图。作为「步行一日路线图」的信息载体，文字内容的100%错误使该图像失去基本功能价值。虽然配色和手绘风格达标，图标匹配度部分正确，但文字灾难是不可接受的致命缺陷。

困难难度评测结果

得分：66.5 分
通过状态：已通过

模型生成产物

该模型生成了以下图片：

图片内容描述（由 AI 生成，供你参考）

图中展示了一张米黄色背景的旅游行程规划图，风格清新简约。画面中央有一条蜿蜒的灰色曲线，象征着旅行路线，点缀着脚印、树木和古建筑小图标。路线周围分布着四个时间节点，分别配有插画和文字说明：左上角是古镇街景，右上角是一碗热面，左下角是正在读书的小孩，右下角是湖边长椅与落日。整体色调柔和，使用了草绿、砖红、深蓝和姜黄等色块进行区分。然而，画面中存在明显的 AI 生成缺陷，主要体现为严重的文字错误。标题和正文中的汉字大多是扭曲、残缺或根本不存在的“伪汉字”，例如“践行”被写成“距行”，“什刹海”变成了无法辨认的乱码组合。此外，右上角面条碗中的筷子透视异常，像是直接插在碗缘而非自然放置。这些文字和细节的逻辑错误表明该图是由 AI 模仿人类排版生成，但不具备实际阅读功能。

注：图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图，后续我们将持续完善这部分的无障碍支持。

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该图像在视觉结构和风格层面完成度较高，S形时间线、节点形状配色、手绘插图、整体手账风格均基本符合提示词要求。然而，图像最致命的缺陷在于中文文字渲染质量极差——标题、时段标签、行程描述、地点名称、底部信息全部出现严重错别字和乱码，几乎没有一处文字能够正确传达提示词要求的内容。对于一张以文字信息为核心的路线图插画而言，文字准确性是最基础也是最重要的要求，而该图像在这一维度几乎完全失败。综合来看，图像「形似而神不似」——视觉框架搭建成功，但内容信息层面严重失真，实用价值极低。【GEMINI】这是一张在视觉设计、排版构图和色彩搭配上表现极佳，但在文字准确性上彻底失败的作品。图像完美捕捉了日系手账的精髓，节点形状和空间对应关系完全符合提示词要求。然而，作为核心信息的中文文本出现了大面积的错别字和乱码，导致其作为路线图的功能性完全丧失。这种「形似而神非」的表现是目前 AI 生成中文排版插画的典型短板。【KIMI】这是一张典型的「视觉风格过关、核心信息崩盘」的 AI 生成失败案例。画面在配色、插画风格、装饰元素上基本达到了日系手账的视觉效果，但文字层的全面崩溃使其作为「路线图」的功能完全丧失——用户无法从中读取任何有效的行程信息。这种「看起来像那么回事但完全不能用」的问题在文本生成图像中极为致命。模型似乎在处理结构化中文文本（尤其是包含竖线分隔符的三层信息格式）时出现了严重的编码或解码错误，导致几乎全部汉字被替换为形近乱码或完全无意义的字符。从专业评审角度，这张图像在「文字准确性」维度属于严重事故级别，必须给出极低分数以拉开模型差距。建议模型优化方向：强化中文文本的语义保持能力，特别是在结构化信息（时间｜描述｜地点）和长文本生成场景下的字符准确性。

基本信息

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

进阶难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

困难难度评测结果

模型生成产物

图片内容描述（由 AI 生成，供你参考）

AI 评审点评

相关链接

反馈评测问题