混元生图 3.0 在「操作教程三步总览信息图生成」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:混元生图 3.0
- 用例名称:操作教程三步总览信息图生成
- 测试类型:图像生成
- 评测维度:PPT 设计
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
生成一张 16:9 比例的操作教程总览信息图,插画风格,清爽配色。 画面要求: - 顶部居中显示大号中文标题「三步上手你的新工具」 - 画面中央横向排列三个圆形节点图标 - 三个节点下方分别对应中文说明:「安装登录」、「设置偏好」、「开始任务」 - 底部包含一行中文提示语 - 整体风格清爽简洁
任务要求
AI 模型需要满足以下要求:
- 画面比例为 16:9 横版
- 顶部居中有中文标题「三步上手你的新工具」
- 中央区域横向排列三个圆形节点图标
- 三个节点下方分别标注「安装登录」、「设置偏好」、「开始任务」
- 底部有中文提示语
评测结果
综合得分
该模型在此用例的得分为:67.5 分(满分 100 分),已通过
基础难度评测结果
- 得分:67.5 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张简洁的引导式说明卡片,背景为淡蓝色的圆角矩形,整体风格呈现出柔和的 3D 质感。画面顶部用醒目的黑色粗体字写着“三步上手你的新工具”。中间横向排列着三个圆形图标:左侧是黄色圆底上的记事本图标,中间是粉色圆底上的剪贴板图标,右侧是蓝色圆底上的心形信封图标。每个图标下方分别对应“安装登录”、“设置偏好”和“开始任务”三组黑色文字。画面底部有一行较小的文字,但存在明显的 AI 生成缺陷,文字内容扭曲变形,变成了无法辨认的乱码字符,且笔画交错模糊。此外,图标内部的细节线条略显生硬,部分阴影处理不够自然,呈现出典型的人工智能合成痕迹。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在结构布局和主要文字内容上基本完成了提示词要求,标题和三个节点说明文字均正确呈现,视觉风格清爽符合插画调性。然而,底部提示语出现严重乱码(「索哒的刹磁蕴了均着橹,」),这是AI中文文字生成的典型失败案例,直接导致文字准确性维度大幅失分。这一缺陷使整张信息图无法实际使用,是本次生成最核心的问题所在。 【GEMINI】这是一张视觉表现力较强但功能性严重受损的图像。虽然在插画风格、配色和基础布局上表现出色,但 AI 在处理长句中文文本(尤其是底部提示语)时出现了严重的幻觉,导致信息传达完全失效。对于信息图而言,文字准确性是核心,因此该图在实际应用中是不合格的。 【KIMI】该图像在核心信息架构上基本成立,但底部提示语的乱码属于不可接受的致命缺陷——这直接暴露了模型在中文生成上的底层缺陷(可能是tokenizer或后处理环节的问题)。视觉层面虽达到「清爽」基调,但投影逻辑混乱与图标精度参差显示出AI对三维空间一致性理解的薄弱。作为操作教程信息图,文字可读性是首要功能,底部乱码使其实际可用性归零,建议重新生成。
进阶难度评测结果
- 得分:72.8 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张以浅蓝色和白色为主色调的引导说明图,风格简洁。画面顶部有黑色的大标题“三步上手你的新工具”,下方有一条细横线。构图中心是三个水平排列的浅蓝色圆形图标,中间由向右的箭头连接。第一个图标是向下的下载箭头,下方配有文字“安装登录”;第二个图标是一个齿轮,下方文字为“设置偏好”;第三个图标是一枚斜向上飞行的火箭,下方文字为“开始任务”。画面底部还有一行总结性文字“立即开始,轻松上手”。 明显的 AI 生成缺陷在于文字处理:虽然大标题和主要步骤名称清晰可读,但在三个步骤名称的正下方,各有一行灰色的小字,这些小字全是无法辨认的乱码和扭曲的虚假汉字,属于典型的 AI 文本生成错误。此外,中间齿轮图标的内部轮廓略显不对称,右侧火箭图标的线条边缘也存在轻微的像素模糊感。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在整体布局、图标选择、主要文字和视觉风格上表现良好,基本完成了提示词的核心要求。然而,三处副文字描述全部呈现为不可读的乱码伪汉字,这是一个严重且系统性的缺陷——副文字是提示词明确要求的内容,三处全部失败意味着该功能完全未能实现。这一问题将文字准确性维度拉低至不及格水平,也影响了整体评价。若副文字能正确生成,该图像可达到较高水准;目前因乱码问题,整体完成度打折明显。 【GEMINI】该图像在视觉设计、布局构图和图标表达上表现优秀,具备极高的专业感。然而,在文字生成能力上存在致命缺陷,所有副标题均生成了不可用的乱码,导致其作为信息图的核心功能完全丧失,无法直接投入使用。 【KIMI】该图像在宏观布局与核心文字上基本达标,但副文字的完全崩坏是致命缺陷——作为教程信息图,用户无法读取任何补充说明,功能层面严重失败。图标风格的内部不一致与扁平风格的执行偏差进一步拉低专业度。模型在「生成看起来像文字的乱码」这一AI典型问题上暴露明显,需重点优化文本生成与布局约束的联动机制。
困难难度评测结果
- 得分:72.8 分
- 通过状态:已通过
模型生成产物
该模型生成了以下图片:
图片内容描述(由 AI 生成,供你参考)
图中展示了一张以浅蓝色为背景的软件操作指南海报。画面上方有醒目的黑色标题“三步上手你的新工具”,下方配有副标题。主体部分是一个白色圆角矩形框,内部横向排列着三个蓝色圆形图标,分别代表三个步骤:第一步是带有下载箭头的背包形状,标注为“安装登录”;第二步是齿轮形状,标注为“设置偏好”;第三步是火箭形状,标注为“开始任务”。图标之间由虚线箭头连接,整体风格简约现代。然而,画面中存在明显的 AI 生成缺陷:在三个主要标题下方的说明文字均为无法辨认的乱码字符,看起来像是由破碎的汉字笔画随机组合而成,完全没有实际含义。此外,左下角的品牌标志“Rosita”文字略显生硬,右下角的“立即开始”旁边的箭头与文字间距略有不自然。
注:图片内容暂不支持屏幕阅读器朗读。您可通过上方链接在浏览器中查看原图,后续我们将持续完善这部分的无障碍支持。
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该图像在整体布局结构、图标设计、流程细节和视觉风格方面完成度较高,基本符合提示词的主要要求。然而最致命的缺陷在于三个节点下方的描述小字全部为无意义乱码,这是AI生成中文图像的典型失败点,严重损害了信息图的实用价值和专业性。若描述小字能够正确呈现,整体评分将大幅提升。 【GEMINI】这是一张视觉表现力优秀但功能性严重缺失的图像。作为信息图,它成功构建了美观的框架,但在核心的文字传达上完全失败。AI模型目前仍无法处理长段落的准确文本生成,导致该图仅能作为视觉素材使用,无法作为实际的操作教程。 【KIMI】本图在视觉框架上接近提示词要求,但「文字准确性」维度的彻底失败使其作为「信息图」的功能归零。AI生成伪文字是流程类图表的致命缺陷,用户无法获取任何操作指导信息。尽管布局与图标基本合格,但核心信息载体的失效导致整体质量大幅下滑。建议在模型训练中强化中文文本渲染的约束机制,或采用已验证的文本嵌入方案。
相关链接
您可以通过以下链接查看更多相关内容: