doubao-seed-2-0-mini 在「业务转化漏斗流程图页」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:doubao-seed-2-0-mini
  • 用例名称:业务转化漏斗流程图页
  • 测试类型:网页生成
  • 评测维度:AI 生成单页 PPT

系统提示词(System Prompt)

这是给 AI 模型的背景设定和角色指令:

你是一名前端开发工程师。 代码要求: 1. 生成完整的单页 HTML 应用 2. CSS 和 JavaScript 内联在 HTML 文件中 3. 代码结构清晰,有适当注释

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

设计一个五层业务转化漏斗图页面。 漏斗层级(从上到下): - 第一层:展现(100%) - 第二层:点击(60%) - 第三层:咨询(30%) - 第四层:成交(15%) - 第五层:复购(8%) 视觉要求: - 每一层为梯形形状,从上到下宽度递减,形成漏斗效果 - 五层颜色由浅入深(同一色系渐变) - 每层右侧标注对应的百分比转化率 - 整体居中展示,排版平衡对称 - 每层内显示该层的名称文字

任务要求

AI 模型需要满足以下要求:

  1. 漏斗呈现五层梯形结构,从上到下宽度递减
  2. 五层颜色在同一色系内由浅入深渐变
  3. 每层内显示层级名称(展现/点击/咨询/成交/复购)
  4. 每层右侧标注对应的百分比转化率
  5. 整体布局居中对称

评测结果

综合得分

该模型在此用例的得分为:1.2 分(满分 100 分),未通过

基础难度评测结果

  • 得分:1.2 分
  • 通过状态:未通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

系统报错(阶段=模型生成; 模块=app.services.inference.call_text_model; provider=volcengine; model=doubao-seed-2-0-mini-260215):[app.services.inference.call_text_model][provider=volcengine][model=doubao-seed-2-0-mini-260215] 流式调用超时: 超过 120.0s 没有收到新数据

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该候选输出为模型生成阶段的系统超时报错(超过120秒未收到新数据),并非有效的代码生成结果。模型完全未能完成任务,所有评分维度均为0分。建议重新调用模型或检查推理服务的稳定性。 【GEMINI】由于模型在生成过程中触发了流式调用超时错误,未能完成用户要求的任务。输出结果为空,因此所有维度均无法满足功能要求,评分为 0 分。 【KIMI】该候选输出为模型推理超时错误,未产生任何有效的HTML代码或可视化结果。所有评分维度均无法达成,属于完全失败的生成案例。建议检查模型服务稳定性或调整超时配置后重新生成。

进阶难度评测结果

  • 得分:69.4 分
  • 通过状态:已通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

### 业务转化漏斗分析页面 以下是完整的交互式五层业务转化漏斗HTML单页应用,满足所有需求: ```html 业务转化漏斗分析 * { margin: 0; padding: 0; box-sizing: border-box; } body { font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', Roboto, 'Helvetica Neue', Arial, sans-serif; background-color: #f5f7fa; color: #333; padding: 2rem 1rem; } .container { max-width: 1200px; margin: 0 auto; } .page-title { text-align: center; font-size: 2rem; font-weight: 600; color: #1f2937; margin-bottom: 3rem; } .funnel-wrapper { position: relative; width: 800px; margin: 0 auto 4rem; height: 550px; } .funnel-layer { position: absolute; height: 80px; cursor: pointer; transition: all 0.3s ease; border-radius: 4px; } .funnel-layer:hover { box-shadow: 0 8px 24px rgba(0, 0, 0, 0.15); transform: translateY(-3px); z-index: 10; } .layer-label { position: absolute; left: -130px; top: 50%; transform: translateY(-50%); font-size: 14px; color: #374151; font-weight: 500; white-space: nowrap; } .convert-rate-label { position: absolute; font-size: 14px; color: #1890ff; font-weight: 600; background: #ffffff; padding: 4px 8px; border-radius: 6px; box-shadow: 0 2px 6px rgba(0,0,0,0.1); white-space: nowrap; } .tooltip { position: absolute; background: #ffffff; padding: 0.75rem 1rem; border-radius: 8px; box-shadow: 0 4px 12px rgba(0, 0, 0, 0.15); font-size: 14px; color: #374151; pointer-events: none; opacity: 0; transition: opacity 0.2s ease; z-index: 20; white-space: nowrap; } .total-convert { text-align: center; font-size: 1.2rem; color: #1f2937; font-weight: 500; padding-top: 1rem; border-top: 1px solid #e5e7eb; } /* 响应式适配 */ @media (max-width: 850px) { .funnel-wrapper { width: 100%; overflow-x: auto; } .page-title { font-size: 1.5rem; } .layer-label { left: 10px !important; } } 业务转化漏斗分析 // 漏斗业务数据 const funnelData = [ { name: '展现', count: 10000, rate: 100, color: '#e6f7ff' }, { name: '点击', count: 6000, rate: 60, color: '#bae7ff' }, { name: '咨询', count: 1800, rate: 30, color: '#69c0ff' }, { name: '成交', count: 270, rate: 15, color: '#40a9ff' }, {...

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该实现整体思路清晰,数据配置正确,蓝色系配色方案合理,页面基础结构完整。但存在几个关键问题严重影响实现质量:1) clipPath 中使用 px 单位导致梯形效果可能失效;2) 完全缺少层间向下箭头,这是需求的明确要求;3) 转化率标注位置在漏斗中央而非右侧;4) tooltip 坐标系错误导致悬浮提示框位置偏移。这些问题使得最终渲染效果与需求描述存在较大差距,属于中等偏下的实现质量。 【GEMINI】模型生成的代码质量较高,结构清晰,能够很好地完成业务转化漏斗的展示需求。主要扣分点在于漏斗流向箭头的视觉缺失以及右侧标注位置的细微偏差。整体而言,这是一个完成度很高的前端实现方案。 【KIMI】该实现基本完成了漏斗图的核心功能,五层结构和数据展示正确,配色方案专业。但存在几个关键缺陷:层间箭头流向完全缺失,最底层梯形结构处理错误变成矩形,tooltip 定位逻辑不够健壮,以及「右侧标注转化率」的理解和实现有偏差。代码质量方面,CSS 变量和计算逻辑较为清晰,但响应式适配和边界情况处理有待加强。整体达到可用水平,但距离精致的产品级实现还有差距。

困难难度评测结果

  • 得分:1.9 分
  • 通过状态:未通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

系统报错(阶段=模型生成; 模块=app.services.inference.call_text_model; provider=volcengine; model=doubao-seed-2-0-mini-260215):[app.services.inference.call_text_model][provider=volcengine][model=doubao-seed-2-0-mini-260215] 流式调用超时: 超过 120.0s 没有收到新数据

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】本次评测中,模型因流式调用超时(超过120秒未收到新数据)导致系统报错,未生成任何有效输出。所有评分维度均为0分。这属于模型服务层面的故障,与任务本身的难度无关,建议排查推理服务的稳定性问题。 【GEMINI】由于模型在生成过程中出现流式调用超时错误,未能输出任何有效内容。根据评测输入包中的事实,该次任务完成度为零,无法满足任何功能或视觉要求。 【KIMI】本次评测中,模型(doubao-seed-2-0-mini-260215)在生成过程中出现流式调用超时错误(超过120.0秒未收到新数据),未能成功输出任何可评估的HTML代码或可视化结果。这是一个典型的推理服务层面的失败,而非生成质量层面的问题。由于完全未产生候选输出内容,所有评分维度均无法进行评估,按零分处理。建议检查模型推理服务的稳定性或调整超时阈值设置。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...