Meta: Llama 3.3 70B Instruct 在「多维数据可视化综合分析页」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:Meta: Llama 3.3 70B Instruct
  • 用例名称:多维数据可视化综合分析页
  • 测试类型:网页生成
  • 评测维度:AI 生成单页 PPT

系统提示词(System Prompt)

这是给 AI 模型的背景设定和角色指令:

你是一名前端开发工程师。 代码要求: 1. 生成完整的单页 HTML 应用 2. CSS 和 JavaScript 内联在 HTML 文件中 3. 使用 Canvas 或 SVG 绘制图表,也可引用 CDN 图表库 4. 代码结构清晰,有适当注释

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

创建一个数据可视化分析页面。 布局要求: - 页面左侧展示一个环形饼图,用于展示各类别的占比数据 - 页面右侧展示一个折线图,用于展示某项指标的趋势变化 - 页面底部有一段简短的文字结论,总结图表所呈现的数据洞察 数据要求: - 环形饼图包含至少 4 个类别,数据自拟(如各部门费用占比) - 折线图包含至少 6 个时间节点的数据 视觉要求: - 两个图表的配色方案需统一,整体风格符合专业报告的审美标准 - 页面有清晰的标题

任务要求

AI 模型需要满足以下要求:

  1. 页面左侧正确渲染环形饼图,包含至少 4 个类别及图例
  2. 页面右侧正确渲染折线图,包含至少 6 个数据点
  3. 页面底部有文字结论区域
  4. 两个图表配色统一,整体风格专业
  5. 代码在单个 HTML 文件中,可直接运行

评测结果

综合得分

该模型在此用例的得分为:55.7 分(满分 100 分),未通过

基础难度评测结果

  • 得分:55.7 分
  • 通过状态:未通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

```html 数据可视化分析报告 /* 全局样式 */ body { font-family: Arial, sans-serif; margin: 0; padding: 0; } /* 容器样式 */ .container { width: 80%; margin: 40px auto; display: flex; flex-direction: column; align-items: center; } /* 标题样式 */ .title { font-size: 24px; font-weight: bold; margin-bottom: 20px; } /* 图表容器样式 */ .chart-container { display: flex; justify-content: space-between; margin-bottom: 20px; } /* 环形饼图容器样式 */ .pie-chart-container { width: 45%; } /* 折线图容器样式 */ .line-chart-container { width: 45%; } /* 结论样式 */ .conclusion { font-size: 18px; text-align: center; } 数据可视化分析报告 根据图表数据,我们可以看出各部门的费用占比和某项指标的趋势变化。这些数据为我们的决策提供了有价值的参考。 // 环形饼图数据 const pieChartData = { labels: ['部门1', '部门2', '部门3', '部门4'], datasets: [{ label: '费用占比', data: [25, 30, 20, 25], backgroundColor: [ 'rgba(255, 99, 132, 0.2)', 'rgba(54, 162, 235, 0.2)', 'rgba(255, 206, 86, 0.2)', 'rgba(75, 192, 192, 0.2)' ], borderColor: [ 'rgba(255, 99, 132, 1)', 'rgba(54, 162, 235, 1)', 'rgba(255, 206, 86, 1)', 'rgba(75, 192, 192, 1)' ], borderWidth: 1 }] }; // 折线图数据 const lineChartData = { labels: ['2022-01', '2022-02', '2022-03', '2022-04', '2022-05', '2022-06'], datasets: [{ label: '某项指标', data: [10, 20, 15, 30, 25, 20], backgroundColor: [ 'rgba(255, 99, 132, 0.2)', 'rgba(54, 162, 235, 0.2)', 'rgba(255, 206, 86, 0.2)', 'rgba(75, 192, 192, 0.2)', 'rgba(153, 102, 255, 0.2)', 'rgba(255, 159, 64, 0.2)' ], borderColor: [ 'rgba(255, 99, 132, 1)', 'rgba(54, 162, 235, 1)', 'rgba(255, 206, 86, 1)', 'rgba(75, 192, 192, 1)', 'rgba(153, 102, 255, 1)', 'rgba(255, 159, 64, 1)' ], borderWidth: 1 }] }; // 创建环形饼图 const pieChart = new Chart(document.getElementById('pie-chart'), { type: 'pie', data: pieChartData, options: { responsive: true, } }); // 创建折线图 const lineChart = new Chart(document.getElementById('line-chart'), { type: 'line', data: lineChartData, options: { responsive: true, } }); ```

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该代码实现了基本的数据可视化页面框架,能够引用 Chart.js 库并创建图表,代码结构基本清晰。但存在几个明显问题:最关键的是将环形饼图实现为普通饼图(type: 'pie' 而非 'doughnut'),不符合需求;折线图的颜色配置方式错误(多色数组不适用于折线图);两图表配色方案不统一;页面整体视觉风格较为简陋,不符合专业报告审美标准;结论文字缺乏具体数据洞察。整体来看,代码能够运行但质量偏低,需要在图表类型正确性、配色统一性和视觉专业性方面进行较大改进。 【GEMINI】模型高质量地完成了任务,代码可运行性强,布局逻辑清晰。主要扣分点在于图表类型的细微偏差(饼图 vs 环形图)以及配色方案在专业性上的进一步优化空间。 【KIMI】该代码基本实现了数据可视化页面的框架,但在核心功能细节上存在明显偏差:环形饼图未正确配置为doughnut类型,折线图配色方案与饼图完全不统一且不符合折线图的数据表达逻辑。配色统一性是本次评测的重点要求,但实现效果不佳。建议修正图表类型配置,统一两图表的配色方案(如使用同一套主题色),并增强专业报告的视觉细节(如添加数据标签、优化图例、增加网格线等)。

进阶难度评测结果

  • 得分:60.2 分
  • 通过状态:已通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

```html 数据可视化分析页面 body { font-family: Arial, sans-serif; margin: 0; padding: 0; background-color: #f0f0f0; } .container { max-width: 1280px; margin: 40px auto; padding: 20px; background-color: #fff; border: 1px solid #ddd; border-radius: 10px; box-shadow: 0 0 10px rgba(0, 0, 0, 0.1); } .header { display: flex; justify-content: space-between; align-items: center; margin-bottom: 20px; } .header h1 { font-size: 24px; font-weight: bold; margin: 0; } .header .update-time { font-size: 14px; color: #666; } .content { display: flex; justify-content: space-between; } .left { width: 45%; margin-right: 20px; } .right { width: 55%; } .footer { margin-top: 20px; padding: 20px; background-color: #f9f9f9; border: 1px solid #ddd; border-radius: 10px; } .footer p { font-size: 14px; color: #666; margin-bottom: 10px; } 数据可视化分析页面 数据更新时间:2023-02-20 14:30:00 按季度 按月 关键洞察1:销售额呈上升趋势,近12个月增长了20%。 关键洞察2:渠道A占比最高,达到了30%。 关键洞察3:近3个月销售额增长最快,增长率达到了15%。 // 环形饼图数据 var pieData = [ { value: 30, name: '渠道A' }, { value: 20, name: '渠道B' }, { value: 15, name: '渠道C' }, { value: 35, name: '渠道D' } ]; // 折线图数据 var lineData = { month: [ { value: 100, month: '2022-01' }, { value: 120, month: '2022-02' }, { value: 150, month: '2022-03' }, { value: 180, month: '2022-04' }, { value: 200, month: '2022-05' }, { value: 220, month: '2022-06' }, { value: 250, month: '2022-07' }, { value: 280, month: '2022-08' }, { value: 300, month: '2022-09' }, { value: 320, month: '2022-10' }, { value: 350, month: '2022-11' }, { value: 380, month: '2022-12' } ], quarter: [ { value: 300, quarter: '2022-Q1' }, { value: 400, quarter: '2022-Q2' }, { value: 500, quarter: '2022-Q3' }, { value: 600, quarter: '2022-Q4' } ] }; // 初始化环形饼图 var pieChart = echarts.init(document.getElementById('pie-chart')); pieChart.setOption({ tooltip: { trigger: 'item' }, series: [ { type: 'pie', data: pieData, radius: ['40%', '70%'] } ] }); // 初始化折线图 var lineChart = echarts.init(document.getElementById('line-chart')); lineChart.setOption({ tooltip: {...

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该候选输出实现了基本的页面结构和图表功能,使用ECharts完成了环形饼图和折线图的渲染,并实现了按季度/按月切换功能。但整体质量偏低:配色方案未统一为商务蓝绿色系,视觉设计较为简陋;环形饼图缺少图例组件导致图例交互缺失;最关键的是底部数据结论与图表实际数据存在明显错误(渠道D占比最高却写渠道A,增长率计算严重偏差),影响了数据可信度。代码结构清晰,但在专业性和细节完善度上有较大提升空间。 【GEMINI】模型完成了一个基础的单页数据可视化应用,代码结构规范,能够正常运行。但在功能实现上存在明显的遗漏,特别是交互性要求(图例切换、详细悬停信息)未完全满足。视觉设计上较为平庸,未能充分体现「专业数据报告风格」的视觉要求。 【KIMI】该实现完成了基础功能框架,但细节打磨不足。主要问题:饼图缺失图例交互、配色方案未按要求的商务蓝绿色系执行、数据结论与图表实际数值存在明显偏差。代码结构清晰,ECharts使用正确,但视觉设计和数据准确性需要提升。建议在配色统一性、图例完整性、以及结论数据校验方面改进。

困难难度评测结果

  • 得分:32.9 分
  • 通过状态:未通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

以下是一个基本的 HTML 结构和 CSS 样式,使用 ECharts 库来生成图表。 JavaScript 代码使用模块化的方式组织,逻辑清晰易于维护。 ```html 销售分析报告 /* 全局样式 */ body { font-family: Arial, sans-serif; margin: 0; padding: 0; background-color: #f0f0f0; transition: background-color 0.3s; } .dark-mode { background-color: #333; color: #fff; } /* 顶部导航栏 */ .nav-bar { display: flex; justify-content: space-between; align-items: center; padding: 10px; background-color: #333; color: #fff; } .nav-bar select { margin-left: 10px; } /* 中部内容 */ .main-content { display: flex; flex-direction: row; padding: 20px; } .left-chart { width: 40%; margin-right: 20px; } .right-chart { width: 60%; } /* KPI 卡片 */ .kpi-card { display: flex; flex-direction: row; justify-content: space-between; margin-top: 20px; } .kpi-card div { width: 25%; background-color: #fff; padding: 10px; border: 1px solid #ddd; border-radius: 5px; box-shadow: 0 0 10px rgba(0, 0, 0, 0.1); } /* 底部结论区域 */ .conclusion { padding: 20px; background-color: #f0f0f0; border-top: 1px solid #ddd; } .conclusion ul { list-style: none; padding: 0; margin: 0; } .conclusion li { margin-bottom: 10px; } .conclusion i { font-size: 18px; margin-right: 10px; } 销售分析报告 近 3 个月 近 6 个月 近 12 个月 一键导出 总销售额:0 总订单量:0 客单价:0 同比增长率:0 销售额同比增长 10% 订单量同比增长 15% 客单价同比增长 5% // JavaScript 代码 const timeRangeSelect = document.getElementById('time-range'); const exportBtn = document.getElementById('export-btn'); const pieChart = document.getElementById('pie-chart'); const lineChart = document.getElementById('line-chart'); const totalSalesValue = document.getElementById('total-sales-value'); const totalOrdersValue = document.getElementById('total-orders-value'); const avgOrderValueValue = document.getElementById('avg-order-value-value'); const growthRateValue = document.getElementById('growth-rate-value'); // 初始化图表 const pieChartOption = { tooltip: { trigger: 'item' }, series: [ { type: 'pie', data: [ { value: 100, name: '线上自营' }, { value: 200, name: '平台电商' }, { value: 300, name: '线下门店' }, { value: 400, name: '分销代理' } ]...

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【CLAUDE】该输出与任务要求差距极大,仅实现了最基础的页面骨架和部分图表初始化,核心功能(图表联动、主题切换、KPI动画、环形饼图中心数字、响应式布局)均未实现。代码以转义HTML形式输出,无法直接运行。整体而言,这是一个功能严重不完整的初级示例,距离「功能完善的多维数据可视化综合分析页面」要求相差甚远,仅达到概念验证级别。 【GEMINI】模型生成的代码未能满足大部分核心功能需求。最严重的问题在于 ECharts 容器未设置高度导致图表无法渲染,且需求中明确要求的「图表联动」、「主题切换」、「数字滚动动画」等关键交互功能均未实现。代码仅完成了最基础的框架搭建,距离专业 BI 仪表盘的交付标准有很大差距。 【KIMI】该候选输出为一个极其基础的Demo级别代码,仅完成了约30%的需求功能。核心缺陷包括:主题切换、图表联动、KPI动画三大关键功能完全缺失;布局结构错误(KPI卡片位置不符);数据逻辑粗糙且自相矛盾;视觉设计简陋,远未达到专业BI报告标准。代码虽能运行,但模块化程度低,维护性差。建议重新实现,重点补足:1)添加主题切换按钮及ECharts主题适配;2)实现饼图点击联动筛选功能;3)使用requestAnimationFrame实现KPI数字滚动动画;4)重构数据生成逻辑,确保时间范围与数据合理性;5)采用CSS Grid优化布局结构。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...