doubao-seed-2-0-pro 在「项目成果案例展示画廊页」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

模型名称：doubao-seed-2-0-pro
用例名称：项目成果案例展示画廊页
测试类型：网页生成
评测维度：AI 生成单页 PPT

系统提示词（System Prompt）

这是给 AI 模型的背景设定和角色指令：

你是一名前端开发工程师。代码要求： 1. 生成完整的单页 HTML 应用 2. CSS 和 JavaScript 内联在 HTML 文件中 3. 代码结构清晰，有适当注释

用户提示词（User Prompt）

这是用户给 AI 模型的具体任务要求：

创建一个项目成果案例展示卡片页面。布局要求： - 采用「左图右文」的水平布局 - 左侧展示一张大尺寸项目实景图，图片带圆角样式 - 右侧展示项目的文字信息，包含以下四项内容： - 项目名称（标题） - 挑战（Challenge） - 解决方案（Solution） - 最终成果（Result） - 右下角放置一个醒目的「Success Case」标签内容要求： - 使用一个虚构的建筑/工程类项目作为示例内容 - 图片可使用占位图（如 picsum.photos 或纯色背景） - 页面整体简洁清晰即可

任务要求

AI 模型需要满足以下要求：

页面采用左图右文的水平布局，结构正确
左侧图片有圆角样式，尺寸较大
右侧包含项目名称、挑战、解决方案、最终成果四项文字内容
右下角有「Success Case」标签且视觉醒目
代码在单个 HTML 文件中，可正常渲染

评测结果

综合得分

该模型在此用例的得分为：93.5 分（满分 100 分），已通过

基础难度评测结果

得分：93.5 分
通过状态：已通过

模型生成产物

以下是该模型针对此任务的实际生成内容：

```html 项目成果案例展示 /* 全局样式重置 */ * { margin: 0; padding: 0; box-sizing: border-box; font-family: system-ui, -apple-system, sans-serif; } /* 页面背景 */ body { background-color: #f8fafc; padding: 40px 20px; } /* 卡片容器 */ .case-card { max-width: 1100px; margin: 0 auto; display: flex; background-color: #ffffff; border-radius: 16px; overflow: hidden; box-shadow: 0 10px 40px rgba(0, 0, 0, 0.08); transition: all 0.3s ease; } /* 卡片 hover 交互效果 */ .case-card:hover { transform: translateY(-4px); box-shadow: 0 15px 50px rgba(0, 0, 0, 0.12); } /* 左侧图片区域 */ .card-image { flex: 1; min-height: 600px; } .card-image img { width: 100%; height: 100%; object-fit: cover; } /* 右侧内容区域 */ .card-content { flex: 1.2; padding: 48px; display: flex; flex-direction: column; gap: 28px; position: relative; } /* 项目标题样式 */ .project-title { font-size: 2rem; font-weight: 700; color: #0f172a; line-height: 1.3; margin-bottom: 8px; } /* 内容模块通用样式 */ .content-block h3 { font-size: 1.25rem; font-weight: 600; color: #1e293b; margin-bottom: 12px; display: flex; align-items: center; gap: 8px; } .content-block p { font-size: 1rem; color: #475569; line-height: 1.7; } /* 成功案例标签 */ .success-badge { position: absolute; bottom: 32px; right: 32px; background-color: #ea580c; color: #ffffff; padding: 8px 20px; border-radius: 24px; font-size: 0.9rem; font-weight: 600; box-shadow: 0 4px 12px rgba(234, 88, 12, 0.3); } /* 响应式适配：移动端改为上下布局 */ @media (max-width: 768px) { .case-card { flex-direction: column; } .card-image { min-height: 300px; } .card-content { padding: 32px 24px; } .project-title { font-size: 1.6rem; } .success-badge { position: static; margin-top: 16px; align-self: flex-end; } } 杭州滨江智慧谷城市更新项目 🔍 挑战项目位于钱塘江畔老工业区，需同时满足50年一遇防洪标准、历史工业遗存保护与现代商务办公需求；工期仅18个月，需协调多专业同步作业；要求达到绿色建筑三星标准，碳排放较常规项目降低40%。 💡 解决方案采用“外立面保留+内部结构重构”方案，保留3处原有工业厂房标志性结构，植入模块化办公空间；搭建BIM全生命周期管理平台，实现多专业协同，压缩工期20%；整合海绵城市系统、光伏屋面与智能能耗管理系统，实现超低能耗运营。 ✅ 最终成果项目2023年顺利竣工，荣获国家绿色建筑三星认证、浙江省城市更新优秀案例奖，目前园区企业入驻率达96%，年碳减排量超1200吨，成为杭州滨江产业升级的标志性节点。 Success Case ```

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】该生成结果整体质量优秀，完整实现了左图右文布局、四项文字内容及醒目的 Success Case 标签，代码结构清晰、注释完善，视觉设计专业美观。细节处理（hover 效果、响应式适配、emoji 图标层次）体现了较高的前端开发水准。唯一轻微不足是图片圆角通过父容器 overflow:hidden 间接实现而非图片自身设置，与「图片带圆角样式」的表述略有差异，但实际视觉效果符合预期。整体是一份高质量的实现。【GEMINI】模型表现非常出色，不仅严格遵循了所有功能性指令，还在视觉设计和代码健壮性上做了额外优化。生成的代码结构清晰，注释到位，是一个高质量的前端开发示例。【KIMI】该生成结果是一份高质量的前端代码实现，完全满足所有功能要求。布局结构专业，采用现代 CSS 技术（flexbox、响应式设计、过渡动画）；内容完整且贴合建筑/工程类项目场景；视觉设计简洁大气，具有良好的用户体验。代码结构清晰、注释适当，体现了专业前端开发工程师的水平。

进阶难度评测结果

得分：1.2 分
通过状态：未通过

模型生成产物

以下是该模型针对此任务的实际生成内容：

系统报错（阶段=模型生成; 模块=app.services.inference.call_text_model; provider=volcengine; model=doubao-seed-2-0-pro-260215）：[app.services.inference.call_text_model][provider=volcengine][model=doubao-seed-2-0-pro-260215] 流式调用超时: 超过 120.0s 没有收到新数据

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】本次评测中，模型因流式调用超时（超过120秒未收到新数据）导致系统报错，未能生成任何有效的HTML代码输出。所有评分维度均为0分，属于完全失败的生成结果，与任务要求完全不符。【GEMINI】由于模型在生成过程中出现系统超时错误（流式调用超时），未能提供任何代码输出，因此无法完成对项目实景图与文字说明的图文混排能力测试，各维度均评为 0 分。【KIMI】本次评测中，模型（doubao-seed-2-0-pro-260215）在生成过程中出现流式调用超时错误，超过 120 秒未收到新数据，导致完全未输出任何 HTML 代码。所有评分维度的要求均未实现，属于生成失败案例。建议检查模型服务稳定性或优化生成任务的复杂度配置。

困难难度评测结果

得分：1.2 分
通过状态：未通过

模型生成产物

以下是该模型针对此任务的实际生成内容：

系统报错（阶段=模型生成; 模块=app.services.inference.call_text_model; provider=volcengine; model=doubao-seed-2-0-pro-260215）：[app.services.inference.call_text_model][provider=volcengine][model=doubao-seed-2-0-pro-260215] 流式调用超时: 超过 120.0s 没有收到新数据

AI 评审点评

以下是 AI 评审对该模型输出的点评：

【CLAUDE】本次评测中，模型因流式调用超时（超过120秒未收到新数据）导致生成失败，候选输出仅为系统报错信息，未产生任何有效的HTML/CSS/JavaScript代码。所有评分维度均为0分，任务完全未完成。【GEMINI】由于模型在生成过程中出现「流式调用超时」错误，未能产出任何代码内容。该次评测无法进行，模型未能完成任务要求。【KIMI】本次评测中，模型（doubao-seed-2-0-pro-260215）在生成过程中发生流式调用超时错误，超过120秒未返回任何有效数据，导致完全未生成符合要求的单页HTML应用。所有评分维度的要求均未得到满足，属于完全失败的生成结果。建议检查模型服务稳定性或优化提示词长度与复杂度。

基本信息

系统提示词（System Prompt）

用户提示词（User Prompt）

任务要求

评测结果

综合得分

基础难度评测结果

模型生成产物

AI 评审点评

进阶难度评测结果

模型生成产物

AI 评审点评

困难难度评测结果

模型生成产物

AI 评审点评

相关链接

反馈评测问题