doubao-seed-2-0-pro 在「项目成果案例展示画廊页」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:doubao-seed-2-0-pro
- 用例名称:项目成果案例展示画廊页
- 测试类型:网页生成
- 评测维度:AI 生成单页 PPT
系统提示词(System Prompt)
这是给 AI 模型的背景设定和角色指令:
你是一名前端开发工程师。 代码要求: 1. 生成完整的单页 HTML 应用 2. CSS 和 JavaScript 内联在 HTML 文件中 3. 代码结构清晰,有适当注释
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
创建一个项目成果案例展示卡片页面。 布局要求: - 采用「左图右文」的水平布局 - 左侧展示一张大尺寸项目实景图,图片带圆角样式 - 右侧展示项目的文字信息,包含以下四项内容: - 项目名称(标题) - 挑战(Challenge) - 解决方案(Solution) - 最终成果(Result) - 右下角放置一个醒目的「Success Case」标签 内容要求: - 使用一个虚构的建筑/工程类项目作为示例内容 - 图片可使用占位图(如 picsum.photos 或纯色背景) - 页面整体简洁清晰即可
任务要求
AI 模型需要满足以下要求:
- 页面采用左图右文的水平布局,结构正确
- 左侧图片有圆角样式,尺寸较大
- 右侧包含项目名称、挑战、解决方案、最终成果四项文字内容
- 右下角有「Success Case」标签且视觉醒目
- 代码在单个 HTML 文件中,可正常渲染
评测结果
综合得分
该模型在此用例的得分为:93.5 分(满分 100 分),已通过
基础难度评测结果
- 得分:93.5 分
- 通过状态:已通过
模型生成产物
以下是该模型针对此任务的实际生成内容:
```html 项目成果案例展示 /* 全局样式重置 */ * { margin: 0; padding: 0; box-sizing: border-box; font-family: system-ui, -apple-system, sans-serif; } /* 页面背景 */ body { background-color: #f8fafc; padding: 40px 20px; } /* 卡片容器 */ .case-card { max-width: 1100px; margin: 0 auto; display: flex; background-color: #ffffff; border-radius: 16px; overflow: hidden; box-shadow: 0 10px 40px rgba(0, 0, 0, 0.08); transition: all 0.3s ease; } /* 卡片 hover 交互效果 */ .case-card:hover { transform: translateY(-4px); box-shadow: 0 15px 50px rgba(0, 0, 0, 0.12); } /* 左侧图片区域 */ .card-image { flex: 1; min-height: 600px; } .card-image img { width: 100%; height: 100%; object-fit: cover; } /* 右侧内容区域 */ .card-content { flex: 1.2; padding: 48px; display: flex; flex-direction: column; gap: 28px; position: relative; } /* 项目标题样式 */ .project-title { font-size: 2rem; font-weight: 700; color: #0f172a; line-height: 1.3; margin-bottom: 8px; } /* 内容模块通用样式 */ .content-block h3 { font-size: 1.25rem; font-weight: 600; color: #1e293b; margin-bottom: 12px; display: flex; align-items: center; gap: 8px; } .content-block p { font-size: 1rem; color: #475569; line-height: 1.7; } /* 成功案例标签 */ .success-badge { position: absolute; bottom: 32px; right: 32px; background-color: #ea580c; color: #ffffff; padding: 8px 20px; border-radius: 24px; font-size: 0.9rem; font-weight: 600; box-shadow: 0 4px 12px rgba(234, 88, 12, 0.3); } /* 响应式适配:移动端改为上下布局 */ @media (max-width: 768px) { .case-card { flex-direction: column; } .card-image { min-height: 300px; } .card-content { padding: 32px 24px; } .project-title { font-size: 1.6rem; } .success-badge { position: static; margin-top: 16px; align-self: flex-end; } } 杭州滨江智慧谷城市更新项目 🔍 挑战 项目位于钱塘江畔老工业区,需同时满足50年一遇防洪标准、历史工业遗存保护与现代商务办公需求;工期仅18个月,需协调多专业同步作业;要求达到绿色建筑三星标准,碳排放较常规项目降低40%。 💡 解决方案 采用“外立面保留+内部结构重构”方案,保留3处原有工业厂房标志性结构,植入模块化办公空间;搭建BIM全生命周期管理平台,实现多专业协同,压缩工期20%;整合海绵城市系统、光伏屋面与智能能耗管理系统,实现超低能耗运营。 ✅ 最终成果 项目2023年顺利竣工,荣获国家绿色建筑三星认证、浙江省城市更新优秀案例奖,目前园区企业入驻率达96%,年碳减排量超1200吨,成为杭州滨江产业升级的标志性节点。 Success Case ```
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该生成结果整体质量优秀,完整实现了左图右文布局、四项文字内容及醒目的 Success Case 标签,代码结构清晰、注释完善,视觉设计专业美观。细节处理(hover 效果、响应式适配、emoji 图标层次)体现了较高的前端开发水准。唯一轻微不足是图片圆角通过父容器 overflow:hidden 间接实现而非图片自身设置,与「图片带圆角样式」的表述略有差异,但实际视觉效果符合预期。整体是一份高质量的实现。 【GEMINI】模型表现非常出色,不仅严格遵循了所有功能性指令,还在视觉设计和代码健壮性上做了额外优化。生成的代码结构清晰,注释到位,是一个高质量的前端开发示例。 【KIMI】该生成结果是一份高质量的前端代码实现,完全满足所有功能要求。布局结构专业,采用现代 CSS 技术(flexbox、响应式设计、过渡动画);内容完整且贴合建筑/工程类项目场景;视觉设计简洁大气,具有良好的用户体验。代码结构清晰、注释适当,体现了专业前端开发工程师的水平。
进阶难度评测结果
- 得分:1.2 分
- 通过状态:未通过
模型生成产物
以下是该模型针对此任务的实际生成内容:
系统报错(阶段=模型生成; 模块=app.services.inference.call_text_model; provider=volcengine; model=doubao-seed-2-0-pro-260215):[app.services.inference.call_text_model][provider=volcengine][model=doubao-seed-2-0-pro-260215] 流式调用超时: 超过 120.0s 没有收到新数据
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】本次评测中,模型因流式调用超时(超过120秒未收到新数据)导致系统报错,未能生成任何有效的HTML代码输出。所有评分维度均为0分,属于完全失败的生成结果,与任务要求完全不符。 【GEMINI】由于模型在生成过程中出现系统超时错误(流式调用超时),未能提供任何代码输出,因此无法完成对项目实景图与文字说明的图文混排能力测试,各维度均评为 0 分。 【KIMI】本次评测中,模型(doubao-seed-2-0-pro-260215)在生成过程中出现流式调用超时错误,超过 120 秒未收到新数据,导致完全未输出任何 HTML 代码。所有评分维度的要求均未实现,属于生成失败案例。建议检查模型服务稳定性或优化生成任务的复杂度配置。
困难难度评测结果
- 得分:1.2 分
- 通过状态:未通过
模型生成产物
以下是该模型针对此任务的实际生成内容:
系统报错(阶段=模型生成; 模块=app.services.inference.call_text_model; provider=volcengine; model=doubao-seed-2-0-pro-260215):[app.services.inference.call_text_model][provider=volcengine][model=doubao-seed-2-0-pro-260215] 流式调用超时: 超过 120.0s 没有收到新数据
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】本次评测中,模型因流式调用超时(超过120秒未收到新数据)导致生成失败,候选输出仅为系统报错信息,未产生任何有效的HTML/CSS/JavaScript代码。所有评分维度均为0分,任务完全未完成。 【GEMINI】由于模型在生成过程中出现「流式调用超时」错误,未能产出任何代码内容。该次评测无法进行,模型未能完成任务要求。 【KIMI】本次评测中,模型(doubao-seed-2-0-pro-260215)在生成过程中发生流式调用超时错误,超过120秒未返回任何有效数据,导致完全未生成符合要求的单页HTML应用。所有评分维度的要求均未得到满足,属于完全失败的生成结果。建议检查模型服务稳定性或优化提示词长度与复杂度。
相关链接
您可以通过以下链接查看更多相关内容: