doubao-seed-1-8 在「国际象棋」的评测结果

这是该 AI 模型在此测试用例上的详细评测结果。

基本信息

  • 模型名称:doubao-seed-1-8
  • 用例名称:国际象棋
  • 测试类型:网页生成
  • 评测维度:游戏开发

系统提示词(System Prompt)

这是给 AI 模型的背景设定和角色指令:

你是一名资深 Web 前端开发专家,擅长使用原生 HTML/CSS/JavaScript 构建完整的交互式游戏应用。 回答要求: 1. 所有代码必须集中在单个 HTML 文件中,可直接在浏览器中运行,无需任何外部依赖。 2. 优先保证核心游戏逻辑的正确性:棋子移动规则必须严谨,非法移动必须被拦截。 3. 代码结构清晰,建议按「数据层(棋盘状态)→ 逻辑层(规则引擎)→ 渲染层(UI)」分模块组织。 4. 使用 Unicode 棋子字符(♔♕♖♗♘♙♚♛♜♝♞♟),确保视觉清晰。 5. 输出完整代码,不得截断,不得使用省略注释(如 // ... 省略 ...)代替实际代码。

用户提示词(User Prompt)

这是用户给 AI 模型的具体任务要求:

请生成一个完整的国际象棋游戏,所有代码(HTML、CSS、JavaScript)写在单个 HTML 文件中,可直接在浏览器运行。 ## 棋盘与布局 - 8×8 棋盘,经典棕白相间配色(浅色格 #F0D9B5,深色格 #B58863) - 棋盘四周显示行号(1-8)和列标(a-h)坐标标签 - 棋子使用 Unicode 字符:白方 ♔♕♖♗♘♙,黑方 ♚♛♜♝♞♟ - 游戏开始时棋子按标准初始位置摆放 ## 交互功能 - 点击己方棋子将其选中(高亮显示选中格) - 选中后,所有合法目标格用绿色圆点标记 - 点击合法目标格完成移动;点击其他位置取消选中 - 白方先行,双方轮流走棋,界面顶部显示「当前走棋方:白方 / 黑方」 ## 棋子移动规则(必须全部正确实现) - **王(King)**:向任意相邻方向移动一格,不能移动到被对方攻击的格子 - **后(Queen)**:沿横、竖、斜四个轴任意格数移动,路径不可有阻挡 - **车(Rook)**:沿横轴或竖轴任意格数移动,路径不可有阻挡 - **象(Bishop)**:沿对角线任意格数移动,路径不可有阻挡 - **马(Knight)**:L 形移动(2+1 格),可越过其他棋子 - **兵(Pawn)**: - 向前移动一格(不可吃子) - 初始位置可向前移动两格(路径无阻挡) - 斜前方一格有对方棋子时可斜向吃子 ## 吃子 - 移动到对方棋子所在格即完成吃子,对方棋子从棋盘移除 - 不可移动到己方棋子所在格 ## 将军与将死 - 每次移动后检测对方王是否被将军,若是则在界面显示「将军!」提示,并高亮被将军的王所在格(红色边框或背景) - 若某方被将军且没有任何合法移动,判定将死,显示「游戏结束:XX方获胜!」 - 合法移动列表必须排除会导致己方王处于被将军状态的走法(即走完后己方王仍安全) ## 视觉细节 - 选中格:黄色高亮背景 - 合法移动格:绿色半透明圆点(空格)或绿色边框(可吃子格) - 将军时王所在格:红色高亮背景 - 棋子字体足够大(建议 2.5rem 以上),在格子内居中显示

任务要求

AI 模型需要满足以下要求:

  1. 棋子初始布局完全正确,六类棋子的移动规则均按国际象棋标准实现,包括兵的初始两格前进和斜向吃子。
  2. 合法移动高亮功能正常:选中棋子后,所有且仅显示合法目标格(已过滤会导致己方王被将军的走法)。
  3. 将军检测正确:每步走完后准确判断对方王是否被将军,并给出视觉提示。
  4. 将死判定正确:被将军且无任何合法走法时游戏结束,显示胜负结果。
  5. 轮流走棋逻辑正确:非当前走棋方的棋子不可被选中或移动。
  6. 代码完整可运行:单个 HTML 文件,无外部依赖,在现代浏览器中直接打开即可正常游戏。

评测结果

综合得分

该模型在此用例的得分为:62.8 分(满分 100 分),已通过

基础难度评测结果

  • 得分:62.8 分
  • 通过状态:已通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

以下是完整的国际象棋游戏代码,包含所有要求的功能和规则实现: ```html 国际象棋 * { margin: 0; padding: 0; box-sizing: border-box; font-family: 'Arial', sans-serif; } body { background-color: #f0f0f0; min-height: 100vh; display: flex; justify-content: center; align-items: center; } .chess-game { display: flex; flex-direction: column; align-items: center; padding: 20px; } .game-info { margin-bottom: 20px; text-align: center; font-size: 1.2rem; } #current-player { font-weight: bold; color: #2c3e50; } #game-message { margin-top: 10px; font-size: 1.4rem; font-weight: bold; color: #e74c3c; } .board-container { display: flex; align-items: center; } .row-labels, .col-labels { display: flex; flex-direction: column; margin: 0 10px; } .col-labels { flex-direction: row; justify-content: space-between; width: 480px; margin-top: 10px; } .label { font-size: 1rem; color: #2c3e50; width: 60px; text-align: center; line-height: 60px; } .chess-board { display: grid; grid-template-columns: repeat(8, 60px); grid-template-rows: repeat(8, 60px); border: 2px solid #2c3e50; } .square { width: 60px; height: 60px; display: flex; align-items: center; justify-content: center; font-size: 2.8rem; cursor: pointer; position: relative; transition: background-color 0.2s ease; } .square.light { background-color: #F0D9B5; } .square.dark { background-color: #B58863; } .square.selected { background-color: #ffff99; } .square.check { background-color: #ffcccc; } .square.legal-move::after { content: ''; position: absolute; width: 18px; height: 18px; background-color: rgba(0, 200, 0, 0.7); border-radius: 50%; } .square.legal-capture::after { content: ''; position: absolute; width: 90%; height: 90%; border: 3px solid rgba(0, 200, 0, 0.8); border-radius: 50%; } 当前走棋方:白方 8 7 6 5 4 3 2 1 a b c d e f g h let board = []; let currentPlayer = 'white'; let selectedSquare = null; let legalMoves = []; let gameOver = false; const pieceSymbols = { white: { king: '♔', queen: '♕', rook: '♖', bishop: '♗', knight: '♘', pawn: '♙' }, black: { king: '♚',...

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【GEMINI】该生成结果在视觉呈现和基础交互逻辑上表现非常出色,代码结构专业。核心规则(如移动过滤、将军检测)的思路正确且严谨。然而,由于输出长度限制导致代码在关键的规则判定函数处截断,使得游戏无法在浏览器中直接完整运行,这是主要的扣分项。 【KIMI】该实现展现了较好的国际象棋规则理解能力和代码组织能力,基础功能框架搭建完整,视觉设计也符合要求。但存在致命缺陷:代码在关键位置被截断,导致将军检测、王的安全性验证等核心功能不完整,且引用了未定义的辅助函数,实际无法运行。这严重违反了题目中「输出完整代码,不得截断」的硬性要求。若代码完整,评分会显著提高;当前状态下需要修复截断问题和补充缺失的辅助函数才能正常使用。建议补全 isSquareAttacked 函数的实现,并补充所有「Raw」后缀的辅助函数,同时添加王车易位和吃过路兵等可选功能以提升完整性。

进阶难度评测结果

  • 得分:53.8 分
  • 通过状态:未通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

以下是完整的国际象棋单文件HTML实现,包含所有要求的核心功能、特殊规则、AI对手及辅助功能: ```html 国际象棋 - 进阶版 * { margin: 0; padding: 0; box-sizing: border-box; font-family: 'Arial', sans-serif; } body { background-color: #f0f0f0; padding: 20px; display: flex; flex-direction: column; align-items: center; } .game-container { display: flex; gap: 20px; flex-wrap: wrap; justify-content: center; } .board { display: grid; grid-template-columns: repeat(8, 1fr); grid-template-rows: repeat(8, 1fr); width: 80vmin; height: 80vmin; max-width: 600px; max-height: 600px; border: 2px solid #333; } .square { display: flex; justify-content: center; align-items: center; font-size: 6vmin; cursor: pointer; position: relative; transition: background-color 0.2s ease; } .square.light { background-color: #f0d9b5; } .square.dark { background-color: #b58863; } .square.selected { background-color: #7fc97f !important; } .square.last-move { background-color: #ffd700 !important; } .square.check { animation: check-pulse 1s infinite alternate; } @keyframes check-pulse { 0% { background-color: #ff6b6b; } 100% { background-color: #ff8787; } } .square::after { content: ''; position: absolute; width: 20%; height: 20%; border-radius: 50%; opacity: 0; transition: opacity 0.2s ease; } .square.legal-move::after { background-color: rgba(0, 255, 0, 0.5); opacity: 1; } .square.legal-capture::after { background-color: rgba(255, 0, 0, 0.7); opacity: 1; width: 80%; height: 80%; } .piece { user-select: none; transition: transform 0.15s ease; } .piece:hover { transform: scale(1.1); } .controls { background-color: white; padding: 20px; border-radius: 10px; box-shadow: 0 0 10px rgba(0,0,0,0.1); min-width: 250px; max-width: 300px; } .control-group { margin-bottom: 15px; } .control-group label { display: block; margin-bottom: 5px; font-weight: bold; } .control-group select, .control-group button { width: 100%; padding: 8px; border: 1px solid #ddd; border-radius: 5px; font-size: 14px; cursor: pointer; } .control-group button:hover { background-color:...

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【GEMINI】这是一个极高质量的单文件国际象棋实现。模型不仅完美遵循了所有复杂的业务逻辑要求(如三种特殊规则和 AI 算法),还在代码组织上表现出极强的专业性,将状态管理、评估函数和 UI 渲染清晰分离。音效系统和代数记谱法的实现体现了对细节的极致追求,是一个教科书级的 Web 前端游戏开发示例。 【KIMI】该实现从可见代码来看具有较好的代码结构和UI设计基础,采用了模块化的状态管理(gameState对象)、清晰的常量定义、以及响应式布局。但致命问题是代码在关键位置被截断(playSound函数中间中断),导致核心的游戏规则引擎、AI算法、胜负判定等关键功能完全无法评估。根据题目要求「直接输出完整HTML代码,不要省略任何部分」,此输出不符合要求,无法验证功能正确性。若代码完整,基于现有结构质量可能较高;但就当前提交状态,核心功能无法确认。

困难难度评测结果

  • 得分:36.2 分
  • 通过状态:未通过

模型生成产物

以下是该模型针对此任务的实际生成内容:

```html 高级国际象棋 * { margin: 0; padding: 0; box-sizing: border-box; font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif; } body { background-color: #f0f0f0; display: flex; justify-content: center; padding: 20px; gap: 20px; } /* 棋盘主题 */ .board-classic .square { width: 70px; height: 70px; display: flex; align-items: center; justify-content: center; cursor: pointer; position: relative; font-size: 50px; transition: background-color 0.2s; } .board-classic .light { background-color: #f0d9b5; } .board-classic .dark { background-color: #b58863; } .board-wooden .square { width: 70px; height: 70px; display: flex; align-items: center; justify-content: center; cursor: pointer; position: relative; font-size: 50px; transition: background-color 0.2s; } .board-wooden .light { background-color: #e6cdaa; } .board-wooden .dark { background-color: #8b5a2b; } .board-modern .square { width: 70px; height: 70px; display: flex; align-items: center; justify-content: center; cursor: pointer; position: relative; font-size: 50px; transition: background-color 0.2s; } .board-modern .light { background-color: #e0e0e0; } .board-modern .dark { background-color: #666666; } /* 棋子样式 */ .piece { text-shadow: 2px 2px 4px rgba(0,0,0,0.3); user-select: none; transition: transform 0.2s ease; } .piece:hover { transform: scale(1.1); } /* 高亮效果 */ .selected { background-color: #7fc97f !important; } .legal-move::after { content: ''; position: absolute; width: 20px; height: 20px; background-color: rgba(0,0,0,0.3); border-radius: 50%; top: 50%; left: 50%; transform: translate(-50%, -50%); } .last-move { background-color: #ffd700 !important; } .check { animation: check-pulse 1s infinite alternate; } @keyframes check-pulse { 0% { background-color: #ff6b6b; } 100% { background-color: #ff8787; } } /* 升变菜单 */ .promotion-menu { position: absolute; background-color: white; border: 2px solid #333; border-radius: 5px; display: flex; gap: 10px; padding: 10px; z-index: 1000; } .promotion-option { width: 50px;...

AI 评审点评

以下是 AI 评审对该模型输出的点评:

【GEMINI】该生成结果在视觉布局和 UI 设计上表现出色,准确理解了所有高级功能需求并预留了接口。然而,受限于输出长度限制,核心的 JavaScript 逻辑(规则引擎、AI 算法、分析功能)发生了严重截断,导致生成的 HTML 文件无法实际运行或进行游戏。作为一个全栈工程师角色,未能通过精简注释或优化结构来确保核心逻辑的完整性,未能满足「代码必须完整输出,不得截断」的硬性要求。 【KIMI】该生成结果严重不符合要求。代码在关键位置被截断,仅完成了约 15% 的 HTML/CSS 结构搭建,所有核心功能(规则引擎、AI 算法、交互逻辑、音效系统)均未实现。尽管提示词明确要求「代码必须完整输出,不得截断」,但模型仍输出了不完整代码,且截断位置恰好位于核心算法实现之前,导致整个程序无法运行。这是一个典型的因长度限制导致的生成失败案例,需要重新生成完整代码或采用续写策略。

相关链接

您可以通过以下链接查看更多相关内容:

加载中...