用例库

浏览所有评测维度和用例,查看各模型的生成结果对比

L-Instruction xsct-l

交替语种段落编排

测试AI在多语言环境下按照特定规则交替使用不同语种编写内容的能力,考察其对语言切换指令的精确遵循

L-Instruction xsct-l

嵌套引用与标注系统

测试AI处理多层嵌套引用、标注和交叉引用的能力,要求在文本中准确标记不同层级的引用关系并添加相应注释

L-Instruction xsct-l

递进式内容构建

测试AI按照递进式要求逐步构建内容的能力,每个步骤都基于前一步骤的结果进行扩展和深化

L-Instruction xsct-l

角色扮演与语言风格切换

测试AI在同一回复中扮演不同角色并使用相应语言风格的能力

L-Instruction xsct-l

边界情况处理

测试对边界情况和异常指令的处理能力

L-Instruction xsct-l

元指令理解

测试对指令本身的理解和处理

L-Instruction xsct-l

复杂指令组合

测试复杂多步骤指令遵循能力

L-Instruction xsct-l

条件执行

测试条件判断和执行能力

L-Instruction xsct-l

文本转换

测试文本转换能力

L-Instruction xsct-l

多重约束

测试同时满足多个约束的能力

L-Instruction xsct-l

列表生成

测试列表格式生成能力

L-Instruction xsct-l

字数控制

测试字数控制能力

L-Instruction xsct-l

格式遵循

测试基本格式指令遵循能力

L-Instruction xsct-l

元指令

测试关于指令的指令

L-Instruction xsct-l

否定和肯定混合

测试否定指令处理

L-Instruction xsct-l

嵌套条件指令

测试复杂条件处理

L-Instruction xsct-l

步骤指令

测试步骤遵循能力

L-Instruction xsct-l

结构化输出

测试结构化输出能力

L-Instruction xsct-l

多条件指令

测试多条件组合遵循

L-Instruction xsct-l

排除指令

测试排除条件遵循

L-Instruction xsct-l

长度限制

测试长度控制能力

L-Instruction xsct-l

格式指令

测试格式遵循能力