用例库

浏览所有评测维度和用例,查看各模型的生成结果对比

L-Consistency xsct-l

物理规律一致性

测试AI在描述物理现象和科学原理时能否保持前后一致,不出现违背基本物理规律的矛盾描述

L-Consistency xsct-l

空间方位描述一致性

测试AI在描述复杂空间布局、物体相对位置关系时,能否保持前后描述的空间逻辑一致性,避免出现方位矛盾或空间关系混乱

L-Consistency xsct-l

因果关系链条一致性

测试AI在构建和维护复杂因果关系链条时的一致性,包括原因与结果的对应、多级因果推导的连贯性、以及在不同语境下保持因果逻辑的稳定性

L-Consistency xsct-l

专业术语定义一致性

测试AI在同一对话中对专业术语、概念定义的解释是否保持一致,避免前后矛盾或定义漂移

L-Consistency xsct-l

情绪表达一致性

测试AI在描述同一事件或场景时,能否保持情绪基调和表达风格的一致性,避免在相同语境下出现矛盾的情绪判断

L-Consistency xsct-l

自洽性测试

测试回答的内部逻辑自洽性

L-Consistency xsct-l

多轮一致性

在多轮回答中保持一致性

L-Consistency xsct-l

世界观一致性

在虚构世界中保持设定一致

L-Consistency xsct-l

立场一致性

保持论述立场的一致性

L-Consistency xsct-l

时间线一致性

保持事件时间线的一致性

L-Consistency xsct-l

角色一致性

在叙事中保持角色特征一致

L-Consistency xsct-l

数字一致性

保持数字计算的一致性

L-Consistency xsct-l

逻辑一致性

保持逻辑推理的一致性

L-Consistency xsct-l

事实一致性

测试基本事实的前后一致