用例库

浏览所有评测维度和用例,查看各模型的生成结果对比

L-Context xsct-l

引用追踪

追踪文本中的指代和引用关系

L-Context xsct-l

矛盾检测

检测文本中的矛盾信息

L-Context xsct-l

长文本一致性

在长文本中保持信息一致性

L-Context xsct-l

文档问答

基于文档内容回答问题

L-Context xsct-l

跨段落推理

需要综合多个段落信息进行推理

L-Context xsct-l

多轮对话记忆

在多轮对话中保持信息一致

L-Context xsct-l

信息提取

从文本中提取结构化信息

L-Context xsct-l

对话追踪

多轮对话信息追踪

L-Context xsct-l

短篇阅读理解

基础阅读理解测试