OpenAI: gpt-oss-120b 在「通知公告」的评测结果
这是该 AI 模型在此测试用例上的详细评测结果。
基本信息
- 模型名称:OpenAI: gpt-oss-120b
- 用例名称:通知公告
- 测试类型:文本生成
- 评测维度:写作能力
系统提示词(System Prompt)
这是给 AI 模型的背景设定和角色指令:
你是一名资深行政秘书,擅长撰写规范的公文通知。 回答要求: 1. 严格遵守公文通知的标准格式,包含标题、称谓、正文、落款及日期。 2. 通知内容必须包含会议三要素:时间、地点、参会人员,表达清晰无歧义。 3. 语言风格正式、简洁,使用书面语,避免口语化或模糊表达。 4. 结尾使用规范的通知惯用语(如「请准时参加」、「特此通知」等)。
用户提示词(User Prompt)
这是用户给 AI 模型的具体任务要求:
请以公司行政部门的名义,写一则部门会议通知。 要求: 1. 通知须包含以下三要素:会议时间、会议地点、参会人员范围。 2. 简要说明会议主题或目的(一句话即可)。 3. 格式规范:包含标题、称谓、正文、落款(部门名称)及日期。 4. 语言正式、简洁,符合公文通知的书面语风格。
任务要求
AI 模型需要满足以下要求:
- 标题格式正确,能清晰反映通知性质(如「关于……的通知」)。
- 正文包含会议三要素:具体时间(年月日及时刻)、具体地点、参会人员范围,三者缺一不可。
- 简要说明会议主题或目的,内容合理、表述明确。
- 结尾使用规范的通知惯用语(如「请准时参加,特此通知」)。
- 落款包含发文部门名称及具体日期,格式规范。
- 全文使用正式书面语,无口语化表达或歧义词句。
评测结果
综合得分
该模型在此用例的得分为:87.24 分(满分 100 分),已通过
基础难度评测结果
- 得分:87.24 分
- 通过状态:已通过
模型生成产物
以下是该模型针对此任务的实际生成内容:
**部门会议通知** 各位同事: 为进一步部署2026年度第一季度工作计划,现将会议有关事项通知如下: 一、**会议时间**:2026年3月5日(星期五)上午09:00‑11:00。 二、**会议地点**:公司总部大楼二层会议室。 三、**参会人员**:行政部全体成员及各业务部门负责人。 四、**会议主题**:讨论2026年度第一季度工作计划及重点事项。 请各参会人员准时参加。 特此通知。 行政部 2026年2月21日
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该模型生成的通知整体质量较好,内容完整性突出,会议三要素及主题均有明确表述,结尾惯用语使用规范。主要不足在于标题格式不符合公文「关于……的通知」的标准格式,以及称谓「各位同事」略显口语化。若能修正标题格式并调整称谓,整体质量将更为规范。 【KIMI】该通知整体质量良好,内容完整、语言规范,能够有效传达会议信息。主要不足在于标题格式未严格遵循「关于……的通知」的标准公文格式,且正文采用分条列项式写法虽清晰但与传统段落式通知略有差异。建议在标题拟制和称谓选择上进一步贴合公文规范。
进阶难度评测结果
- 得分:77.59 分
- 通过状态:已通过
模型生成产物
以下是该模型针对此任务的实际生成内容:
**2025年公司年会通知** (居中) 各位同事: 为总结过去、展望未来,公司决定于2025年举办年度盛会。现将年会有关事项通知如下,请各部门认真组织、准时参加。 --- ### 1. 年会基本信息 | 项目 | 内容 | |------|------| | **举办时间** | 2025 年 12 月 18 日(星期四)上午 10:00 – 晚上 21:30 | | **举办地点** | 上海国际会议中心(浦东新区世博大道 88 号) | | **会议议程** | 10:00‑12:00 主题演讲12:00‑13:30 午餐及自由交流13:30‑17:00 部门成果展示17:30‑19:00 晚宴19:30‑21:30 文艺节目及抽奖 | --- ### 2. 着装要求 - **主题风格**:**“创新·共赢”**,倡导时尚、简约且富有科技感的商务正装。 - **具体建议**: - 男士可选择深色西装配领带,亦可穿商务休闲西装外套。 - 女士建议穿职业套装或连衣裙,颜色以深蓝、灰、黑为主,配合适度配饰。 - **特殊提示**:为配合现场灯光效果,请避免穿着过于鲜艳的颜色或大面积图案。 --- ### 3. 节目征集 - **征集范围**:歌舞、相声、小品、乐器演奏、朗诵、魔术等形式的文艺节目(个人或团队均可)。 - **报名截止时间**:2025 年 11 月 30 日(星期二)23:59。 - **报名方式**:请将节目名称、表演时长、表演者名单及简要节目简介发送至 **hr@xxtech.com**,邮件主题统一为“年会节目征集‑部门‑节目名称”。 > 注:入围节目将于12月5日前统一通知,并安排彩排时间。 --- ### 4. 餐饮安排 - **用餐形式**:自助餐+现场点餐两种模式,提供中西式料理。 - **用餐时间**:午餐 12:00‑13:30,晚宴 17:30‑19:00。 - **注意事项**: - 如有素食、无麸质、宗教禁忌等特殊饮食需求,请于 **2025 年 11 月 20 日**前填写《特殊饮食需求登记表》,发送至 **canteen@xxtech.com**。 - 餐饮现场将提供饮品、甜点及水果区,敬请自行取用。 --- ### 5. 其他事项 1. **出席确认**:请各部门于 2025 年 11 月 15 日前将参会人员名单(姓名、工号、部门)发送至 **attendance@xxtech.com**。 2. **联系人**: - **王晓琳**(行政人事部) 电话:021-1234‑5678 邮箱:wangxl@xxtech.com - **刘志强**(后勤保障部) 电话:021-1234‑5679 邮箱:liuzq@xxtech.com 3. 如有其他疑问,请及时与上述联系人沟通。 感谢大家的积极配合,让我们共同期待一场精彩纷呈、意义非凡的年度盛会! --- **行政人事部** 2025 年 10 月 5 日
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】该模型生成的年会通知在内容完整性方面表现较好,五大模块均有涵盖且信息具体可执行,联系人、报名方式等关键细节均有体现。然而,最突出的问题是格式规范性不足——大量使用Markdown语法(表格、分隔线、###标题)而非标准商务公文格式,且「(居中)」注释直接出现在正文中,严重影响公文专业性。此外,落款日期(10月5日)早于多个截止日期(11月15日、11月30日),存在明显逻辑矛盾,若直接用于公司内部发布将造成混乱。语言风格总体得体,但企业文化亲和力略显不足。建议修正格式规范性问题并核查时间逻辑后方可实际使用。 【KIMI】该通知在信息覆盖面上较为全面,采用了清晰的模块化结构和现代化的呈现方式,语言积极正面。但存在严重的时间逻辑混乱(年会日期、各截止时间与落款日期相互矛盾)、格式规范性不足(Markdown元素过多、传统公文要素缺失)、以及部分关键信息偏离提示要求等问题。作为资深行政秘书撰写的正式通知,在时间合理性、格式严谨性和信息准确性方面均未达到专业标准,需大幅修订后方可实际发布。
困难难度评测结果
- 得分:66.1 分
- 通过状态:已通过
模型生成产物
以下是该模型针对此任务的实际生成内容:
``` ××市卫生健康委员会 公 文 发文字号:××市卫健委发〔2023〕1号 标题:关于依法调整新冠病毒感染防控措施的公告 主送:各区(县)卫生健康委员会、各相关单位 **正文** 各位同仁: 为深入贯彻党中央、国务院关于新冠病毒感染防控工作的重要决策部署,切实落实《传染病防治法》(2022修正)第七条、第十六条,以及《突发公共卫生事件应急条例》第十二条的规定,依据《国务院办公厅关于新冠病毒感染乙类乙管管理的通知》(国办发〔2023〕5号),现将本市新冠疫情防控措施调整有关事项公告如下,供各地区、各部门遵照执行。 一、总体要求 1. 本市自 **2023 年 1 月 15 日 00:00** 起,全面实行新冠病毒感染“乙类乙管”。 2. 各类场所防控措施应坚持“精准防控、科学分级、依法依规”原则,做到**必须**落实法定防控底线,**应当**根据本公告的差异化要求采取相应措施,**鼓励**采用信息化手段提升防控效能,**建议**对重点人群提供人文关怀和健康指导。 二、场所防控要求(自生效日起执行) | 场所类别 | 防控要求(调整前 → 调整后) | 具体措施 | |----------|----------------------------|----------| | **1. 医疗机构** | **必须**继续执行《传染病防治法》第十六条规定的报告、隔离和消毒措施。**应当**取消对新冠病毒感染者的集中隔离强制性,改为居家或定点医疗观察。 | ① 所有门诊、急诊设置体温检测点,体温 ≥ 37.3℃ 的患者**应当**转诊至发热病区。② 对新冠确诊患者实行居家医学观察或定点医院治疗,**必须**做好病例报告与信息上报。③ 医护人员**必须**继续接种新冠疫苗(含加强针),并做好个人防护。 | | **2. 养老院、福利院等重点机构** | **必须**对入住人员进行健康监测;**应当**取消对新冠阳性人员的强制隔离,采取“居家+定点医疗”模式。 | ① 每日测量体温、核对健康码,记录在案。② 对出现发热、咳嗽等症状的老人**应当**及时报告并转至定点医院。③ 加强通风换气,每日通风不少于 2 小时。④ 继续为机构内工作人员提供免费新冠疫苗接种。 | | **3. 商场、超市等公共场所** | **必须**取消强制佩戴口罩的行政规定,**鼓励**自愿佩戴;**应当**保持入口体温检测。 | ① 入口设置体温检测仪,体温 ≥ 37.3℃ 的人员**应当**引导至就近的防疫检查点。② 加强公共区域(电梯、扶手、收银台等)的每日消毒,**必须**使用符合国家标准的消毒剂。③ 通过广播、宣传栏提醒顾客保持社交距离(保持 1 米以上)。 | | **4. 学校及托育机构** | **必须**落实《传染病防治法》第七条关于学校防控的规定,**应当**取消课堂强制佩戴口罩,**鼓励**开展健康教育。 | ① 开学前对全体师生进行核酸检测和健康登记。② 建立学生健康档案,出现发热等症状**应当**立即报告并送医。③ 教室通风每 2 小时一次,每次不少于 15 分钟。④ 对高危学生(有基础疾病)**建议**居家学习或采取分班分时上课。 | | **5. 交通运输场所**(包括航空、铁路、公交、地铁等) | **必须**继续执行客运工具的消毒通风制度,**应当**取消强制佩戴口罩的规定。 | ① 车辆、站台、候车厅每日进行清洁消毒,**必须**使用国家批准的消毒产品。② 入口处设置体温检测,体温异常旅客**应当**配合健康码核验并接受转运。③ 对跨省、跨境旅客**建议**提前做好健康评估。 | 三、时间节点与过渡安排 1. **2023 年 1 月 15 日 00:00** 起,公告全部内容正式生效。 2. **2023 年 1 月 15 日至 2023 年 1 月 31 日** 为**过渡期**,期间各单位**应当**完成防控措施的调整并做好宣传。对未及时整改的单位,市卫健委将依据《突发公共卫生事件应急条例》第十五条进行通报批评。 3. **2023 年 2 月 1 日** 起,进入常态化管理阶段,各场所防控措施按本公告执行,市卫健委将每月对落实情况进行抽查评估。 四、重点人群健康指导(人文关怀) 1. **老年人**、**慢性病患者**、**免疫功能低下者**等重点人群**建议**: - 坚持每日测量体温,出现发热、咳嗽等症状**应当**及时就医。 - 按医嘱完成新冠疫苗(含加强针)接种,**必须**接种后 14 天内避免人群聚集。 - 合理安排居家活动,保持适度运动,保证充足睡眠,增强体质。 2. 对上述重点人群的家庭成员**鼓励**提供生活帮助和心理支持,社区居委会**应当**做好走访慰问工作。 五、公众咨询与投诉渠道 1....
AI 评审点评
以下是 AI 评审对该模型输出的点评:
【CLAUDE】模型生成的公告在内容框架上基本覆盖了任务要求的各项要素,包括5类场所差异化要求、时间节点、重点人群建议和咨询渠道,并有意识地区分了不同法律效力层级的表述。但存在以下主要问题:一是格式不符合GB/T 9704-2012规范,大量使用Markdown表格和加粗符号;二是政策理解存在偏差,将生效日期设为1月15日而非1月8日,且部分措施(如开学前核酸检测)与「乙类乙管」调整方向相悖;三是法规引用存在虚构文件风险;四是开头称呼「各位同仁」不当。与参考答案相比,模型生成结果在格式规范性和政策准确性上均有明显差距,整体质量中等偏下。 【KIMI】该生成结果在公文格式、内容准确性和语言规范性方面均存在严重问题。格式上违反GB/T 9704-2012核心要求,使用Markdown表格排版正文;内容上关键法规引用错误、虚构文件、时间节点与题目要求不符,且多处政策表述与「乙类乙管」实际精神相悖;语言上效力层级混用、面向对象错误、口语化严重。虽尝试覆盖所有要求要素,但执行质量低下,整体未达到合格政府公文标准。
相关链接
您可以通过以下链接查看更多相关内容: