← 返回 Skills 市场

Xiaozhi Teach Exam Designer

Name: Xiaozhi Teach Exam Designer
Author: qizhitang

作者 xiaozhi · GitHub ↗ · v1.0.0 · MIT-0

cross-platform ✓ 安全检测通过

总下载

当前安装

版本数

在 OpenClaw 中安装

/install xiaozhi-teach-exam-designer

功能描述

帮助老师从"拼凑试卷"升级为"科学测评设计"。当老师说"帮我出一份试卷"、"设计一个单元测验"、 "怎么控制试卷难度"、"出一份月考卷"、 "这份卷子质量如何"时，必须激活此SKILL。核心工作流：确认测评目标 → 设计双向细目表 → 筛选/改编题目 → 控制难度梯度 → 生成评分标准 → 考后分析建议 →...

使用说明 (SKILL.md)

\r \r

测评设计师 SKILL\r

一句话定位： 好的测评不是为难学生，而是精准照见每个知识点的掌握状态。\r \r ---\r \r

⚠️ 技术实现边界声明\r

关于"自动出题"机制： 本 SKILL 的题目来源有两种：\r ① 老师提供题库（推荐：老师自有改编题或公开可引用资源）\r ② 学科专项 SKILL 自动生成（如数学解题教练、英语写作教练）\r 本 SKILL 不直接调用 LLM 凭空生成题目；不替老师挑选具体题目；只做"双向细目表设计+评分标准+难度梯度控制"。\r \r 关于"题目版权"边界： 所有题目必须标注 copyrightStatus（自有/公开可引用/仅存索引）；不引用未授权的教辅原题。\r \r 关于"自动评分"边界： 本 SKILL 输出评分标准而非"自动判分"；自动判分不在本 SKILL 能力范围。\r \r ---\r \r

一、核心使命\r

\r 老师出卷时常见的三个误区：\r \r

误区① 拼凑式出题：把往年卷子/教辅题目拼起来，\r
        不清楚每道题在"测什么"。\r
\r
误区② 难度一刀切：要么全卷偏难（学生大面积崩溃），\r
        要么全卷偏易（区分度低）。\r
\r
误区③ 评分不严格：评分标准模糊，\r
        不同老师改出来的分数差距大。\r
```\r
\r
本 SKILL 要解决的是：\r
- **让每道题都对应明确测评目标**：双向细目表驱动出题\r
- **让难度梯度可设计**：根据测评目的调整 P 值和 D 值\r
- **让评分标准可复制**：过程分+结果分双轨，不同老师改出来差异小\r
- **让测评数据反哺教学**：得分率回写 student-analyzer\r
\r
---\r
\r
## 二、触发时机\r
\r
| 触发场景 | 示例语句 |\r
|---------|---------|\r
| 设计新试卷 | "帮我出一份 X 单元试卷" / "出月考卷" |\r
| 单元小测 | "出一份 15 分钟小测" |\r
| 试卷讲评 | "这份卷子怎么讲评" |\r
| 试卷分析 | "这份卷子难度/区分度如何" |\r
| 命题 | "如何按双向细目表命题" |\r
| 评分标准 | "出评分细则" |\r
| 题目改编 | "这道题怎么改" |\r
| 试卷质量评估 | "这份卷子出得怎么样" |\r
\r
---\r
\r
## 三、核心流程\r
\r
```text\r
                ┌──────────────────────────┐\r
                │ ① 确认测评目的            │\r
                │  诊断/形成性/终结性/选拔  │\r
                └────────────┬─────────────┘\r
                             ↓\r
                ┌──────────────────────────┐\r
                │ ② 设计双向细目表          │\r
                │  知识点 × 认知层次 矩阵   │\r
                └────────────┬─────────────┘\r
                             ↓\r
                ┌──────────────────────────┐\r
                │ ③ 控制难度梯度            │\r
                │  基础/中等/提升/挑战      │\r
                └────────────┬─────────────┘\r
                             ↓\r
                ┌──────────────────────────┐\r
                │ ④ 筛选/改编题目           │\r
                │  按细目表匹配             │\r
                └────────────┬─────────────┘\r
                             ↓\r
                ┌──────────────────────────┐\r
                │ ⑤ 生成评分标准            │\r
                │  过程分+结果分双轨        │\r
                └────────────┬─────────────┘\r
                             ↓\r
                ┌──────────────────────────┐\r
                │ ⑥ 考后分析建议            │\r
                │  难度/区分度/反哺教学     │\r
                └────────────┬─────────────┘\r
                             ↓\r
                ┌──────────────────────────┐\r
                │ ⑦ 写回 student-analyzer   │\r
                │  得分率 → 知识点热力图    │\r
                └──────────────────────────┘\r
```\r
\r
---\r
\r
## 四、测评目的分类\r
\r
不同目的对应不同设计策略。\r
\r
```text\r
┌──────────┬──────────────┬──────────┬──────────┬────────────┐\r
│ 目的      │ 难度 P        │ 题量      │ 时长      │ 区分度 D    │\r
├──────────┼──────────────┼──────────┼──────────┼────────────┤\r
│ 诊断性    │ 0.55-0.70    │ 中等      │ 中等      │ 中等        │\r
│  (查弱项) │ 适中偏易     │          │          │            │\r
├──────────┼──────────────┼──────────┼──────────┼────────────┤\r
│ 形成性    │ 0.65-0.80    │ 较小      │ 较短      │ 良好        │\r
│  (单元)   │ 适中         │          │          │            │\r
├──────────┼──────────────┼──────────┼──────────┼────────────┤\r
│ 终结性    │ 0.55-0.75    │ 较大      │ 较长      │ 优秀        │\r
│  (期中/末) │ 适中偏难     │          │          │            │\r
├──────────┼──────────────┼──────────┼──────────┼────────────┤\r
│ 选拔性    │ 0.35-0.55    │ 大        │ 长        │ 极强        │\r
│  (竞赛)   │ 难           │          │          │            │\r
└──────────┴──────────────┴──────────┴──────────┴────────────┘\r
```\r
\r
---\r
\r
## 五、双向细目表设计（核心）\r
\r
### 5.1 双向细目表模板\r
\r
行：知识点（按章节分组）\r
列：Bloom 认知层次（记忆/理解/应用/分析/评价/创造）\r
\r
```text\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
📋 双向细目表 · [试卷名] · 满分 [N] 分\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
      │ 记忆 │ 理解 │ 应用 │ 分析 │ 评价 │ 创造 │ 合计\r
──────┼──────┼──────┼──────┼──────┼──────┼──────┼─────\r
知识点①│      │      │      │      │      │      │\r
知识点②│      │      │      │      │      │      │\r
知识点③│      │      │      │      │      │      │\r
知识点④│      │      │      │      │      │      │\r
知识点⑤│      │      │      │      │      │      │\r
──────┼──────┼──────┼──────┼──────┼──────┼──────┼─────\r
合 计  │      │      │      │      │      │      │\r
\r
■ 知识点-题号对应（填表后倒推）\r
  知识点①：题 [   ]\r
  知识点②：题 [   ]\r
  知识点③：题 [   ]\r
  知识点④：题 [   ]\r
  知识点⑤：题 [   ]\r
\r
■ 认知层次-题号对应\r
  记忆：题 [   ]   理解：题 [   ]\r
  应用：题 [   ]   分析：题 [   ]\r
  评价：题 [   ]   创造：题 [   ]\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
```\r
\r
### 5.2 双向细目表填写规则\r
\r
```text\r
■ 知识点覆盖\r
  · 重要知识点至少 1 道题\r
  · 核心知识点 2-3 道题\r
  · 选考知识点 1 道题（可标注"选做"）\r
\r
■ 认知层次比例（按测评目的）\r
  诊断性  ：记忆 30% + 理解 30% + 应用 25% + 分析 15% + 评价/创造 0%\r
  形成性  ：记忆 20% + 理解 30% + 应用 30% + 分析 15% + 评价 5%\r
  终结性  ：记忆 15% + 理解 25% + 应用 30% + 分析 20% + 评价 5% + 创造 5%\r
  选拔性  ：记忆 5%  + 理解 15% + 应用 25% + 分析 30% + 评价 15% + 创造 10%\r
\r
■ 题目数量与分值\r
  · 单题分值与认知层次正相关（基础题分低，拔高题分高）\r
  · 总分必须等于各题分值之和\r
```\r
\r
### 5.3 双向细目表自检\r
\r
```text\r
□ 是否每个重要知识点都有 1 道以上题？\r
□ 是否每个认知层次都有 1 道以上题？\r
□ 比例是否符合测评目的？\r
□ 题量是否在合理范围？\r
  · 诊断性 8-12 题\r
  · 形成性 12-18 题\r
  · 终结性 18-25 题\r
  · 选拔性 20-30 题\r
□ 是否避免了"全卷都是应用题"或"全卷都是基础题"？\r
```\r
\r
---\r
\r
## 六、难度梯度设计\r
\r
### 6.1 难度系数 P\r
\r
```text\r
P = 班级平均分 / 满分\r
\r
按测评目的预设：\r
  诊断性：P 目标 0.55-0.70（适中偏易，照顾基础学生）\r
  形成性：P 目标 0.65-0.80（适中，符合课程标准）\r
  终结性：P 目标 0.55-0.75（适中偏难，区分度好）\r
  选拔性：P 目标 0.35-0.55（难，拉开差距）\r
```\r
\r
### 6.2 难度梯度比例\r
\r
```text\r
形成性测评（最常见）：\r
\r
  基础题  50%  → 全体学生应会\r
    P > 0.85，直接套用规则\r
    占比 50%，分值 50%\r
\r
  中等题  30%  → 大部分学生应会\r
    P 0.55-0.85，一步变形\r
    占比 30%，分值 30%\r
\r
  提升题  15%  → 优等生主战场\r
    P 0.30-0.55，综合应用\r
    占比 15%，分值 15%\r
\r
  挑战题  5%   → 拔尖学生展示\r
    P \x3C 0.30，跨章迁移\r
    占比 5%，分值 5%\r
```\r
\r
### 6.3 区分度 D\r
\r
```text\r
D = 高分组得分率 - 低分组得分率\r
  D > 0.40 优秀\r
  D 0.20-0.40 良好\r
  D \x3C 0.20 不足\r
\r
每道题都应 D > 0.20；\r
D \x3C 0.20 的题说明"所有学生都错"或"所有学生都对"，\r
应改题或删题。\r
```\r
\r
---\r
\r
## 七、题目筛选与改编\r
\r
### 7.1 题目信息表\r
\r
每道被选中的题目必须有以下完整信息：\r
\r
```text\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
📋 题目信息表\r
题号：[   ] · 分值：[   ] · 预计用时：[   ] 分钟\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
■ 来源\r
  出处：[自有/改编自 XX 教辅/原创新题]\r
  copyrightStatus：[自有/公开可引用/仅存索引]\r
  改编记录：[原题出处 + 改编点]\r
\r
■ 测评目标\r
  知识点：[   ]\r
  认知层次：[记忆/理解/应用/分析/评价/创造]\r
  预期难度：[基础/中等/提升/挑战]\r
\r
■ 内容\r
  题目：[题干]\r
  答案：[标准答案]\r
  评分标准：[过程分+结果分]\r
\r
■ 质量预测\r
  预估 P：[   ]\r
  预估 D：[   ]\r
  预估完成时间：[   ] 分钟\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
```\r
\r
### 7.2 改编原则\r
\r
```text\r
■ 改数（参数）\r
  原题 y=2x+1 → 改编 y=3x-2\r
  适合：同一知识点不同参数\r
\r
■ 改问（设问角度）\r
  原题"求 X" → 改编"判断 X 是否正确"\r
  适合：换角度测同一概念\r
\r
■ 改情境（背景）\r
  原题"出租车" → 改编"网约车"\r
  适合：让题目更贴近学生生活\r
\r
■ 改综合度\r
  单知识点 → 多知识点综合\r
  适合：测评综合应用能力\r
```\r
\r
### 7.3 题目版权管理\r
\r
```text\r
✅ 自有：老师原创或组内原创\r
✅ 公开可引用：教材例题、CC 协议资源\r
⚠️ 仅存索引：教辅原题只记题号，不复制题干\r
❌ 禁止：未授权复制教辅原题\r
\r
若引用改编题，必须标注"原题出处 + 改编点"。\r
```\r
\r
---\r
\r
## 八、评分标准生成\r
\r
每道题配 1 份评分标准。\r
\r
### 8.1 评分标准模板\r
\r
```text\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
📋 评分标准 · 第 [N] 题\r
满分：[   ] 分\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
■ 过程分（[N] 分）\r
  · 步骤 1（[M] 分）：[具体内容]\r
  · 步骤 2（[M] 分）：[具体内容]\r
  · 步骤 3（[M] 分）：[具体内容]\r
  · 关键概念/规则（[M] 分）：[具体内容]\r
\r
■ 结果分（[N] 分）\r
  · 答案正确（[M] 分）\r
  · 单位/格式（[M] 分）\r
\r
■ 常见错误与扣分\r
  · 错误 ①：[描述] → 扣 [M] 分\r
  · 错误 ②：[描述] → 扣 [M] 分\r
\r
■ 满分模板\r
  [步骤化满分作答]\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
```\r
\r
### 8.2 评分标准严格化\r
\r
```text\r
■ 过程分细化\r
  关键步骤必须给过程分（不能跳过）\r
  步骤 1 + 步骤 2 + 步骤 3 = 过程分\r
  避免"答案对了就给满分"的粗放评分\r
\r
■ 结果分明确\r
  答案对 + 过程对 = 满分\r
  答案对 + 过程有错 = 部分分\r
  答案错 + 过程对 = 部分分\r
\r
■ 评分一致性\r
  不同老师按本标准改出来差距应 \x3C 3 分\r
  若差距 > 5 分，说明标准不够明确\r
```\r
\r
### 8.3 简明答案评分（客观题）\r
\r
```text\r
选择题 / 填空题 / 判断题：\r
  正确答案：[X]\r
  错误答案扣分：全错 0 分，部分对酌情\r
\r
简答题（无固定过程）：\r
  关键点 ①（[M] 分）：[具体内容]\r
  关键点 ②（[M] 分）：[具体内容]\r
  表达清晰度（[M] 分）：[酌情]\r
```\r
\r
---\r
\r
## 九、考后分析建议\r
\r
### 9.1 试卷质量分析\r
\r
```text\r
■ 整体质量\r
  · 实际 P：[   ]（与目标 P 对比）\r
  · 实际 D：[   ]（区分度评估）\r
  · 实际平均分 / 中位数 / 标准差\r
  · 优秀率 / 及格率 / 低分率\r
\r
■ 题目质量\r
  · D \x3C 0.20 的题：[列表] → 改题或删题\r
  · P > 0.95 的题（太易）：[列表] → 升级为讲解素材\r
  · P \x3C 0.30 的题（太难）：[列表] → 拆分或降级\r
```\r
\r
### 9.2 知识点热力图\r
\r
```text\r
┌────────────────────────────────────┐\r
│ 知识点得分率热力图                   │\r
├────────────────────────────────────┤\r
│ 知识点① 🟢 82%                     │\r
│ 知识点② 🟡 56%                     │\r
│ 知识点③ 🔴 32%  ← 共性弱项        │\r
│ 知识点④ 🟡 65%                     │\r
│ 知识点⑤ 🔴 38%  ← 共性弱项        │\r
└────────────────────────────────────┘\r
图例：🔴 \x3C 40% / 🟡 40-70% / 🟢 > 70%\r
```\r
\r
### 9.3 写回 student-analyzer\r
\r
```text\r
写：\r
  · 各题得分率\r
  · 各知识点得分率\r
  · 各认知层次得分率\r
  · 区分度异常的题目\r
\r
→ student-analyzer 接收后生成：\r
  · 班级画像\r
  · 个体诊断卡\r
  · 教学调整建议\r
```\r
\r
---\r
\r
## 十、与上游/下游 SKILL 的协作\r
\r
### 10.1 协作流图\r
\r
```text\r
              ┌────────────────────────┐\r
              │ xiaozhi-teach-         │\r
              │  lesson-planner        │\r
              │ （教学目标）           │\r
              └───────────┬────────────┘\r
                          │\r
                          ↓\r
              ┌────────────────────────┐\r
              │ xiaozhi-teach-         │\r
              │  exam-designer         │\r
              │  （本 SKILL）           │\r
              └───────────┬────────────┘\r
                          │\r
                          ↓ 得分率反哺\r
              ┌────────────────────────┐\r
              │ xiaozhi-teach-         │\r
              │  student-analyzer      │\r
              │ （学情更新）           │\r
              └───────────┬────────────┘\r
                          │\r
        ┌─────────────────┼─────────────────┐\r
        ↓                 ↓                 ↓\r
  lesson-planner    assignment-     classroom-coach\r
  （教案调整）      designer        （讲评策略）\r
                    （作业调整）\r
```\r
\r
### 10.2 接口\r
\r
```text\r
读：\r
  lessonPlan.emphasis       → 试卷侧重点\r
  studentAnalyzer.classDistribution → 难度梯度参考\r
  studentAnalyzer.weaknessRank      → 必须覆盖的弱项\r
\r
写：\r
  examBlueprint.actualDifficulty → 实际难度\r
  examBlueprint.discrimination  → 实际区分度\r
  examBlueprint.itemQuality     → 题目质量评估\r
  examBlueprint.scoreRate       → 得分率（→ student-analyzer）\r
```\r
\r
---\r
\r
## 十一、字段级高敏信息防护\r
\r
```text\r
✅ 试卷中可出现学生真实姓名（如：座位号、学号）\r
❌ 试卷分析报告禁止点名\r
✅ 写回数据：聚合得分率\r
❌ 不写回：单个学生分数+排名\r
\r
✅ 试卷讲评可以用化名\r
❌ 禁止：把"差生"试卷公示\r
```\r
\r
---\r
\r
## 十二、行为准则\r
\r
| ✅ 应该做 | ❌ 不能做 |\r
|---------|---------|\r
| 双向细目表先于出题 | 直接从题库拼凑 |\r
| 每题配评分标准 | 只画对错 |\r
| 难度按测评目的设计 | 全卷偏难或全卷偏易 |\r
| 区分度 D > 0.20 | 接受 D \x3C 0.20 的题 |\r
| 标注题目版权 | 复制未授权教辅原题 |\r
| 考后分析反哺教学 | 考完就归档 |\r
| 写回数据用聚合形式 | 在公开报告中点名 |\r
\r
---\r
\r
## 十三、与其他 SKILL 的协同清单\r
\r
```text\r
测评设计师\r
    \x3C── xiaozhi-teach-lesson-planner（教学目标）\r
    \x3C── xiaozhi-teach-student-analyzer（学情分层）\r
    ──→ xiaozhi-teach-student-analyzer（得分率反哺）\r
    ──→ xiaozhi-teach-lesson-planner（教案调整）\r
    ──→ xiaozhi-teach-assignment-designer（作业调整）\r
    ──→ xiaozhi-teach-classroom-coach（讲评策略）\r
    ──→ 学科专项 SKILL（题目生成）\r
```\r
\r
**禁止行为**：\r
- 禁止 AI 凭空生成具体题目内容\r
- 禁止复制未授权教辅原题\r
- 禁止考后在公开报告中点名\r
- 禁止用分数给学生贴长期标签\r
- 禁止在试卷讲评中羞辱低分学生\r
\r
---\r
\r
## 十四、参考资源\r
\r
- `references/exam-blueprint.md` — 试卷蓝图与双向细目表模板\r
- `references/item-bank-mgmt.md` — 题库管理规范（待补）\r
- `references/post-exam-analysis.md` — 考后分析模板（待补）\r
\r
---\r
\r
> 🦞 **小龙虾说：**\r
> "好的试卷不是用来难倒学生的，\r
>  是用来照亮他们的——\r
>  照亮已经掌握的，照亮还没掌握的，\r
>  照亮老师下一步该讲什么。"\r

安全使用建议

Installers should understand that this skill may activate on broad education-related Chinese prompts and steer the agent into a formal assessment workflow. Review or narrow the trigger phrases if you want stricter control, especially when using it alongside other teaching or tutoring skills.

能力评估

✓ Purpose & Capability

The visible purpose is generating, designing, and reviewing tests or quizzes; the flagged trigger examples align with that educational assessment purpose.

ℹ Instruction Scope

The skill appears to use broad or mandatory activation language, which may cause accidental routing for nearby teaching requests, but this is a reliability and scope issue rather than a security concern.

✓ Install Mechanism

No artifact-backed evidence shows install-time scripts, package execution, hidden setup, or system modification. VirusTotal telemetry is clean.

✓ Credentials

The available evidence does not show file-system access, credential use, network calls, local indexing, or other environment access beyond normal text-generation guidance.

✓ Persistence & Privilege

No persistence, background workers, privilege escalation, account/session access, or long-running behavior is evidenced.

如何使用

确保已安装 OpenClaw（本地或 Docker 部署）
在对话框中输入安装命令：/install xiaozhi-teach-exam-designer
安装完成后，直接呼叫该 Skill 的名称或使用 /xiaozhi-teach-exam-designer 触发
根据 Skill 的参数说明提供必要输入，即可获得结构化输出

版本历史

v1.0.0

xiaozhi-teach-exam-designer 1.0.0 introduces a comprehensive, scientific workflow for exam and assessment design: - Provides a complete workflow: confirm assessment goals, design a two-dimensional table (双向细目表), select/modify questions, control difficulty, generate grading criteria, suggest post-exam analysis, and feed results back to student analysis. - Focuses on assessment goal alignment, difficulty gradient management, and standardized grading. - Does not auto-generate or select questions; relies on teacher-provided banks or subject-specific skills. - Clear boundaries on copyright and automatic scoring. - Strong integration with student performance analytics for closed-loop improvement. - Practical templates and self-check lists for every step ensure high-quality, purpose-driven assessments.

元数据

Slug xiaozhi-teach-exam-designer

版本 1.0.0

许可证 MIT-0

累计安装 0

当前安装数 0

历史版本数 1

常见问题