← 返回 Skills 市场
qizhitang

Xiaozhi Teach Exam Designer

作者 xiaozhi · GitHub ↗ · v1.0.0 · MIT-0
cross-platform ✓ 安全检测通过
28
总下载
0
收藏
0
当前安装
1
版本数
在 OpenClaw 中安装
/install xiaozhi-teach-exam-designer
功能描述
帮助老师从"拼凑试卷"升级为"科学测评设计"。 当老师说"帮我出一份试卷"、"设计一个单元测验"、 "怎么控制试卷难度"、"出一份月考卷"、 "这份卷子质量如何"时,必须激活此SKILL。 核心工作流:确认测评目标 → 设计双向细目表 → 筛选/改编题目 → 控制难度梯度 → 生成评分标准 → 考后分析建议 →...
使用说明 (SKILL.md)

\r \r

测评设计师 SKILL\r

\r

一句话定位: 好的测评不是为难学生,而是精准照见每个知识点的掌握状态。\r \r ---\r \r

⚠️ 技术实现边界声明\r

\r

关于"自动出题"机制: 本 SKILL 的题目来源有两种:\r ① 老师提供题库(推荐:老师自有改编题或公开可引用资源)\r ② 学科专项 SKILL 自动生成(如数学解题教练、英语写作教练)\r 本 SKILL 直接调用 LLM 凭空生成题目;不替老师挑选具体题目;只做"双向细目表设计+评分标准+难度梯度控制"。\r \r 关于"题目版权"边界: 所有题目必须标注 copyrightStatus(自有/公开可引用/仅存索引);不引用未授权的教辅原题。\r \r 关于"自动评分"边界: 本 SKILL 输出评分标准而非"自动判分";自动判分不在本 SKILL 能力范围。\r \r ---\r \r

一、核心使命\r

\r 老师出卷时常见的三个误区:\r \r

误区① 拼凑式出题:把往年卷子/教辅题目拼起来,\r
        不清楚每道题在"测什么"。\r
\r
误区② 难度一刀切:要么全卷偏难(学生大面积崩溃),\r
        要么全卷偏易(区分度低)。\r
\r
误区③ 评分不严格:评分标准模糊,\r
        不同老师改出来的分数差距大。\r
```\r
\r
本 SKILL 要解决的是:\r
- **让每道题都对应明确测评目标**:双向细目表驱动出题\r
- **让难度梯度可设计**:根据测评目的调整 P 值和 D 值\r
- **让评分标准可复制**:过程分+结果分双轨,不同老师改出来差异小\r
- **让测评数据反哺教学**:得分率回写 student-analyzer\r
\r
---\r
\r
## 二、触发时机\r
\r
| 触发场景 | 示例语句 |\r
|---------|---------|\r
| 设计新试卷 | "帮我出一份 X 单元试卷" / "出月考卷" |\r
| 单元小测 | "出一份 15 分钟小测" |\r
| 试卷讲评 | "这份卷子怎么讲评" |\r
| 试卷分析 | "这份卷子难度/区分度如何" |\r
| 命题 | "如何按双向细目表命题" |\r
| 评分标准 | "出评分细则" |\r
| 题目改编 | "这道题怎么改" |\r
| 试卷质量评估 | "这份卷子出得怎么样" |\r
\r
---\r
\r
## 三、核心流程\r
\r
```text\r
                ┌──────────────────────────┐\r
                │ ① 确认测评目的            │\r
                │  诊断/形成性/终结性/选拔  │\r
                └────────────┬─────────────┘\r
                             ↓\r
                ┌──────────────────────────┐\r
                │ ② 设计双向细目表          │\r
                │  知识点 × 认知层次 矩阵   │\r
                └────────────┬─────────────┘\r
                             ↓\r
                ┌──────────────────────────┐\r
                │ ③ 控制难度梯度            │\r
                │  基础/中等/提升/挑战      │\r
                └────────────┬─────────────┘\r
                             ↓\r
                ┌──────────────────────────┐\r
                │ ④ 筛选/改编题目           │\r
                │  按细目表匹配             │\r
                └────────────┬─────────────┘\r
                             ↓\r
                ┌──────────────────────────┐\r
                │ ⑤ 生成评分标准            │\r
                │  过程分+结果分双轨        │\r
                └────────────┬─────────────┘\r
                             ↓\r
                ┌──────────────────────────┐\r
                │ ⑥ 考后分析建议            │\r
                │  难度/区分度/反哺教学     │\r
                └────────────┬─────────────┘\r
                             ↓\r
                ┌──────────────────────────┐\r
                │ ⑦ 写回 student-analyzer   │\r
                │  得分率 → 知识点热力图    │\r
                └──────────────────────────┘\r
```\r
\r
---\r
\r
## 四、测评目的分类\r
\r
不同目的对应不同设计策略。\r
\r
```text\r
┌──────────┬──────────────┬──────────┬──────────┬────────────┐\r
│ 目的      │ 难度 P        │ 题量      │ 时长      │ 区分度 D    │\r
├──────────┼──────────────┼──────────┼──────────┼────────────┤\r
│ 诊断性    │ 0.55-0.70    │ 中等      │ 中等      │ 中等        │\r
│  (查弱项) │ 适中偏易     │          │          │            │\r
├──────────┼──────────────┼──────────┼──────────┼────────────┤\r
│ 形成性    │ 0.65-0.80    │ 较小      │ 较短      │ 良好        │\r
│  (单元)   │ 适中         │          │          │            │\r
├──────────┼──────────────┼──────────┼──────────┼────────────┤\r
│ 终结性    │ 0.55-0.75    │ 较大      │ 较长      │ 优秀        │\r
│  (期中/末) │ 适中偏难     │          │          │            │\r
├──────────┼──────────────┼──────────┼──────────┼────────────┤\r
│ 选拔性    │ 0.35-0.55    │ 大        │ 长        │ 极强        │\r
│  (竞赛)   │ 难           │          │          │            │\r
└──────────┴──────────────┴──────────┴──────────┴────────────┘\r
```\r
\r
---\r
\r
## 五、双向细目表设计(核心)\r
\r
### 5.1 双向细目表模板\r
\r
行:知识点(按章节分组)\r
列:Bloom 认知层次(记忆/理解/应用/分析/评价/创造)\r
\r
```text\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
📋 双向细目表 · [试卷名] · 满分 [N] 分\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
      │ 记忆 │ 理解 │ 应用 │ 分析 │ 评价 │ 创造 │ 合计\r
──────┼──────┼──────┼──────┼──────┼──────┼──────┼─────\r
知识点①│      │      │      │      │      │      │\r
知识点②│      │      │      │      │      │      │\r
知识点③│      │      │      │      │      │      │\r
知识点④│      │      │      │      │      │      │\r
知识点⑤│      │      │      │      │      │      │\r
──────┼──────┼──────┼──────┼──────┼──────┼──────┼─────\r
合 计  │      │      │      │      │      │      │\r
\r
■ 知识点-题号对应(填表后倒推)\r
  知识点①:题 [   ]\r
  知识点②:题 [   ]\r
  知识点③:题 [   ]\r
  知识点④:题 [   ]\r
  知识点⑤:题 [   ]\r
\r
■ 认知层次-题号对应\r
  记忆:题 [   ]   理解:题 [   ]\r
  应用:题 [   ]   分析:题 [   ]\r
  评价:题 [   ]   创造:题 [   ]\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
```\r
\r
### 5.2 双向细目表填写规则\r
\r
```text\r
■ 知识点覆盖\r
  · 重要知识点至少 1 道题\r
  · 核心知识点 2-3 道题\r
  · 选考知识点 1 道题(可标注"选做")\r
\r
■ 认知层次比例(按测评目的)\r
  诊断性  :记忆 30% + 理解 30% + 应用 25% + 分析 15% + 评价/创造 0%\r
  形成性  :记忆 20% + 理解 30% + 应用 30% + 分析 15% + 评价 5%\r
  终结性  :记忆 15% + 理解 25% + 应用 30% + 分析 20% + 评价 5% + 创造 5%\r
  选拔性  :记忆 5%  + 理解 15% + 应用 25% + 分析 30% + 评价 15% + 创造 10%\r
\r
■ 题目数量与分值\r
  · 单题分值与认知层次正相关(基础题分低,拔高题分高)\r
  · 总分必须等于各题分值之和\r
```\r
\r
### 5.3 双向细目表自检\r
\r
```text\r
□ 是否每个重要知识点都有 1 道以上题?\r
□ 是否每个认知层次都有 1 道以上题?\r
□ 比例是否符合测评目的?\r
□ 题量是否在合理范围?\r
  · 诊断性 8-12 题\r
  · 形成性 12-18 题\r
  · 终结性 18-25 题\r
  · 选拔性 20-30 题\r
□ 是否避免了"全卷都是应用题"或"全卷都是基础题"?\r
```\r
\r
---\r
\r
## 六、难度梯度设计\r
\r
### 6.1 难度系数 P\r
\r
```text\r
P = 班级平均分 / 满分\r
\r
按测评目的预设:\r
  诊断性:P 目标 0.55-0.70(适中偏易,照顾基础学生)\r
  形成性:P 目标 0.65-0.80(适中,符合课程标准)\r
  终结性:P 目标 0.55-0.75(适中偏难,区分度好)\r
  选拔性:P 目标 0.35-0.55(难,拉开差距)\r
```\r
\r
### 6.2 难度梯度比例\r
\r
```text\r
形成性测评(最常见):\r
\r
  基础题  50%  → 全体学生应会\r
    P > 0.85,直接套用规则\r
    占比 50%,分值 50%\r
\r
  中等题  30%  → 大部分学生应会\r
    P 0.55-0.85,一步变形\r
    占比 30%,分值 30%\r
\r
  提升题  15%  → 优等生主战场\r
    P 0.30-0.55,综合应用\r
    占比 15%,分值 15%\r
\r
  挑战题  5%   → 拔尖学生展示\r
    P \x3C 0.30,跨章迁移\r
    占比 5%,分值 5%\r
```\r
\r
### 6.3 区分度 D\r
\r
```text\r
D = 高分组得分率 - 低分组得分率\r
  D > 0.40 优秀\r
  D 0.20-0.40 良好\r
  D \x3C 0.20 不足\r
\r
每道题都应 D > 0.20;\r
D \x3C 0.20 的题说明"所有学生都错"或"所有学生都对",\r
应改题或删题。\r
```\r
\r
---\r
\r
## 七、题目筛选与改编\r
\r
### 7.1 题目信息表\r
\r
每道被选中的题目必须有以下完整信息:\r
\r
```text\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
📋 题目信息表\r
题号:[   ] · 分值:[   ] · 预计用时:[   ] 分钟\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
■ 来源\r
  出处:[自有/改编自 XX 教辅/原创新题]\r
  copyrightStatus:[自有/公开可引用/仅存索引]\r
  改编记录:[原题出处 + 改编点]\r
\r
■ 测评目标\r
  知识点:[   ]\r
  认知层次:[记忆/理解/应用/分析/评价/创造]\r
  预期难度:[基础/中等/提升/挑战]\r
\r
■ 内容\r
  题目:[题干]\r
  答案:[标准答案]\r
  评分标准:[过程分+结果分]\r
\r
■ 质量预测\r
  预估 P:[   ]\r
  预估 D:[   ]\r
  预估完成时间:[   ] 分钟\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
```\r
\r
### 7.2 改编原则\r
\r
```text\r
■ 改数(参数)\r
  原题 y=2x+1 → 改编 y=3x-2\r
  适合:同一知识点不同参数\r
\r
■ 改问(设问角度)\r
  原题"求 X" → 改编"判断 X 是否正确"\r
  适合:换角度测同一概念\r
\r
■ 改情境(背景)\r
  原题"出租车" → 改编"网约车"\r
  适合:让题目更贴近学生生活\r
\r
■ 改综合度\r
  单知识点 → 多知识点综合\r
  适合:测评综合应用能力\r
```\r
\r
### 7.3 题目版权管理\r
\r
```text\r
✅ 自有:老师原创或组内原创\r
✅ 公开可引用:教材例题、CC 协议资源\r
⚠️ 仅存索引:教辅原题只记题号,不复制题干\r
❌ 禁止:未授权复制教辅原题\r
\r
若引用改编题,必须标注"原题出处 + 改编点"。\r
```\r
\r
---\r
\r
## 八、评分标准生成\r
\r
每道题配 1 份评分标准。\r
\r
### 8.1 评分标准模板\r
\r
```text\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
📋 评分标准 · 第 [N] 题\r
满分:[   ] 分\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
■ 过程分([N] 分)\r
  · 步骤 1([M] 分):[具体内容]\r
  · 步骤 2([M] 分):[具体内容]\r
  · 步骤 3([M] 分):[具体内容]\r
  · 关键概念/规则([M] 分):[具体内容]\r
\r
■ 结果分([N] 分)\r
  · 答案正确([M] 分)\r
  · 单位/格式([M] 分)\r
\r
■ 常见错误与扣分\r
  · 错误 ①:[描述] → 扣 [M] 分\r
  · 错误 ②:[描述] → 扣 [M] 分\r
\r
■ 满分模板\r
  [步骤化满分作答]\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
```\r
\r
### 8.2 评分标准严格化\r
\r
```text\r
■ 过程分细化\r
  关键步骤必须给过程分(不能跳过)\r
  步骤 1 + 步骤 2 + 步骤 3 = 过程分\r
  避免"答案对了就给满分"的粗放评分\r
\r
■ 结果分明确\r
  答案对 + 过程对 = 满分\r
  答案对 + 过程有错 = 部分分\r
  答案错 + 过程对 = 部分分\r
\r
■ 评分一致性\r
  不同老师按本标准改出来差距应 \x3C 3 分\r
  若差距 > 5 分,说明标准不够明确\r
```\r
\r
### 8.3 简明答案评分(客观题)\r
\r
```text\r
选择题 / 填空题 / 判断题:\r
  正确答案:[X]\r
  错误答案扣分:全错 0 分,部分对酌情\r
\r
简答题(无固定过程):\r
  关键点 ①([M] 分):[具体内容]\r
  关键点 ②([M] 分):[具体内容]\r
  表达清晰度([M] 分):[酌情]\r
```\r
\r
---\r
\r
## 九、考后分析建议\r
\r
### 9.1 试卷质量分析\r
\r
```text\r
■ 整体质量\r
  · 实际 P:[   ](与目标 P 对比)\r
  · 实际 D:[   ](区分度评估)\r
  · 实际平均分 / 中位数 / 标准差\r
  · 优秀率 / 及格率 / 低分率\r
\r
■ 题目质量\r
  · D \x3C 0.20 的题:[列表] → 改题或删题\r
  · P > 0.95 的题(太易):[列表] → 升级为讲解素材\r
  · P \x3C 0.30 的题(太难):[列表] → 拆分或降级\r
```\r
\r
### 9.2 知识点热力图\r
\r
```text\r
┌────────────────────────────────────┐\r
│ 知识点得分率热力图                   │\r
├────────────────────────────────────┤\r
│ 知识点① 🟢 82%                     │\r
│ 知识点② 🟡 56%                     │\r
│ 知识点③ 🔴 32%  ← 共性弱项        │\r
│ 知识点④ 🟡 65%                     │\r
│ 知识点⑤ 🔴 38%  ← 共性弱项        │\r
└────────────────────────────────────┘\r
图例:🔴 \x3C 40% / 🟡 40-70% / 🟢 > 70%\r
```\r
\r
### 9.3 写回 student-analyzer\r
\r
```text\r
写:\r
  · 各题得分率\r
  · 各知识点得分率\r
  · 各认知层次得分率\r
  · 区分度异常的题目\r
\r
→ student-analyzer 接收后生成:\r
  · 班级画像\r
  · 个体诊断卡\r
  · 教学调整建议\r
```\r
\r
---\r
\r
## 十、与上游/下游 SKILL 的协作\r
\r
### 10.1 协作流图\r
\r
```text\r
              ┌────────────────────────┐\r
              │ xiaozhi-teach-         │\r
              │  lesson-planner        │\r
              │ (教学目标)           │\r
              └───────────┬────────────┘\r
                          │\r
                          ↓\r
              ┌────────────────────────┐\r
              │ xiaozhi-teach-         │\r
              │  exam-designer         │\r
              │  (本 SKILL)           │\r
              └───────────┬────────────┘\r
                          │\r
                          ↓ 得分率反哺\r
              ┌────────────────────────┐\r
              │ xiaozhi-teach-         │\r
              │  student-analyzer      │\r
              │ (学情更新)           │\r
              └───────────┬────────────┘\r
                          │\r
        ┌─────────────────┼─────────────────┐\r
        ↓                 ↓                 ↓\r
  lesson-planner    assignment-     classroom-coach\r
  (教案调整)      designer        (讲评策略)\r
                    (作业调整)\r
```\r
\r
### 10.2 接口\r
\r
```text\r
读:\r
  lessonPlan.emphasis       → 试卷侧重点\r
  studentAnalyzer.classDistribution → 难度梯度参考\r
  studentAnalyzer.weaknessRank      → 必须覆盖的弱项\r
\r
写:\r
  examBlueprint.actualDifficulty → 实际难度\r
  examBlueprint.discrimination  → 实际区分度\r
  examBlueprint.itemQuality     → 题目质量评估\r
  examBlueprint.scoreRate       → 得分率(→ student-analyzer)\r
```\r
\r
---\r
\r
## 十一、字段级高敏信息防护\r
\r
```text\r
✅ 试卷中可出现学生真实姓名(如:座位号、学号)\r
❌ 试卷分析报告禁止点名\r
✅ 写回数据:聚合得分率\r
❌ 不写回:单个学生分数+排名\r
\r
✅ 试卷讲评可以用化名\r
❌ 禁止:把"差生"试卷公示\r
```\r
\r
---\r
\r
## 十二、行为准则\r
\r
| ✅ 应该做 | ❌ 不能做 |\r
|---------|---------|\r
| 双向细目表先于出题 | 直接从题库拼凑 |\r
| 每题配评分标准 | 只画对错 |\r
| 难度按测评目的设计 | 全卷偏难或全卷偏易 |\r
| 区分度 D > 0.20 | 接受 D \x3C 0.20 的题 |\r
| 标注题目版权 | 复制未授权教辅原题 |\r
| 考后分析反哺教学 | 考完就归档 |\r
| 写回数据用聚合形式 | 在公开报告中点名 |\r
\r
---\r
\r
## 十三、与其他 SKILL 的协同清单\r
\r
```text\r
测评设计师\r
    \x3C── xiaozhi-teach-lesson-planner(教学目标)\r
    \x3C── xiaozhi-teach-student-analyzer(学情分层)\r
    ──→ xiaozhi-teach-student-analyzer(得分率反哺)\r
    ──→ xiaozhi-teach-lesson-planner(教案调整)\r
    ──→ xiaozhi-teach-assignment-designer(作业调整)\r
    ──→ xiaozhi-teach-classroom-coach(讲评策略)\r
    ──→ 学科专项 SKILL(题目生成)\r
```\r
\r
**禁止行为**:\r
- 禁止 AI 凭空生成具体题目内容\r
- 禁止复制未授权教辅原题\r
- 禁止考后在公开报告中点名\r
- 禁止用分数给学生贴长期标签\r
- 禁止在试卷讲评中羞辱低分学生\r
\r
---\r
\r
## 十四、参考资源\r
\r
- `references/exam-blueprint.md` — 试卷蓝图与双向细目表模板\r
- `references/item-bank-mgmt.md` — 题库管理规范(待补)\r
- `references/post-exam-analysis.md` — 考后分析模板(待补)\r
\r
---\r
\r
> 🦞 **小龙虾说:**\r
> "好的试卷不是用来难倒学生的,\r
>  是用来照亮他们的——\r
>  照亮已经掌握的,照亮还没掌握的,\r
>  照亮老师下一步该讲什么。"\r
安全使用建议
Installers should understand that this skill may activate on broad education-related Chinese prompts and steer the agent into a formal assessment workflow. Review or narrow the trigger phrases if you want stricter control, especially when using it alongside other teaching or tutoring skills.
能力评估
Purpose & Capability
The visible purpose is generating, designing, and reviewing tests or quizzes; the flagged trigger examples align with that educational assessment purpose.
Instruction Scope
The skill appears to use broad or mandatory activation language, which may cause accidental routing for nearby teaching requests, but this is a reliability and scope issue rather than a security concern.
Install Mechanism
No artifact-backed evidence shows install-time scripts, package execution, hidden setup, or system modification. VirusTotal telemetry is clean.
Credentials
The available evidence does not show file-system access, credential use, network calls, local indexing, or other environment access beyond normal text-generation guidance.
Persistence & Privilege
No persistence, background workers, privilege escalation, account/session access, or long-running behavior is evidenced.
如何使用
  1. 确保已安装 OpenClaw(本地或 Docker 部署)
  2. 在对话框中输入安装命令:/install xiaozhi-teach-exam-designer
  3. 安装完成后,直接呼叫该 Skill 的名称或使用 /xiaozhi-teach-exam-designer 触发
  4. 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
版本历史
v1.0.0
xiaozhi-teach-exam-designer 1.0.0 introduces a comprehensive, scientific workflow for exam and assessment design: - Provides a complete workflow: confirm assessment goals, design a two-dimensional table (双向细目表), select/modify questions, control difficulty, generate grading criteria, suggest post-exam analysis, and feed results back to student analysis. - Focuses on assessment goal alignment, difficulty gradient management, and standardized grading. - Does not auto-generate or select questions; relies on teacher-provided banks or subject-specific skills. - Clear boundaries on copyright and automatic scoring. - Strong integration with student performance analytics for closed-loop improvement. - Practical templates and self-check lists for every step ensure high-quality, purpose-driven assessments.
元数据
Slug xiaozhi-teach-exam-designer
版本 1.0.0
许可证 MIT-0
累计安装 0
当前安装数 0
历史版本数 1
常见问题

Xiaozhi Teach Exam Designer 是什么?

帮助老师从"拼凑试卷"升级为"科学测评设计"。 当老师说"帮我出一份试卷"、"设计一个单元测验"、 "怎么控制试卷难度"、"出一份月考卷"、 "这份卷子质量如何"时,必须激活此SKILL。 核心工作流:确认测评目标 → 设计双向细目表 → 筛选/改编题目 → 控制难度梯度 → 生成评分标准 → 考后分析建议 →... 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 28 次。

如何安装 Xiaozhi Teach Exam Designer?

在 OpenClaw 或 Claude Code 对话框中运行命令「/install xiaozhi-teach-exam-designer」即可一键安装,无需额外配置。

Xiaozhi Teach Exam Designer 是免费的吗?

是的,Xiaozhi Teach Exam Designer 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。

Xiaozhi Teach Exam Designer 支持哪些平台?

Xiaozhi Teach Exam Designer 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。

谁开发了 Xiaozhi Teach Exam Designer?

由 xiaozhi(@qizhitang)开发并维护,当前版本 v1.0.0。

💬 留言讨论