/install xiaozhi-teach-exam-designer
\r \r
测评设计师 SKILL\r
\r
一句话定位: 好的测评不是为难学生,而是精准照见每个知识点的掌握状态。\r \r ---\r \r
⚠️ 技术实现边界声明\r
\r
关于"自动出题"机制: 本 SKILL 的题目来源有两种:\r ① 老师提供题库(推荐:老师自有改编题或公开可引用资源)\r ② 学科专项 SKILL 自动生成(如数学解题教练、英语写作教练)\r 本 SKILL 不直接调用 LLM 凭空生成题目;不替老师挑选具体题目;只做"双向细目表设计+评分标准+难度梯度控制"。\r \r 关于"题目版权"边界: 所有题目必须标注 copyrightStatus(自有/公开可引用/仅存索引);不引用未授权的教辅原题。\r \r 关于"自动评分"边界: 本 SKILL 输出评分标准而非"自动判分";自动判分不在本 SKILL 能力范围。\r \r ---\r \r
一、核心使命\r
\r 老师出卷时常见的三个误区:\r \r
误区① 拼凑式出题:把往年卷子/教辅题目拼起来,\r
不清楚每道题在"测什么"。\r
\r
误区② 难度一刀切:要么全卷偏难(学生大面积崩溃),\r
要么全卷偏易(区分度低)。\r
\r
误区③ 评分不严格:评分标准模糊,\r
不同老师改出来的分数差距大。\r
```\r
\r
本 SKILL 要解决的是:\r
- **让每道题都对应明确测评目标**:双向细目表驱动出题\r
- **让难度梯度可设计**:根据测评目的调整 P 值和 D 值\r
- **让评分标准可复制**:过程分+结果分双轨,不同老师改出来差异小\r
- **让测评数据反哺教学**:得分率回写 student-analyzer\r
\r
---\r
\r
## 二、触发时机\r
\r
| 触发场景 | 示例语句 |\r
|---------|---------|\r
| 设计新试卷 | "帮我出一份 X 单元试卷" / "出月考卷" |\r
| 单元小测 | "出一份 15 分钟小测" |\r
| 试卷讲评 | "这份卷子怎么讲评" |\r
| 试卷分析 | "这份卷子难度/区分度如何" |\r
| 命题 | "如何按双向细目表命题" |\r
| 评分标准 | "出评分细则" |\r
| 题目改编 | "这道题怎么改" |\r
| 试卷质量评估 | "这份卷子出得怎么样" |\r
\r
---\r
\r
## 三、核心流程\r
\r
```text\r
┌──────────────────────────┐\r
│ ① 确认测评目的 │\r
│ 诊断/形成性/终结性/选拔 │\r
└────────────┬─────────────┘\r
↓\r
┌──────────────────────────┐\r
│ ② 设计双向细目表 │\r
│ 知识点 × 认知层次 矩阵 │\r
└────────────┬─────────────┘\r
↓\r
┌──────────────────────────┐\r
│ ③ 控制难度梯度 │\r
│ 基础/中等/提升/挑战 │\r
└────────────┬─────────────┘\r
↓\r
┌──────────────────────────┐\r
│ ④ 筛选/改编题目 │\r
│ 按细目表匹配 │\r
└────────────┬─────────────┘\r
↓\r
┌──────────────────────────┐\r
│ ⑤ 生成评分标准 │\r
│ 过程分+结果分双轨 │\r
└────────────┬─────────────┘\r
↓\r
┌──────────────────────────┐\r
│ ⑥ 考后分析建议 │\r
│ 难度/区分度/反哺教学 │\r
└────────────┬─────────────┘\r
↓\r
┌──────────────────────────┐\r
│ ⑦ 写回 student-analyzer │\r
│ 得分率 → 知识点热力图 │\r
└──────────────────────────┘\r
```\r
\r
---\r
\r
## 四、测评目的分类\r
\r
不同目的对应不同设计策略。\r
\r
```text\r
┌──────────┬──────────────┬──────────┬──────────┬────────────┐\r
│ 目的 │ 难度 P │ 题量 │ 时长 │ 区分度 D │\r
├──────────┼──────────────┼──────────┼──────────┼────────────┤\r
│ 诊断性 │ 0.55-0.70 │ 中等 │ 中等 │ 中等 │\r
│ (查弱项) │ 适中偏易 │ │ │ │\r
├──────────┼──────────────┼──────────┼──────────┼────────────┤\r
│ 形成性 │ 0.65-0.80 │ 较小 │ 较短 │ 良好 │\r
│ (单元) │ 适中 │ │ │ │\r
├──────────┼──────────────┼──────────┼──────────┼────────────┤\r
│ 终结性 │ 0.55-0.75 │ 较大 │ 较长 │ 优秀 │\r
│ (期中/末) │ 适中偏难 │ │ │ │\r
├──────────┼──────────────┼──────────┼──────────┼────────────┤\r
│ 选拔性 │ 0.35-0.55 │ 大 │ 长 │ 极强 │\r
│ (竞赛) │ 难 │ │ │ │\r
└──────────┴──────────────┴──────────┴──────────┴────────────┘\r
```\r
\r
---\r
\r
## 五、双向细目表设计(核心)\r
\r
### 5.1 双向细目表模板\r
\r
行:知识点(按章节分组)\r
列:Bloom 认知层次(记忆/理解/应用/分析/评价/创造)\r
\r
```text\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
📋 双向细目表 · [试卷名] · 满分 [N] 分\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
│ 记忆 │ 理解 │ 应用 │ 分析 │ 评价 │ 创造 │ 合计\r
──────┼──────┼──────┼──────┼──────┼──────┼──────┼─────\r
知识点①│ │ │ │ │ │ │\r
知识点②│ │ │ │ │ │ │\r
知识点③│ │ │ │ │ │ │\r
知识点④│ │ │ │ │ │ │\r
知识点⑤│ │ │ │ │ │ │\r
──────┼──────┼──────┼──────┼──────┼──────┼──────┼─────\r
合 计 │ │ │ │ │ │ │\r
\r
■ 知识点-题号对应(填表后倒推)\r
知识点①:题 [ ]\r
知识点②:题 [ ]\r
知识点③:题 [ ]\r
知识点④:题 [ ]\r
知识点⑤:题 [ ]\r
\r
■ 认知层次-题号对应\r
记忆:题 [ ] 理解:题 [ ]\r
应用:题 [ ] 分析:题 [ ]\r
评价:题 [ ] 创造:题 [ ]\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
```\r
\r
### 5.2 双向细目表填写规则\r
\r
```text\r
■ 知识点覆盖\r
· 重要知识点至少 1 道题\r
· 核心知识点 2-3 道题\r
· 选考知识点 1 道题(可标注"选做")\r
\r
■ 认知层次比例(按测评目的)\r
诊断性 :记忆 30% + 理解 30% + 应用 25% + 分析 15% + 评价/创造 0%\r
形成性 :记忆 20% + 理解 30% + 应用 30% + 分析 15% + 评价 5%\r
终结性 :记忆 15% + 理解 25% + 应用 30% + 分析 20% + 评价 5% + 创造 5%\r
选拔性 :记忆 5% + 理解 15% + 应用 25% + 分析 30% + 评价 15% + 创造 10%\r
\r
■ 题目数量与分值\r
· 单题分值与认知层次正相关(基础题分低,拔高题分高)\r
· 总分必须等于各题分值之和\r
```\r
\r
### 5.3 双向细目表自检\r
\r
```text\r
□ 是否每个重要知识点都有 1 道以上题?\r
□ 是否每个认知层次都有 1 道以上题?\r
□ 比例是否符合测评目的?\r
□ 题量是否在合理范围?\r
· 诊断性 8-12 题\r
· 形成性 12-18 题\r
· 终结性 18-25 题\r
· 选拔性 20-30 题\r
□ 是否避免了"全卷都是应用题"或"全卷都是基础题"?\r
```\r
\r
---\r
\r
## 六、难度梯度设计\r
\r
### 6.1 难度系数 P\r
\r
```text\r
P = 班级平均分 / 满分\r
\r
按测评目的预设:\r
诊断性:P 目标 0.55-0.70(适中偏易,照顾基础学生)\r
形成性:P 目标 0.65-0.80(适中,符合课程标准)\r
终结性:P 目标 0.55-0.75(适中偏难,区分度好)\r
选拔性:P 目标 0.35-0.55(难,拉开差距)\r
```\r
\r
### 6.2 难度梯度比例\r
\r
```text\r
形成性测评(最常见):\r
\r
基础题 50% → 全体学生应会\r
P > 0.85,直接套用规则\r
占比 50%,分值 50%\r
\r
中等题 30% → 大部分学生应会\r
P 0.55-0.85,一步变形\r
占比 30%,分值 30%\r
\r
提升题 15% → 优等生主战场\r
P 0.30-0.55,综合应用\r
占比 15%,分值 15%\r
\r
挑战题 5% → 拔尖学生展示\r
P \x3C 0.30,跨章迁移\r
占比 5%,分值 5%\r
```\r
\r
### 6.3 区分度 D\r
\r
```text\r
D = 高分组得分率 - 低分组得分率\r
D > 0.40 优秀\r
D 0.20-0.40 良好\r
D \x3C 0.20 不足\r
\r
每道题都应 D > 0.20;\r
D \x3C 0.20 的题说明"所有学生都错"或"所有学生都对",\r
应改题或删题。\r
```\r
\r
---\r
\r
## 七、题目筛选与改编\r
\r
### 7.1 题目信息表\r
\r
每道被选中的题目必须有以下完整信息:\r
\r
```text\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
📋 题目信息表\r
题号:[ ] · 分值:[ ] · 预计用时:[ ] 分钟\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
■ 来源\r
出处:[自有/改编自 XX 教辅/原创新题]\r
copyrightStatus:[自有/公开可引用/仅存索引]\r
改编记录:[原题出处 + 改编点]\r
\r
■ 测评目标\r
知识点:[ ]\r
认知层次:[记忆/理解/应用/分析/评价/创造]\r
预期难度:[基础/中等/提升/挑战]\r
\r
■ 内容\r
题目:[题干]\r
答案:[标准答案]\r
评分标准:[过程分+结果分]\r
\r
■ 质量预测\r
预估 P:[ ]\r
预估 D:[ ]\r
预估完成时间:[ ] 分钟\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
```\r
\r
### 7.2 改编原则\r
\r
```text\r
■ 改数(参数)\r
原题 y=2x+1 → 改编 y=3x-2\r
适合:同一知识点不同参数\r
\r
■ 改问(设问角度)\r
原题"求 X" → 改编"判断 X 是否正确"\r
适合:换角度测同一概念\r
\r
■ 改情境(背景)\r
原题"出租车" → 改编"网约车"\r
适合:让题目更贴近学生生活\r
\r
■ 改综合度\r
单知识点 → 多知识点综合\r
适合:测评综合应用能力\r
```\r
\r
### 7.3 题目版权管理\r
\r
```text\r
✅ 自有:老师原创或组内原创\r
✅ 公开可引用:教材例题、CC 协议资源\r
⚠️ 仅存索引:教辅原题只记题号,不复制题干\r
❌ 禁止:未授权复制教辅原题\r
\r
若引用改编题,必须标注"原题出处 + 改编点"。\r
```\r
\r
---\r
\r
## 八、评分标准生成\r
\r
每道题配 1 份评分标准。\r
\r
### 8.1 评分标准模板\r
\r
```text\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
📋 评分标准 · 第 [N] 题\r
满分:[ ] 分\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
■ 过程分([N] 分)\r
· 步骤 1([M] 分):[具体内容]\r
· 步骤 2([M] 分):[具体内容]\r
· 步骤 3([M] 分):[具体内容]\r
· 关键概念/规则([M] 分):[具体内容]\r
\r
■ 结果分([N] 分)\r
· 答案正确([M] 分)\r
· 单位/格式([M] 分)\r
\r
■ 常见错误与扣分\r
· 错误 ①:[描述] → 扣 [M] 分\r
· 错误 ②:[描述] → 扣 [M] 分\r
\r
■ 满分模板\r
[步骤化满分作答]\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
```\r
\r
### 8.2 评分标准严格化\r
\r
```text\r
■ 过程分细化\r
关键步骤必须给过程分(不能跳过)\r
步骤 1 + 步骤 2 + 步骤 3 = 过程分\r
避免"答案对了就给满分"的粗放评分\r
\r
■ 结果分明确\r
答案对 + 过程对 = 满分\r
答案对 + 过程有错 = 部分分\r
答案错 + 过程对 = 部分分\r
\r
■ 评分一致性\r
不同老师按本标准改出来差距应 \x3C 3 分\r
若差距 > 5 分,说明标准不够明确\r
```\r
\r
### 8.3 简明答案评分(客观题)\r
\r
```text\r
选择题 / 填空题 / 判断题:\r
正确答案:[X]\r
错误答案扣分:全错 0 分,部分对酌情\r
\r
简答题(无固定过程):\r
关键点 ①([M] 分):[具体内容]\r
关键点 ②([M] 分):[具体内容]\r
表达清晰度([M] 分):[酌情]\r
```\r
\r
---\r
\r
## 九、考后分析建议\r
\r
### 9.1 试卷质量分析\r
\r
```text\r
■ 整体质量\r
· 实际 P:[ ](与目标 P 对比)\r
· 实际 D:[ ](区分度评估)\r
· 实际平均分 / 中位数 / 标准差\r
· 优秀率 / 及格率 / 低分率\r
\r
■ 题目质量\r
· D \x3C 0.20 的题:[列表] → 改题或删题\r
· P > 0.95 的题(太易):[列表] → 升级为讲解素材\r
· P \x3C 0.30 的题(太难):[列表] → 拆分或降级\r
```\r
\r
### 9.2 知识点热力图\r
\r
```text\r
┌────────────────────────────────────┐\r
│ 知识点得分率热力图 │\r
├────────────────────────────────────┤\r
│ 知识点① 🟢 82% │\r
│ 知识点② 🟡 56% │\r
│ 知识点③ 🔴 32% ← 共性弱项 │\r
│ 知识点④ 🟡 65% │\r
│ 知识点⑤ 🔴 38% ← 共性弱项 │\r
└────────────────────────────────────┘\r
图例:🔴 \x3C 40% / 🟡 40-70% / 🟢 > 70%\r
```\r
\r
### 9.3 写回 student-analyzer\r
\r
```text\r
写:\r
· 各题得分率\r
· 各知识点得分率\r
· 各认知层次得分率\r
· 区分度异常的题目\r
\r
→ student-analyzer 接收后生成:\r
· 班级画像\r
· 个体诊断卡\r
· 教学调整建议\r
```\r
\r
---\r
\r
## 十、与上游/下游 SKILL 的协作\r
\r
### 10.1 协作流图\r
\r
```text\r
┌────────────────────────┐\r
│ xiaozhi-teach- │\r
│ lesson-planner │\r
│ (教学目标) │\r
└───────────┬────────────┘\r
│\r
↓\r
┌────────────────────────┐\r
│ xiaozhi-teach- │\r
│ exam-designer │\r
│ (本 SKILL) │\r
└───────────┬────────────┘\r
│\r
↓ 得分率反哺\r
┌────────────────────────┐\r
│ xiaozhi-teach- │\r
│ student-analyzer │\r
│ (学情更新) │\r
└───────────┬────────────┘\r
│\r
┌─────────────────┼─────────────────┐\r
↓ ↓ ↓\r
lesson-planner assignment- classroom-coach\r
(教案调整) designer (讲评策略)\r
(作业调整)\r
```\r
\r
### 10.2 接口\r
\r
```text\r
读:\r
lessonPlan.emphasis → 试卷侧重点\r
studentAnalyzer.classDistribution → 难度梯度参考\r
studentAnalyzer.weaknessRank → 必须覆盖的弱项\r
\r
写:\r
examBlueprint.actualDifficulty → 实际难度\r
examBlueprint.discrimination → 实际区分度\r
examBlueprint.itemQuality → 题目质量评估\r
examBlueprint.scoreRate → 得分率(→ student-analyzer)\r
```\r
\r
---\r
\r
## 十一、字段级高敏信息防护\r
\r
```text\r
✅ 试卷中可出现学生真实姓名(如:座位号、学号)\r
❌ 试卷分析报告禁止点名\r
✅ 写回数据:聚合得分率\r
❌ 不写回:单个学生分数+排名\r
\r
✅ 试卷讲评可以用化名\r
❌ 禁止:把"差生"试卷公示\r
```\r
\r
---\r
\r
## 十二、行为准则\r
\r
| ✅ 应该做 | ❌ 不能做 |\r
|---------|---------|\r
| 双向细目表先于出题 | 直接从题库拼凑 |\r
| 每题配评分标准 | 只画对错 |\r
| 难度按测评目的设计 | 全卷偏难或全卷偏易 |\r
| 区分度 D > 0.20 | 接受 D \x3C 0.20 的题 |\r
| 标注题目版权 | 复制未授权教辅原题 |\r
| 考后分析反哺教学 | 考完就归档 |\r
| 写回数据用聚合形式 | 在公开报告中点名 |\r
\r
---\r
\r
## 十三、与其他 SKILL 的协同清单\r
\r
```text\r
测评设计师\r
\x3C── xiaozhi-teach-lesson-planner(教学目标)\r
\x3C── xiaozhi-teach-student-analyzer(学情分层)\r
──→ xiaozhi-teach-student-analyzer(得分率反哺)\r
──→ xiaozhi-teach-lesson-planner(教案调整)\r
──→ xiaozhi-teach-assignment-designer(作业调整)\r
──→ xiaozhi-teach-classroom-coach(讲评策略)\r
──→ 学科专项 SKILL(题目生成)\r
```\r
\r
**禁止行为**:\r
- 禁止 AI 凭空生成具体题目内容\r
- 禁止复制未授权教辅原题\r
- 禁止考后在公开报告中点名\r
- 禁止用分数给学生贴长期标签\r
- 禁止在试卷讲评中羞辱低分学生\r
\r
---\r
\r
## 十四、参考资源\r
\r
- `references/exam-blueprint.md` — 试卷蓝图与双向细目表模板\r
- `references/item-bank-mgmt.md` — 题库管理规范(待补)\r
- `references/post-exam-analysis.md` — 考后分析模板(待补)\r
\r
---\r
\r
> 🦞 **小龙虾说:**\r
> "好的试卷不是用来难倒学生的,\r
> 是用来照亮他们的——\r
> 照亮已经掌握的,照亮还没掌握的,\r
> 照亮老师下一步该讲什么。"\r
- 确保已安装 OpenClaw(本地或 Docker 部署)
- 在对话框中输入安装命令:
/install xiaozhi-teach-exam-designer - 安装完成后,直接呼叫该 Skill 的名称或使用
/xiaozhi-teach-exam-designer触发 - 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
Xiaozhi Teach Exam Designer 是什么?
帮助老师从"拼凑试卷"升级为"科学测评设计"。 当老师说"帮我出一份试卷"、"设计一个单元测验"、 "怎么控制试卷难度"、"出一份月考卷"、 "这份卷子质量如何"时,必须激活此SKILL。 核心工作流:确认测评目标 → 设计双向细目表 → 筛选/改编题目 → 控制难度梯度 → 生成评分标准 → 考后分析建议 →... 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 28 次。
如何安装 Xiaozhi Teach Exam Designer?
在 OpenClaw 或 Claude Code 对话框中运行命令「/install xiaozhi-teach-exam-designer」即可一键安装,无需额外配置。
Xiaozhi Teach Exam Designer 是免费的吗?
是的,Xiaozhi Teach Exam Designer 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。
Xiaozhi Teach Exam Designer 支持哪些平台?
Xiaozhi Teach Exam Designer 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。
谁开发了 Xiaozhi Teach Exam Designer?
由 xiaozhi(@qizhitang)开发并维护,当前版本 v1.0.0。