/install xiaozhi-teach-math-exam-designer
\r \r
数学测评设计 SKILL\r
\r
一句话定位: 测评不是给学员"打标签",而是给教学"照镜子"——双向细目表是从"出题感觉"到"诊断精准"的桥梁。\r \r ---\r \r
⚠️ 技术实现边界声明\r
\r
关于"AI 出题"边界: 本 SKILL 输出测评设计框架与双向细目表;不代替老师出完整试卷。\r \r 关于"题目版权"边界: 题目必须标注 copyrightStatus;不复制未授权教辅题库。\r \r 关于"AI 评分"边界: 本 SKILL 不替老师阅卷评分;只提供分析框架和教学建议。\r \r ---\r \r
一、核心使命\r
\r 数学测评设计常见的三个误区:\r \r
误区① 出题=凭感觉:老师"凭感觉"出题,\r
难易不均,覆盖不全,学员做起来忽高忽低。\r
\r
误区② 测评=打分:测完了打个分就完事,\r
没有诊断,没有后续教学。\r
\r
误区③ 试卷=模仿:抄一份模拟卷,\r
没考虑本班学员的实际水平。\r
```\r
\r
本 SKILL 要解决的是:\r
- **让测评"有目标"**:诊断/形成/总结 三类\r
- **让出题"有依据"**:双向细目表\r
- **让难度"有梯度"**:基础/中等/提升\r
- **让结果"有诊断"**:错因+能力+教学干预\r
\r
---\r
\r
## 二、触发时机\r
\r
| 触发场景 | 示例语句 |\r
|---------|---------|\r
| 测评设计 | "这周考什么" |\r
| 试卷出题 | "试卷怎么出" |\r
| 双向细目表 | "双向细目表" |\r
| 诊断性测评 | "诊断性测评" |\r
| 形成性测评 | "形成性测评" |\r
| 难度梯度 | "题目难度怎么安排" |\r
| 测评分析 | "测评结果怎么用" |\r
| 学员测评 | "学员测评" |\r
\r
---\r
\r
## 三、核心流程\r
\r
```text\r
┌──────────────────────────┐\r
│ ① 测评目标 │\r
│ 诊断/形成/总结 │\r
└────────────┬─────────────┘\r
↓\r
┌──────────────────────────┐\r
│ ② 双向细目表 │\r
│ 知识点×认知层级 │\r
└────────────┬─────────────┘\r
↓\r
┌──────────────────────────┐\r
│ ③ 题目选编 │\r
│ 教材/改编/自有 │\r
└────────────┬─────────────┘\r
↓\r
┌──────────────────────────┐\r
│ ④ 难度梯度 │\r
│ 基础/中等/提升 │\r
└────────────┬─────────────┘\r
↓\r
┌──────────────────────────┐\r
│ ⑤ 测评实施 │\r
│ 限时/规则/讲评 │\r
└────────────┬─────────────┘\r
↓\r
┌──────────────────────────┐\r
│ ⑥ 结果分析 │\r
│ 错因/能力/教学 │\r
└────────────┬─────────────┘\r
↓\r
┌──────────────────────────┐\r
│ ⑦ 写回 student-analyzer │\r
│ 测评能力维度 │\r
└──────────────────────────┘\r
```\r
\r
---\r
\r
## 四、测评目标(三类)\r
\r
### 4.1 测评类型总览\r
\r
```text\r
┌──────────┬────────────────────────┬────────────┬──────────────┐\r
│ 类型 │ 描述 │ 时机 │ 目的 │\r
├──────────┼────────────────────────┼────────────┼──────────────┤\r
│ 诊断性 │ 测"学员已有什么" │ 单元/学期初 │ 找起点 │\r
│ 形成性 │ 测"学员学到哪了" │ 单元/期中 │ 调进度 │\r
│ 总结性 │ 测"学员学得怎样" │ 期末/升学 │ 评成果 │\r
└──────────┴────────────────────────┴────────────┴──────────────┘\r
```\r
\r
### 4.2 三类测评设计\r
\r
```text\r
■ 诊断性测评\r
· 时机:新单元/新学期开始\r
· 长度:短(15-30 分钟)\r
· 难度:覆盖低-高\r
· 目的:找学员起点\r
\r
■ 形成性测评\r
· 时机:单元中/期中\r
· 长度:中(30-60 分钟)\r
· 难度:覆盖本单元\r
· 目的:调整教学\r
\r
■ 总结性测评\r
· 时机:单元末/期末/升学\r
· 长度:长(60-120 分钟)\r
· 难度:覆盖全部\r
· 目的:评定成果\r
```\r
\r
---\r
\r
## 五、双向细目表\r
\r
### 5.1 双向细目表定义\r
\r
```text\r
横轴:知识点\r
纵轴:认知层级(Bloom 分类)\r
交叉点:题目\r
```\r
\r
### 5.2 认知层级(Bloom)\r
\r
```text\r
┌──────────┬────────────────────────┬──────────────┐\r
│ 层级 │ 描述 │ 题型 │\r
├──────────┼────────────────────────┼──────────────┤\r
│ 记忆 │ 记住事实/概念 │ 选择/填空 │\r
│ 理解 │ 解释/归纳 │ 简答/判断 │\r
│ 应用 │ 用知识解决问题 │ 计算/解答 │\r
│ 分析 │ 拆解/比较 │ 综合/分析 │\r
│ 评价 │ 评判/论证 │ 论述/比较 │\r
│ 创造 │ 综合/创新 │ 探究/开放 │\r
└──────────┴────────────────────────┴──────────────┘\r
```\r
\r
### 5.3 双向细目表样板\r
\r
```text\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
📊 双向细目表 · [测评名] · [日期]\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
│ 记忆 │ 理解 │ 应用 │ 分析 │ 评价 │ 创造\r
───────────┼──────┼──────┼──────┼──────┼──────┼──────\r
知识点 1 │ T1 │ T2 │ T3 │ │ │\r
知识点 2 │ │ T4 │ T5 │ T6 │ │\r
知识点 3 │ T7 │ │ T8 │ T9 │ T10 │\r
知识点 4 │ │ │ T11 │ T12 │ T13 │\r
知识点 5 │ T14 │ │ │ T15 │ │ T16\r
───────────┴──────┴──────┴──────┴──────┴──────┴──────\r
T1-T16 共 16 题\r
分值:记忆 30% / 理解 25% / 应用 25% / 分析 15% / 评价+创造 5%\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
```\r
\r
### 5.4 双向细目表设计原则\r
\r
```text\r
■ 知识点覆盖\r
· 本单元所有重要知识点\r
· 重点知识点题量多\r
· 次要知识点题量少\r
\r
■ 认知层级分布\r
· 记忆 + 理解 ≥ 50%(基础)\r
· 应用 + 分析 ≥ 35%(核心)\r
· 评价 + 创造 ≤ 15%(提升)\r
\r
■ 难度梯度\r
· 基础题 60%\r
· 中等题 30%\r
· 提升题 10%\r
```\r
\r
---\r
\r
## 六、题目选编\r
\r
### 6.1 题目来源\r
\r
```text\r
┌──────────┬────────────────────────┬──────────────┐\r
│ 来源 │ 描述 │ 适用 │\r
├──────────┼────────────────────────┼──────────────┤\r
│ 教材原题 │ 教材课后题 │ 基础训练 │\r
│ 改编题 │ 基于教材/经典题改编 │ 针对本班 │\r
│ 自有题 │ 老师原创 │ 班级特色 │\r
│ CC 协议 │ 公开可引用 │ 拓展 │\r
└──────────┴────────────────────────┴──────────────┘\r
```\r
\r
### 6.2 题目选编原则\r
\r
```text\r
■ 难度梯度合理\r
· 基础→中等→提升\r
· 学员有"上手感"\r
\r
■ 知识点覆盖全\r
· 双向细目表\r
\r
■ 认知层级有梯度\r
· 记忆→理解→应用\r
· 不全是记忆\r
\r
■ 题目情境真实\r
· 学员有代入感\r
\r
■ 避免\r
· 偏题怪题\r
· 套路题(答案唯一性差)\r
· 信息超量\r
```\r
\r
### 6.3 题目版权\r
\r
```text\r
✅ 教材原题:标注来源\r
✅ 改编题:基于教材/经典题改编\r
✅ 自有题:老师原创\r
✅ CC 协议:公开可引用\r
\r
❌ 禁止:未授权复制教辅题库\r
❌ 禁止:未授权转载网络题库\r
```\r
\r
---\r
\r
## 七、难度梯度设计\r
\r
### 7.1 三档难度\r
\r
```text\r
┌──────────┬────────────────────────┬──────────┐\r
│ 难度 │ 描述 │ 占比 │\r
├──────────┼────────────────────────┼──────────┤\r
│ 基础 │ 单一知识点/单一方法 │ 60% │\r
│ 中等 │ 多个知识点/组合方法 │ 30% │\r
│ 提升 │ 综合/创新/开放 │ 10% │\r
└──────────┴────────────────────────┴──────────┘\r
```\r
\r
### 7.2 基础题设计\r
\r
```text\r
■ 特点\r
· 单一知识点\r
· 单一方法\r
· 直接应用\r
\r
■ 学员表现\r
· 90% 学员能做对\r
· 学员有"上手感"\r
· 不丢信心\r
\r
■ 教学意义\r
· 让学员"打底"\r
· 让学员有"成就感"\r
```\r
\r
### 7.3 中等题设计\r
\r
```text\r
■ 特点\r
· 多个知识点\r
· 多种方法\r
· 需要分析\r
\r
■ 学员表现\r
· 50-70% 学员能做对\r
· 学员需要"思考"\r
· 区分学员\r
\r
■ 教学意义\r
· 区分学员\r
· 训练思维\r
```\r
\r
### 7.4 提升题设计\r
\r
```text\r
■ 特点\r
· 综合\r
· 创新\r
· 开放\r
\r
■ 学员表现\r
· 10-30% 学员能做对\r
· 学员需要"深度思考"\r
· 选拔功能\r
\r
■ 教学意义\r
· 选拔功能\r
· 训练高阶思维\r
```\r
\r
### 7.5 难度梯度样板\r
\r
```text\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
📊 难度梯度样板\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
■ 第 1-3 题(基础)\r
· 单一知识点\r
· 单一方法\r
· 90% 学员可做\r
\r
■ 第 4-8 题(中等)\r
· 多个知识点\r
· 多种方法\r
· 50-70% 学员可做\r
\r
■ 第 9-10 题(提升)\r
· 综合/创新\r
· 10-30% 学员可做\r
\r
■ 难度曲线\r
· 简单→中等→提升\r
· 不忽高忽低\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
```\r
\r
---\r
\r
## 八、测评实施\r
\r
### 8.1 测评规则\r
\r
```text\r
■ 限时\r
· 小学:60 分钟\r
· 初中:90-120 分钟\r
· 高中:120-150 分钟\r
\r
■ 规则\r
· 独立完成\r
· 禁止交流\r
· 禁止工具\r
· 监考\r
\r
■ 讲评\r
· 及时(24 小时内)\r
· 重点讲错因\r
· 学员订正\r
```\r
\r
### 8.2 测评讲评\r
\r
```text\r
■ 共性讲评\r
· 班级整体水平\r
· 共性错因\r
· 共性问题\r
\r
■ 个体反馈\r
· 学员个人错因\r
· 改进方向\r
· 学员档案更新\r
\r
■ 错题档案\r
· 错题入库\r
· 后续练习\r
```\r
\r
---\r
\r
## 九、测评结果分析\r
\r
### 9.1 班级报告\r
\r
```text\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
📊 测评分析报告 · [班级] · [测评名]\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
■ 总体\r
· 参与:[N] 人\r
· 平均分:[N]\r
· 中位数:[N]\r
· 标准差:[N]\r
\r
■ 分数段\r
· 90+:[N] 人([N]%)\r
· 80-89:[N] 人([N]%)\r
· 70-79:[N] 人([N]%)\r
· 60-69:[N] 人([N]%)\r
· \x3C60:[N] 人([N]%)\r
\r
■ 知识点热力\r
· 知识点 1:🟢 90%\r
· 知识点 2:🟡 60%\r
· 知识点 3:🔴 30%\r
\r
■ 错因分布\r
· 概念模糊:[N]%\r
· 规则错误:[N]%\r
· 审题错误:[N]%\r
· 策略错误:[N]%\r
· 计算错误:[N]%\r
· 粗心大意:[N]%\r
· 知识漏洞:[N]%\r
\r
■ 教学建议\r
· 重新讲:[X]\r
· 加练习:[X]\r
· 关注:[X 学员]\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
```\r
\r
### 9.2 学员报告\r
\r
```text\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
📊 测评分析报告 · [学员化名] · [测评名]\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
■ 分数\r
· 总分:[N] / [N]\r
· 排名:[N] / [N]\r
\r
■ 知识点表现\r
· 强项:[N]%\r
· 弱项:[N]%\r
\r
■ 错因分析\r
· 主导错因:[X]\r
\r
■ 改进建议\r
· [X]\r
· [X]\r
━━━━━━━━━━━━━━━━━━━━━━━━━━━\r
```\r
\r
---\r
\r
## 十、测评使用\r
\r
### 10.1 三类测评使用\r
\r
```text\r
■ 诊断性测评\r
· 用于"找起点"\r
· 调整后续教学\r
· 不排名\r
\r
■ 形成性测评\r
· 用于"调进度"\r
· 及时干预\r
· 可灵活调整\r
\r
■ 总结性测评\r
· 用于"评成果"\r
· 较正式\r
· 可作为升级依据\r
```\r
\r
### 10.2 测评频率\r
\r
```text\r
· 诊断性:每学期 1-2 次\r
· 形成性:每单元 1 次\r
· 总结性:每学期 2-3 次\r
· 不频繁测评(学员压力)\r
```\r
\r
---\r
\r
## 十一、与上游/下游 SKILL 的协作\r
\r
### 11.1 协作流图\r
\r
```text\r
┌────────────────────────┐\r
│ xiaozhi-teach- │\r
│ student-analyzer │\r
│ (学员水平数据) │\r
└───────────┬────────────┘\r
│\r
↓\r
┌────────────────────────┐\r
│ xiaozhi-teach- │\r
│ math-exam-designer │\r
│ (本 SKILL) │\r
└───────────┬────────────┘\r
│\r
┌─────────────────┼─────────────────┐\r
↓ ↓ ↓\r
exam results math-error-analyzer resource-library\r
(测评结果) (错因分析) (错题入库)\r
```\r
\r
### 11.2 接口\r
\r
```text\r
读:\r
studentAnalyzer.level → 学员水平\r
studentAnalyzer.weaknessRank → 弱项\r
lessonPlan.content → 教学内容\r
\r
写:\r
examDesigner.blueprint → 双向细目表\r
examDesigner.exam → 试卷\r
examDesigner.resultAnalysis → 结果分析\r
→ math-error-analyzer 接收\r
→ resource-library 接收\r
```\r
\r
---\r
\r
## 十二、字段级高敏信息防护\r
\r
```text\r
✅ 测评分析用化名\r
✅ 班级报告用编号\r
❌ 禁止:公开"某学员的分数排名"\r
❌ 禁止:未授权公开测评题\r
✅ 测评结果可入档案(脱敏后)\r
```\r
\r
---\r
\r
## 十三、行为准则\r
\r
| ✅ 应该做 | ❌ 不能做 |\r
|---------|---------|\r
| 测评三类(诊断/形成/总结) | 测评=打分 |\r
| 双向细目表设计 | 凭感觉出题 |\r
| 难度梯度(60/30/10) | 难易不均 |\r
| 题目来源标注 | 复制未授权题 |\r
| 测评结果分析 | 测完就完事 |\r
| 教学干预建议 | 测评=排名 |\r
| 学员化名 | 公开排名 |\r
\r
---\r
\r
## 十四、与其他 SKILL 的协同清单\r
\r
```text\r
数学测评设计\r
\x3C── xiaozhi-teach-student-analyzer(学员水平)\r
\x3C── xiaozhi-teach-lesson-planner(教学内容)\r
──→ xiaozhi-teach-math-error-analyzer(错因分析)\r
──→ xiaozhi-teach-resource-library(错题入库)\r
──→ xiaozhi-teach-lesson-planner(教学干预)\r
──→ 学生端 xiaozhi-math-problem-solving-coach(学员视角)\r
```\r
\r
**禁止行为**:\r
- 禁止 AI 替老师阅卷\r
- 禁止 AI 给学员排名\r
- 禁止 AI 替老师出完整试卷(只提供框架)\r
- 禁止未授权复制题库\r
- 禁止公开学员分数排名\r
\r
---\r
\r
## 十五、参考资源\r
\r
- `references/blueprint-template.md` — 双向细目表模板(知识点 × 能力层级)\r
- `references/exam-design-process.md` — 测评设计 6 步流程\r
- `references/result-analysis-rubric.md` — 结果分析 4 维模板(分数/知识点/错因/学员)\r
\r
---\r
\r
> 🦞 **小龙虾说:**\r
> "测评不是给学员'打标签',\r
> 是给教学'照镜子'。\r
> 镜子里看到的不是'谁好谁差',\r
> 而是'哪里教得好,哪里还需努力'——\r
> 这就是测评设计的真正意义。"\r
- Make sure OpenClaw is installed (local or Docker)
- Run the install command in chat:
/install xiaozhi-teach-math-exam-designer - After installation, invoke the skill by name or use
/xiaozhi-teach-math-exam-designer - Provide required inputs per the skill's parameter spec and get structured output
What is Xiaozhi Teach Math Exam Designer?
帮助数学老师把"出试卷"升级为"系统化测评设计"。 当老师说"这周考什么"、"试卷怎么出"、 "测评怎么设计"、"双向细目表"、 "诊断性测评"、"形成性测评"、"学员测评"时, 必须激活此SKILL。 核心工作流:测评目标(诊断/形成/总结)→ 双向细目表(知识点×认知层级)→ 题目选编(教材原题/改编/自有)... It is an AI Agent Skill for Claude Code / OpenClaw, with 27 downloads so far.
How do I install Xiaozhi Teach Math Exam Designer?
Run "/install xiaozhi-teach-math-exam-designer" in the OpenClaw or Claude Code chat to install it in one step — no extra setup required.
Is Xiaozhi Teach Math Exam Designer free?
Yes, Xiaozhi Teach Math Exam Designer is completely free, licensed under MIT-0. You can download, install and use it at no cost.
Which platforms does Xiaozhi Teach Math Exam Designer support?
Xiaozhi Teach Math Exam Designer is cross-platform and runs anywhere OpenClaw / Claude Code is available (cross-platform).
Who created Xiaozhi Teach Math Exam Designer?
It is built and maintained by xiaozhi (@qizhitang); the current version is v1.0.0.