/install english-assessment
英语测评
交互式英语水平快速测评。支持默认测评、快速测评、错题重测三种模式,全程静默判分,最后输出得分与弱项分析。
核心原则
- 严格评分:不给同情分,具体扣分标准见「评分规则」
- 静默判分:每题作答后只出下一题,不反馈对错、不显示得分、不解释知识点
- 随机题卷:每次测评开始时随机确定题数、题型组合、分值分配,总分固定100分
- 测评隔离:测评进行中,用户发非测评相关消息时,回复"当前正在英语测评中,如需退出请发送「退出测评」",不执行其他指令。想执行其他操作必须先退出测评
- 可退出:用户说"退出测评"/"结束测评"/"不做了"→ 立即按已完成题目生成报告
- 错题持久化:错题存入本地文件,支持错题重测和查看讲解
- 成绩归档:每次测评成绩存入本地文件,支持学习进度分析
错题集
存储
- 文件路径:
/tmp/english-assessment-wrong.json - 格式:
{
"records": [
{
"id": "uuid",
"type": "英译中词汇",
"dimension": "词汇量",
"question": "implement",
"user_answer": "重要的",
"correct_answer": "实施/执行",
"explanation": "implement 作动词表示「实施、执行」,如 implement a policy(实施政策)",
"added_at": "2026-05-25T19:00:00+08:00",
"source": "default"
}
]
}
限制与清理
- 数量上限:最多保留 200 条错题,超出时按时间淘汰最早的
- 时间上限:超过 30 天的错题自动清理
- 每次测评结束时:检查并清理超限数据
- 去重:同一题目(question 字段相同)不重复添加,只更新最新一次的错误答案和时间
错题重测
用户说"错题重测"时:
- 读取错题集文件
- 如果错题数 \x3C 5 → 提示"错题不足5道,暂不支持错题重测,先完成一次测评吧"
- 如果错题数 ≥ 5 → 从错题集中随机抽取 10 道出题
- 评分规则同正常测评,满分 100 分(每题 10 分)
- 答对的题从错题集中移除
- 答错的题保留在错题集中
- 如果中途错题集被清空(全部答对),提前结束并提示"恭喜,错题已全部掌握!🎉",输出测评报告
查看错题
用户说"看错题"时:
- 读取错题集文件
- 如果没有错题 → 提示"暂无错题记录"
- 每次展示最多 10 条,格式:
📝 你的错题(第 1-10 条,共 X 条)
1. 【英译中词汇】implement
❌ 你的答案:重要的
✅ 正确答案:实施/执行
💡 implement 作动词表示「实施、执行」,如 implement a policy(实施政策)
2. ...
- 如果还有更多 → 提示"发送「继续看错题」查看下一页"
- 发送「继续看错题」→ 展示下 10 条
成绩归档
存储
- 文件路径:
/tmp/english-assessment-history.json - 格式:
{
"records": [
{
"date": "2026-05-25T19:00:00+08:00",
"mode": "default",
"score": 76,
"duration_min": 18,
"weakness": ["词汇量", "语法"],
"breakdown": {
"词汇量": {"score": 12, "max": 35, "accuracy": "34%"},
"语法": {"score": 18, "max": 32, "accuracy": "56%"},
"翻译能力": {"score": 22, "max": 28, "accuracy": "79%"},
"商务表达": {"score": 15, "max": 28, "accuracy": "54%"},
"阅读理解": {"score": 9, "max": 10, "accuracy": "90%"}
}
}
]
}
规则
- 只保存:日期、测评模式、得分、时长、弱项维度、各维度得分率
- 不保存:具体题目、错题内容、改进措施、学习建议、题目数量
- 无上限:长期保留,用于学习进度分析
- 每次测评结束后自动追加一条记录
学习进度分析
用户说"学习进度"或"进步曲线"时:
- 读取成绩归档文件
- 如果记录 \x3C 2 → 提示"至少完成2次测评才能分析进度"
- 输出分析报告:
📈 学习进度分析(共 X 次测评)
📊 得分趋势:
| 日期 | 模式 | 得分 | 时长 | 弱项 |
|---|---|---|---|---|
| 5/25 | 默认 | 76 | 18min | 词汇量、语法 |
| 5/28 | 快速 | 82 | 10min | 语法 |
| 6/01 | 默认 | 85 | 15min | 商务表达 |
✅ 进步:得分从 76 → 85(+9),时长从 18min → 15min(-3min)
⚠️ 持续弱项:语法连续3次为弱项,建议重点攻克
🔥 最好维度:阅读理解(稳定90%+)
测评流程
开始阶段
用户说"开始英语测评"时,按以下逻辑判断模式:
- 读取错题集,统计错题数量
- 如果错题数 ≥ 20 → 先问用户:"你的错题集有 X 道错题,要清理错题集吗?(清理=清空全部 / 保留 / 先做错题重测)"
- 等用户回复后,再进入模式选择
- 输出模式选择:
🎯 请选择测评模式:
1️⃣ 默认测评 — 20-40 题,全面评估
2️⃣ 快速测评 — 约 18 题,快速出分
回复 1 或 2 开始
- 如果错题数 ≥ 5,额外显示:
3️⃣ 错题重测 — 10 道错题专项练习 - 用户选择后开始出题
答题阶段
用户作答 → 静默记录得分 → 直接出下一题:
📝 第 X/X 题 【题型】(X分)
[题目内容]
关键:不作任何反馈,不显示"正确/错误",不显示累计分数,不解释知识点。
得分记录:每道题作答后,必须立即在后台维护得分记录,记录每题的题型、题目、用户答案、正确答案、得分、归属维度。测评结束时直接汇总,禁止凭记忆估算分数。
非答案回复处理
用户回复内容不是对题目的作答(如闲聊、提问、无关内容)→ 该题记0分,直接出下一题,不作额外提醒。
退出/完成
- 全部答完 → 输出测评报告 + 更新错题集
- 中途"退出测评" → 按已完成题目输出报告 + 更新已完成题目的错题集
- 用户说"跳过" → 该题记0分,出下一题
题卷生成规则
默认测评
- 题数:20-40题,随机确定
- 题型:从题型池中随机选6-8种,每种选中的题型至少出1题,句子改错最多出2题,情景对话补全最多出2题
- 分值分配:
- 主观题(英译中词汇、中译英词汇、中译英翻译、同义词替换、句子改写):单题5-10分
- 半主观题(语法填空、句子改错、介词搭配):单题3-5分
- 客观题(选择题、选词填空):单题2-4分
- 主观题总分占比30%-60%
- 所有题目分值之和 = 100分
- 分值校验:生成题卷后检查分值总和,如不等于100分,调整最后一题的分值使其凑整
快速测评
- 题数:约18题,随机确定(16-20题范围)
- 题型:从题型池中随机选4-6种
- 分值分配:
- 客观题:单题3-5分
- 半主观题:单题5-7分
- 主观题:单题8-12分
- 所有题目分值之和 = 100分
- 其余规则同默认测评
通用规则
- 题目顺序:先易后难,客观题在前,主观题在后
- 内容范围:
- 约30%专业领域词汇/场景(科技、医学、法律、金融、文学、工程、艺术等,随机混合)
- 约70%通用/学术基础词汇(日常表达、学术写作、基础语法)
- 中译英翻译题中商务场景占比约30%-40%
- 可通过联网搜索获取真实英语题目或专业术语
- 联网搜题失败时:使用 AI 自身知识出题,不依赖外部搜索
- 难度:CEFR B1-C1,基础题约占30%,中高级题约占70%。词汇和语法考点偏向实际应用和专业场景,少出简单题
- 不重复:同一测评中不出现重复考点。尽量扩大题库,避免多次测评出现相同题目
- 情景对话补全:尽量设计成选择题形式(给出4个选项),减少需要用户手动输入长句的情况。基础单词仍需手动输入
题型池(12种)
| # | 题型 | 出题格式 | 评分方式 |
|---|---|---|---|
| 1 | 英译中词汇 | 给英文单词/短语,翻译成中文 | 主观 |
| 2 | 中译英词汇 | 给中文,翻译成英文 | 主观 |
| 3 | 语法填空 | 含空格的英文句子,填正确形式 | 半主观 |
| 4 | 选择题 | 四选一(语法/词汇/表达) | 客观 |
| 5 | 中译英翻译 | 翻译中文为英文(商务场景为主,兼顾其他场景) | 主观 |
| 6 | 阅读理解 | 短文+1-2个问题 | 客观/主观 |
| 7 | 句子改错 | 找出并改正语法错误 | 半主观 |
| 8 | 选词填空 | 词库+短文空格 | 客观 |
| 9 | 同义词替换 | 给词/短语,写近义表达 | 主观 |
| 10 | 情景对话补全 | 对话场景,四选一补全回应(优先选择题形式) | 客观/主观 |
| 11 | 介词搭配 | 选择/填写正确介词 | 客观/半主观 |
| 12 | 句子改写 | 用指定句型重写句子 | 主观 |
评分规则
客观题(选择题、选词填空、情景对话补全选择题)
- 正确 = 满分,错误 = 0分
半主观题(语法填空、句子改错、介词搭配)
- 完全正确 = 满分
- 词根对但形式错(如时态)= 扣1分
- 找到错误但改错 = 得一半分
主观题(英译中词汇、中译英词汇、中译英翻译、同义词替换、句子改写)
- 意思完全正确且表达地道 = 满分
- 意思对但表达不地道 = 扣1-2分
- 意思接近但不精确 = 扣2-3分
- 拼写错误但不影响理解 = 每处扣1分
- 语法错误 = 每处扣1分
- 遗漏关键信息 = 每处扣2分
- 意思完全不对 = 0分
注意:翻译题必须意思准确才算对。如 deadline 翻译成"大地"= 0分。
测评报告
全部完成或退出后输出:
## 🏅 XX 分 — [等级]
📊 答题:X/X 题 | ⏱ 测评时长:约XX分钟
---
📈 分项得分:
| 维度 | 得分 | 满分 | 正确率 | 评价 |
|---|---|---|---|---|
| 词汇量 | X | X | X% | 强/中/弱 |
| 语法 | X | X | X% | 强/中/弱 |
| 翻译能力 | X | X | X% | 强/中/弱 |
| 商务表达 | X | X | X% | 强/中/弱 |
| 阅读理解 | X | X | X% | 强/中/弱 |
等级说明:
- 90-100 ⭐ 优秀 — 英语能力扎实,可应对专业场景
- 75-89 ✅ 良好 — 基础扎实,部分领域需加强
- 60-74 ⚠️ 中等 — 有一定基础,需要系统提升
- 40-59 📖 及格 — 基础薄弱,建议从基础学起
- 0-39 💪 需加强 — 建议从零开始系统学习
🔍 弱项分析:
1. [最弱维度]:具体问题 + 改进建议
2. [次弱维度]:具体问题 + 改进建议
💡 学习建议:
- [针对弱项的具体学习方向]
- [推荐资源或方法]
📝 错题详情:
| # | 题型 | 题目 | 你的答案 | 正确答案 | 得分 |
|---|---|---|---|---|---|
| 1 | 英译中词汇 | deadline | 大地 | 截止日期 | 0/3 |
| ... |
(如需查看全部答题记录,请发送「查看全部答题」→ 收到后输出含所有题目的完整答题表格)
约束
- 测评期间不反馈对错和得分,只出下一题
- 测评期间不处理其他指令,必须先退出测评再执行其他操作。测评中说"看错题"按非答案回复处理(记0分出下一题),需退出后再查看
- 非答案回复 → 该题记0分,出下一题
- "跳过" → 记0分,出下一题
- "退出测评" → 立即按已完成题目生成报告
- 每道题只等一次回复,不追问
- 每次测评题目不同,不使用固定题库,尽量扩大题目多样性
- 测评进行中再次说"开始英语测评" → 提示先退出当前测评
- 情景对话补全优先用选择题形式,减少长句输入
- 错题集每道题必须附带简短讲解(explanation 字段)
- 成绩归档只存得分和弱项,不存具体题目和错题
- Make sure OpenClaw is installed (local or Docker)
- Run the install command in chat:
/install english-assessment - After installation, invoke the skill by name or use
/english-assessment - Provide required inputs per the skill's parameter spec and get structured output
What is English Assessment?
交互式英语水平快速测评工具。大学英语水平(CEFR B1-C1),随机生成题卷(默认20-40题或快速18题,6-8种题型,总分100分), 逐题作答,全程静默判分,最后输出得分与弱项分析。支持错题集、错题重测、查看错题讲解。内容覆盖各专业领域。 触发词:开始英语测评 / 英语测试 / 测一下英语 / 英语水平测... It is an AI Agent Skill for Claude Code / OpenClaw, with 64 downloads so far.
How do I install English Assessment?
Run "/install english-assessment" in the OpenClaw or Claude Code chat to install it in one step — no extra setup required.
Is English Assessment free?
Yes, English Assessment is completely free, licensed under MIT-0. You can download, install and use it at no cost.
Which platforms does English Assessment support?
English Assessment is cross-platform and runs anywhere OpenClaw / Claude Code is available (cross-platform).
Who created English Assessment?
It is built and maintained by zZihan (@z-zihan); the current version is v2.1.0.