Description

交互式英语水平快速测评工具。大学英语水平（CEFR B1-C1），随机生成题卷（默认20-40题或快速18题，6-8种题型，总分100分），逐题作答，全程静默判分，最后输出得分与弱项分析。支持错题集、错题重测、查看错题讲解。内容覆盖各专业领域。触发词：开始英语测评 / 英语测试 / 测一下英语 / 英语水平测...

README (SKILL.md)

英语测评

Name: English Assessment
Author: z-zihan

交互式英语水平快速测评。支持默认测评、快速测评、错题重测三种模式，全程静默判分，最后输出得分与弱项分析。

核心原则

严格评分：不给同情分，具体扣分标准见「评分规则」
静默判分：每题作答后只出下一题，不反馈对错、不显示得分、不解释知识点
随机题卷：每次测评开始时随机确定题数、题型组合、分值分配，总分固定100分
测评隔离：测评进行中，用户发非测评相关消息时，回复"当前正在英语测评中，如需退出请发送「退出测评」"，不执行其他指令。想执行其他操作必须先退出测评
可退出：用户说"退出测评"/"结束测评"/"不做了"→ 立即按已完成题目生成报告
错题持久化：错题存入本地文件，支持错题重测和查看讲解
成绩归档：每次测评成绩存入本地文件，支持学习进度分析

错题集

存储

文件路径：/tmp/english-assessment-wrong.json
格式：

{
  "records": [
    {
      "id": "uuid",
      "type": "英译中词汇",
      "dimension": "词汇量",
      "question": "implement",
      "user_answer": "重要的",
      "correct_answer": "实施/执行",
      "explanation": "implement 作动词表示「实施、执行」，如 implement a policy（实施政策）",
      "added_at": "2026-05-25T19:00:00+08:00",
      "source": "default"
    }
  ]
}

限制与清理

数量上限：最多保留 200 条错题，超出时按时间淘汰最早的
时间上限：超过 30 天的错题自动清理
每次测评结束时：检查并清理超限数据
去重：同一题目（question 字段相同）不重复添加，只更新最新一次的错误答案和时间

错题重测

用户说"错题重测"时：

读取错题集文件
如果错题数 \x3C 5 → 提示"错题不足5道，暂不支持错题重测，先完成一次测评吧"
如果错题数 ≥ 5 → 从错题集中随机抽取 10 道出题
评分规则同正常测评，满分 100 分（每题 10 分）
答对的题从错题集中移除
答错的题保留在错题集中
如果中途错题集被清空（全部答对），提前结束并提示"恭喜，错题已全部掌握！🎉"，输出测评报告

查看错题

用户说"看错题"时：

读取错题集文件
如果没有错题 → 提示"暂无错题记录"
每次展示最多 10 条，格式：

📝 你的错题（第 1-10 条，共 X 条）

1. 【英译中词汇】implement
   ❌ 你的答案：重要的
   ✅ 正确答案：实施/执行
   💡 implement 作动词表示「实施、执行」，如 implement a policy（实施政策）

2. ...

如果还有更多 → 提示"发送「继续看错题」查看下一页"
发送「继续看错题」→ 展示下 10 条

成绩归档

存储

文件路径：/tmp/english-assessment-history.json
格式：

{
  "records": [
    {
      "date": "2026-05-25T19:00:00+08:00",
      "mode": "default",
      "score": 76,
      "duration_min": 18,
      "weakness": ["词汇量", "语法"],
      "breakdown": {
        "词汇量": {"score": 12, "max": 35, "accuracy": "34%"},
        "语法": {"score": 18, "max": 32, "accuracy": "56%"},
        "翻译能力": {"score": 22, "max": 28, "accuracy": "79%"},
        "商务表达": {"score": 15, "max": 28, "accuracy": "54%"},
        "阅读理解": {"score": 9, "max": 10, "accuracy": "90%"}
      }
    }
  ]
}

规则

只保存：日期、测评模式、得分、时长、弱项维度、各维度得分率
不保存：具体题目、错题内容、改进措施、学习建议、题目数量
无上限：长期保留，用于学习进度分析
每次测评结束后自动追加一条记录

学习进度分析

用户说"学习进度"或"进步曲线"时：

读取成绩归档文件
如果记录 \x3C 2 → 提示"至少完成2次测评才能分析进度"
输出分析报告：

📈 学习进度分析（共 X 次测评）

📊 得分趋势：
| 日期 | 模式 | 得分 | 时长 | 弱项 |
|---|---|---|---|---|
| 5/25 | 默认 | 76 | 18min | 词汇量、语法 |
| 5/28 | 快速 | 82 | 10min | 语法 |
| 6/01 | 默认 | 85 | 15min | 商务表达 |

✅ 进步：得分从 76 → 85（+9），时长从 18min → 15min（-3min）
⚠️ 持续弱项：语法连续3次为弱项，建议重点攻克
🔥 最好维度：阅读理解（稳定90%+）

测评流程

开始阶段

用户说"开始英语测评"时，按以下逻辑判断模式：

读取错题集，统计错题数量
如果错题数 ≥ 20 → 先问用户："你的错题集有 X 道错题，要清理错题集吗？（清理=清空全部 / 保留 / 先做错题重测）"
等用户回复后，再进入模式选择
输出模式选择：

🎯 请选择测评模式：

1️⃣ 默认测评 — 20-40 题，全面评估
2️⃣ 快速测评 — 约 18 题，快速出分

回复 1 或 2 开始

如果错题数 ≥ 5，额外显示：3️⃣ 错题重测 — 10 道错题专项练习
用户选择后开始出题

答题阶段

用户作答 → 静默记录得分 → 直接出下一题：

📝 第 X/X 题 【题型】（X分）

[题目内容]

关键：不作任何反馈，不显示"正确/错误"，不显示累计分数，不解释知识点。

得分记录：每道题作答后，必须立即在后台维护得分记录，记录每题的题型、题目、用户答案、正确答案、得分、归属维度。测评结束时直接汇总，禁止凭记忆估算分数。

非答案回复处理

用户回复内容不是对题目的作答（如闲聊、提问、无关内容）→ 该题记0分，直接出下一题，不作额外提醒。

退出/完成

全部答完 → 输出测评报告 + 更新错题集
中途"退出测评" → 按已完成题目输出报告 + 更新已完成题目的错题集
用户说"跳过" → 该题记0分，出下一题

题卷生成规则

默认测评

题数：20-40题，随机确定
题型：从题型池中随机选6-8种，每种选中的题型至少出1题，句子改错最多出2题，情景对话补全最多出2题
分值分配：
- 主观题（英译中词汇、中译英词汇、中译英翻译、同义词替换、句子改写）：单题5-10分
- 半主观题（语法填空、句子改错、介词搭配）：单题3-5分
- 客观题（选择题、选词填空）：单题2-4分
- 主观题总分占比30%-60%
- 所有题目分值之和 = 100分
分值校验：生成题卷后检查分值总和，如不等于100分，调整最后一题的分值使其凑整

快速测评

题数：约18题，随机确定（16-20题范围）
题型：从题型池中随机选4-6种
分值分配：
- 客观题：单题3-5分
- 半主观题：单题5-7分
- 主观题：单题8-12分
- 所有题目分值之和 = 100分
其余规则同默认测评

通用规则

题目顺序：先易后难，客观题在前，主观题在后
内容范围：
- 约30%专业领域词汇/场景（科技、医学、法律、金融、文学、工程、艺术等，随机混合）
- 约70%通用/学术基础词汇（日常表达、学术写作、基础语法）
- 中译英翻译题中商务场景占比约30%-40%
- 可通过联网搜索获取真实英语题目或专业术语
- 联网搜题失败时：使用 AI 自身知识出题，不依赖外部搜索
难度：CEFR B1-C1，基础题约占30%，中高级题约占70%。词汇和语法考点偏向实际应用和专业场景，少出简单题
不重复：同一测评中不出现重复考点。尽量扩大题库，避免多次测评出现相同题目
情景对话补全：尽量设计成选择题形式（给出4个选项），减少需要用户手动输入长句的情况。基础单词仍需手动输入

题型池（12种）

#	题型	出题格式	评分方式
1	英译中词汇	给英文单词/短语，翻译成中文	主观
2	中译英词汇	给中文，翻译成英文	主观
3	语法填空	含空格的英文句子，填正确形式	半主观
4	选择题	四选一（语法/词汇/表达）	客观
5	中译英翻译	翻译中文为英文（商务场景为主，兼顾其他场景）	主观
6	阅读理解	短文+1-2个问题	客观/主观
7	句子改错	找出并改正语法错误	半主观
8	选词填空	词库+短文空格	客观
9	同义词替换	给词/短语，写近义表达	主观
10	情景对话补全	对话场景，四选一补全回应（优先选择题形式）	客观/主观
11	介词搭配	选择/填写正确介词	客观/半主观
12	句子改写	用指定句型重写句子	主观

评分规则

客观题（选择题、选词填空、情景对话补全选择题）

正确 = 满分，错误 = 0分

半主观题（语法填空、句子改错、介词搭配）

完全正确 = 满分
词根对但形式错（如时态）= 扣1分
找到错误但改错 = 得一半分

主观题（英译中词汇、中译英词汇、中译英翻译、同义词替换、句子改写）

意思完全正确且表达地道 = 满分
意思对但表达不地道 = 扣1-2分
意思接近但不精确 = 扣2-3分
拼写错误但不影响理解 = 每处扣1分
语法错误 = 每处扣1分
遗漏关键信息 = 每处扣2分
意思完全不对 = 0分

注意：翻译题必须意思准确才算对。如 deadline 翻译成"大地"= 0分。

测评报告

全部完成或退出后输出：

## 🏅 XX 分 — [等级]

📊 答题：X/X 题 | ⏱ 测评时长：约XX分钟

---

📈 分项得分：
| 维度 | 得分 | 满分 | 正确率 | 评价 |
|---|---|---|---|---|
| 词汇量 | X | X | X% | 强/中/弱 |
| 语法 | X | X | X% | 强/中/弱 |
| 翻译能力 | X | X | X% | 强/中/弱 |
| 商务表达 | X | X | X% | 强/中/弱 |
| 阅读理解 | X | X | X% | 强/中/弱 |

等级说明：
- 90-100 ⭐ 优秀 — 英语能力扎实，可应对专业场景
- 75-89 ✅ 良好 — 基础扎实，部分领域需加强
- 60-74 ⚠️ 中等 — 有一定基础，需要系统提升
- 40-59 📖 及格 — 基础薄弱，建议从基础学起
- 0-39 💪 需加强 — 建议从零开始系统学习

🔍 弱项分析：
1. [最弱维度]：具体问题 + 改进建议
2. [次弱维度]：具体问题 + 改进建议

💡 学习建议：
- [针对弱项的具体学习方向]
- [推荐资源或方法]

📝 错题详情：
| # | 题型 | 题目 | 你的答案 | 正确答案 | 得分 |
|---|---|---|---|---|---|
| 1 | 英译中词汇 | deadline | 大地 | 截止日期 | 0/3 |
| ... |

（如需查看全部答题记录，请发送「查看全部答题」→ 收到后输出含所有题目的完整答题表格）

约束

测评期间不反馈对错和得分，只出下一题
测评期间不处理其他指令，必须先退出测评再执行其他操作。测评中说"看错题"按非答案回复处理（记0分出下一题），需退出后再查看
非答案回复 → 该题记0分，出下一题
"跳过" → 记0分，出下一题
"退出测评" → 立即按已完成题目生成报告
每道题只等一次回复，不追问
每次测评题目不同，不使用固定题库，尽量扩大题目多样性
测评进行中再次说"开始英语测评" → 提示先退出当前测评
情景对话补全优先用选择题形式，减少长句输入
错题集每道题必须附带简短讲解（explanation 字段）
成绩归档只存得分和弱项，不存具体题目和错题

Usage Guidance

Install only if you are comfortable with assessment answers and performance history being saved in local /tmp files. Avoid entering sensitive personal, school, or work-confidential text as answers, and remove /tmp/english-assessment-wrong.json and /tmp/english-assessment-history.json if you want to clear stored data.

Capability Assessment

✓ Purpose & Capability

The stated purpose, assessment flow, scoring rules, wrong-answer review, and progress tracking fit together and are disclosed in the artifact.

ℹ Instruction Scope

Trigger phrases are broad and the skill tells the agent to defer unrelated requests during a test, but this is tied to test isolation and includes clear exit commands.

✓ Install Mechanism

The package contains a single Markdown SKILL.md file with no executable scripts, dependencies, installer behavior, or static-scan findings; VirusTotal telemetry is clean.

ℹ Credentials

Optional web search for realistic questions or terminology is relevant to the assessment purpose, but the skill does not require a user-facing opt-in before network use.

ℹ Persistence & Privilege

The skill writes wrong answers and score history to explicit /tmp JSON files; wrong-answer records have size and age limits, while score history is long-term and lacks an explicit deletion command.

Version History

v2.1.0

Auto-publish from commit 8fce4a779e53f9ab11500db8bd468ad22a30fa1b

v2.0.1

Auto-publish from commit 5df325e665a58eea76cbb38578213249eb50a451

v2.0.0

Auto-publish from commit bec76b4581af8efd5c98d2c9059ac8e7e7923202

v1.0.0

Auto-publish from commit bb6db47bc2bbdc24d02028c56b9ae33c53a44677

Metadata

Slug english-assessment

Version 2.1.0

License MIT-0

All-time Installs 0

Active Installs 0

Total Versions 4

Frequently Asked Questions

What is English Assessment?

交互式英语水平快速测评工具。大学英语水平（CEFR B1-C1），随机生成题卷（默认20-40题或快速18题，6-8种题型，总分100分），逐题作答，全程静默判分，最后输出得分与弱项分析。支持错题集、错题重测、查看错题讲解。内容覆盖各专业领域。触发词：开始英语测评 / 英语测试 / 测一下英语 / 英语水平测... It is an AI Agent Skill for Claude Code / OpenClaw, with 64 downloads so far.

How do I install English Assessment?

Run "/install english-assessment" in the OpenClaw or Claude Code chat to install it in one step — no extra setup required.

Is English Assessment free?

Yes, English Assessment is completely free, licensed under MIT-0. You can download, install and use it at no cost.

Which platforms does English Assessment support?

English Assessment is cross-platform and runs anywhere OpenClaw / Claude Code is available (cross-platform).

Who created English Assessment?

It is built and maintained by zZihan (@z-zihan); the current version is v2.1.0.

More Skills

English Assessment