DocHub
/install dochub
dochub / 文档工作台\r
\r
技能简介\r
\r dochub 是一个专业的文档知识库管理技能,负责将原始文档初始化为标准 Markdown 格式,提供专业的知识库文档概要与索引,并能根据检索内容分析、汇总并回复用户问题。\r \r
支持的文档格式\r
\r | 格式 | 状态 | 说明 |\r |------|------|------|\r | .docx | ✅ 支持 | Word 现代格式 |\r | .xlsx | ✅ 支持 | Excel 现代格式 |\r | .doc / .xls / .pdf / .pptx / 其他 | ❌ 不支持 | 请先转换为 .docx 或 .xlsx |\r \r
注意:dochub 仅支持处理 .docx 和 .xlsx 两种格式,其他格式文档将被跳过并提示用户。\r \r
核心功能\r
\r
1. 初始化(init)\r
\r 将工作区原始文档转换为标准知识库格式:\r \r
原始文档 → raw/ → 安全确认 → 检测不支持的格式 → MD转换(.docx/.xlsx) → 生成知识库概要与索引\r
```\r
\r
**步骤说明:**\r
1. **安全确认**:询问用户文档是否已脱敏(不含敏感个人信息、机密数据等),必须确认后才继续\r
2. **移动原始文档**:将所有原始文档统一移动到工作区根目录 `raw/` 文件夹\r
3. **文件名规范化**:只保留中文、英文、数字及中横线 `-`,其余字符统一替换为 `-`\r
4. **检测不支持的格式**:扫描非 .docx/.xlsx 文件,如发现则列出并提示用户这些文件将被跳过\r
5. **MD 文档转换**:使用 `markitdown` 按原目录结构转换为 MD 文档\r
- 仅支持格式:.docx, .xlsx\r
- 转换前检查目标文件是否存在\r
- 首次存在时询问用户选择「跳过」或「覆盖」,后续自动应用该选择\r
6. **生成知识库概要与索引**:生成 `_docs_knowledge_base.md`,包含:\r
- 文档统计概览(总数、大小、分类数)\r
- 分类目录树(可视化结构)\r
- 高频关键词标签云\r
- 文档详细索引(按分类组织的文件清单)\r
\r
### 2. 增量更新\r
\r
将新文档放入 `update/` 目录后,运行增量更新:\r
\r
- **安全确认**:同样需要先确认文档已脱敏\r
- **检测新增/变更文档**\r
- **检测不支持的格式**:列出非 .docx/.xlsx 文件并提示跳过\r
- **仅转换未转换或已修改的文件**\r
- **更新知识库概要与索引**\r
\r
### 3. 检索与问答\r
\r
支持以下检索方式:\r
\r
- **全文检索**:在 MD 文档中搜索关键词\r
- **分类检索**:按文档分类查找\r
- **语义问答**:基于文档内容回答用户问题\r
\r
## 使用方式\r
\r
### 初始化知识库\r
\r
```\r
使用 dochub 技能,初始化文档知识库\r
```\r
\r
或指定工作区:\r
\r
```\r
使用 dochub 技能,初始化 [指定路径] 的文档知识库\r
```\r
\r
### 增量更新\r
\r
```\r
使用 dochub 技能,增量更新文档\r
```\r
\r
### 检索文档\r
\r
```\r
使用 dochub 技能,检索 [关键词]\r
```\r
\r
### 问答\r
\r
```\r
使用 dochub 技能,回答:[问题]\r
```\r
\r
## 目录结构\r
\r
```\r
workspace/\r
├── raw/ # 原始文档存放目录\r
├── _docs_md/ # MD 文档输出目录\r
├── _docs_knowledge_base.md # 知识库概要与索引(合并文档)\r
└── update/ # 增量更新目录\r
```\r
\r
## 依赖工具\r
\r
- **markitdown** 0.1.5+:MD 转换核心工具\r
- **python-docx**:Word 文档处理\r
- **openpyxl**:Excel 文档处理\r
\r
## 注意事项\r
\r
1. **格式限制**:dochub 仅支持 .docx 和 .xlsx 格式,其他格式(.doc/.xls/.pdf/.pptx 等)将被跳过并提示用户\r
2. **安全确认**:每次初始化或增量更新前,必须确认文档已脱敏\r
3. **备份原始文档**:初始化会修改文件名和目录结构,建议提前备份\r
4. **跳过/覆盖选择**:首次遇到重复文件时会询问,后续自动应用该选择\r
5. **原始文档保留**:转换后保留原始文档作为备份\r
- 确保已安装 OpenClaw(本地或 Docker 部署)
- 在对话框中输入安装命令:
/install dochub - 安装完成后,直接呼叫该 Skill 的名称或使用
/dochub触发 - 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
DocHub 是什么?
All-in-one document management: batch convert to Markdown, auto-categorize, full-text search, and intelligent output. 全能文档管理技能,整合文档生命周期管理与智能检索。 Trigger: init... 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 163 次。
如何安装 DocHub?
在 OpenClaw 或 Claude Code 对话框中运行命令「/install dochub」即可一键安装,无需额外配置。
DocHub 是免费的吗?
是的,DocHub 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。
DocHub 支持哪些平台?
DocHub 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。
谁开发了 DocHub?
由 juanfenglong(@longjf25)开发并维护,当前版本 v1.4.0。