进击的知识库
/install knowledge-base
\r \r
🚀 进击的知识库\r
\r
微信好用知识库,打通 Agent,多平台视频链接一键下载归档。\r \r
⚠️ 安装前必读\r
\r
此 Skill 需要以下前置条件,缺一不可:\r \r | # | 前置条件 | 说明 |\r |---|---------|------|\r | 1 | 腾讯文档 Skill 授权 | 在 WorkBuddy Skill 市场安装「腾讯文档」Skill,完成 TOKEN 授权 |\r | 2 | Python 3.8+ | 系统需安装 Python 3.8 或以上版本 |\r | 3 | yt-dlp |
pip install yt-dlp(抖音/小红书下载依赖) |\r \r 未完成以上三项,Skill 无法正常工作。详见下方「首次安装配置」。\r \r
核心能力\r
\r
接收链接 → 自动识别来源 → 下载/解析 → 提取视频描述 → 上传腾讯文档 → 写 0 号索引。\r
\r
下载方案:视频号用 sph-download(自研解析方案),抖音/小红书用 yt-dlp(含视频描述提取),公众号用 web_fetch。\r
\r
| 来源 | 下载方式 | 文案提取 | 是否上传 |\r
|------|----------|---------|----------|\r
| 视频号 | parsers/sph.py(自研 sph-download 方案) | — | ✅ 上传腾讯文档 |\r
| 抖音 | yt-dlp(parsers/douyin.py) | ✅ 提取视频描述 | ✅ 上传腾讯文档 |\r
| 小红书 | yt-dlp(parsers/xiaohongshu.py) | — | ✅ 上传腾讯文档 |\r
| 公众号 | web_fetch 抓取 → markdown | ✅ 文章正文 | ✅ 上传腾讯文档 |\r
\r
⚙️ 首次安装配置\r
\r
此 Skill 面向新用户发布,每个用户需要自己完成以下配置。\r \r
前置依赖\r
\r
| 依赖 | 安装方式 |\r
|------|---------|\r
| 腾讯文档 Skill | WorkBuddy Skill 市场安装 → 完成 TOKEN 授权 |\r
| Python 3.8+ | 系统自带或 python.org 下载 |\r
| yt-dlp | pip install yt-dlp 或 winget install yt-dlp.yt-dlp |\r
\r
1. 创建你的知识库空间\r
\r
打开 docs.qq.com,新建一个知识库空间,从 URL 中获取 space_id:\r
\r
https://docs.qq.com/space/DS2RjWGhWZ1VyaWt\r
└────── space_id ──────┘\r
```\r
\r
### 2. 创建 0 号索引智能表格\r
\r
在空间中新建智能表格,命名为「0号索引」,按以下字段建表:\r
\r
| 列名 | 类型 |\r
|------|------|\r
| 文件名字 | 文本 |\r
| 文档大小(KB) | 数字 |\r
| 入库时间 | 日期时间 |\r
| 格式 | 单选 |\r
| 来源类型 | 单选 |\r
| 来源 | 文本 |\r
| 是否外链 | 复选 |\r
| 腾讯文档链接 | URL |\r
| 等级 | 单选 |\r
\r
### 3. 配置环境变量\r
\r
从表格 URL 中获取 `file_id` 和 `sheet_id`,设置环境变量:\r
\r
**Windows:**\r
```cmd\r
setx KB_INDEX_FILE_ID "你的file_id"\r
setx KB_INDEX_SHEET_ID "你的sheet_id"\r
setx KB_TENCENT_SPACE_ID "你的space_id"\r
```\r
\r
**macOS / Linux:**\r
```bash\r
export KB_INDEX_FILE_ID="你的file_id"\r
export KB_INDEX_SHEET_ID="你的sheet_id"\r
export KB_TENCENT_SPACE_ID="你的space_id"\r
```\r
\r
> 也可以直接编辑 `agent.py` 和 `add_to_sheet.py` 中的配置区域,修改等号右边的默认值。\r
\r
### 4. 验证\r
\r
```bash\r
python agent.py identify "https://mp.weixin.qq.com/s/test"\r
# 应输出: {"url": "...", "source_type": "微信公众号"}\r
```\r
\r
⚠️ **如果未配置环境变量**,脚本会打印警告但不会报错——索引写入功能会跳过。上传到腾讯文档的功能依赖腾讯文档 Skill 的 TOKEN 授权。\r
\r
## 0 号索引字段\r
\r
| 列名 | 类型 | 字段 ID(固定) |\r
|------|------|----------------|\r
| 文件名字 | 文本 | fkfKit |\r
| 文档大小 | 数字(KB) | f2cnP7 |\r
| 入库时间 | 日期时间 | fHSMJO |\r
| 格式 | 单选 | fOVcRT |\r
| 来源类型 | 单选 | fPoljj |\r
| 来源 | 文本 | f6drfQ |\r
| 是否外链 | 复选 | fcP5do |\r
| 腾讯文档链接 | URL | fBW04a |\r
| 等级 | 单选 | fWqSI6 |\r
\r
## 工作流程\r
\r
### 步骤总览\r
\r
```\r
链接/文件 → 识别来源 → 下载到本地 → upload_to_docs.py → 腾讯文档 + 0号索引\r
```\r
\r
### 各来源处理\r
\r
#### 视频号\r
\r
```\r
1. 下载(自研 sph-download 方案,无需 yt-dlp):\r
python parsers/sph.py \x3C视频号链接> --output-dir \x3C临时目录>\r
→ 返回 JSON {title, author, video, size_bytes}\r
\r
2. 上传+索引:\r
python upload_to_docs.py \x3Cvideo_path> \\r
--name "\x3Ctitle>" --format mp4 --source-type 视频号 \\r
--source-url "\x3C原始链接>" --author "\x3C作者>" --level 一般\r
```\r
\r
#### 抖音\r
\r
```\r
1. 下载 + 视频描述提取:\r
python parsers/douyin.py \x3C链接> --output-dir \x3C临时目录>\r
→ 返回 JSON {title, author, video, size_bytes, description}\r
→ 同时保存 \x3Cvideo>.caption.txt(视频描述文案文件)\r
\r
2. 上传+索引:\r
python upload_to_docs.py \x3Cvideo_path> \\r
--name "\x3Ctitle>" --format mp4 --source-type 抖音 \\r
--source-url "\x3C原始链接>" --author "\x3Cauthor>" --level 一般\r
```\r
\r
#### 小红书\r
\r
```\r
1. 下载(yt-dlp 方案,与抖音完全一致):\r
python parsers/xiaohongshu.py \x3C链接> --output-dir \x3C临时目录>\r
→ 返回 JSON {title, author, file, size_bytes, type}\r
\r
2. 上传+索引:\r
python upload_to_docs.py \x3Cfile_path> \\r
--name "\x3Ctitle>" --format \x3Ctype> --source-type 小红书 \\r
--source-url "\x3C原始链接>" --author "\x3Cauthor>" --level 一般\r
```\r
\r
#### 微信公众号\r
\r
```\r
1. web_fetch 抓取文章内容,转 markdown\r
2. 创建腾讯文档(smartcanvas 或 markdown)\r
3. 上传+索引:\r
python upload_to_docs.py \x3Cmarkdown_file> \\r
--name "\x3C标题>" --format 文章 --source-type 微信公众号 \\r
--source-url "\x3C原始链接>" --author "\x3C公众号名>" --level 一般\r
```\r
\r
#### 本地文件(pdf/pptx/docx/jpg/png)\r
\r
```\r
python upload_to_docs.py \x3C文件路径> \\r
--name "\x3C文件名>" --format \x3C格式> --source-type 本地上传 \\r
--level 一般\r
```\r
\r
### upload_to_docs.py 自动完成\r
\r
该脚本自动执行:\r
1. `manage.pre_import` — 获取 COS 上传凭证\r
2. `curl PUT` — 上传到 COS\r
3. `manage.async_import` — 触发导入\r
4. `manage.import_progress` — 轮询直到完成\r
5. `add_to_sheet.py` — 写入 0 号索引\r
\r
```bash\r
python upload_to_docs.py \x3C文件路径> \\r
--name "标题" \\r
--format "mp4|pdf|pptx|docx|jpg|png|文章" \\r
--source-type "视频号|抖音|小红书|微信公众号|本地上传" \\r
--source-url "原始链接" \\r
--author "作者名" \\r
--level "机密|高|一般|普通"\r
```\r
\r
`--level` 不传默认为 `一般`,`--is-external` 不传默认为 `False`。\r
\r
## 文件结构\r
\r
```\r
knowledge-base/\r
├── SKILL.md # 本文件\r
├── agent.py # CLI 辅助\r
├── add_to_sheet.py # 智能表格记录添加\r
├── upload_to_docs.py # 一键上传(pre_import→COS→import→索引)\r
├── README.md # 使用说明\r
└── parsers/\r
├── sph.py # 视频号下载(自研 sph-download 方案)\r
├── douyin.py # 抖音下载(yt-dlp)\r
├── xiaohongshu.py # 小红书下载(yt-dlp)\r
└── wechat_article.py # 公众号文章解析\r
```\r
\r
## 注意事项\r
\r
- 视频文件大小限制:腾讯文档单文件 \x3C 100MB\r
- 小红书 yt-dlp 依赖:需要 yt-dlp + cookies(如需要登录态)\r
- 公众号文章过长时可能触发 CreateProcess 命令行限制,使用 `upload_to_docs.py` 可绕过\r
- 索引记录的"入库时间"字段暂不支持 API 设置,需在腾讯文档 UI 上配置自动填入\r
\r
## 常见问题\r
\r
**Q:视频上传腾讯文档后能播放吗?**\r
A:能。腾讯文档支持 mp4 在线播放。\r
\r
**Q:小红书下载失败?**\r
A:确认 yt-dlp 已更新到最新版:`yt-dlp -U`。个别小红书链接可能需要浏览器 cookies。\r
\r
**Q:怎么确认上传成功了?**\r
A:查看 0 号索引智能表格,新记录出现即表示成功。也可以直接打开腾讯文档链接确认。\r
- Make sure OpenClaw is installed (local or Docker)
- Run the install command in chat:
/install knowledge-base - After installation, invoke the skill by name or use
/knowledge-base - Provide required inputs per the skill's parameter spec and get structured output
What is 进击的知识库?
微信好用知识库,打通 Agent,多平台视频链接一键下载归档。 微信/视频号/抖音/小红书/公众号的内容,丢过来自动识别、下载、上传腾讯文档,智能表格一键归档。 抖音下载同步提取视频描述(创作者文案/#标签),保存为 .caption.txt。 视频直传在线播放,文章自动转存。视频号用自研 sph-downloa... It is an AI Agent Skill for Claude Code / OpenClaw, with 23 downloads so far.
How do I install 进击的知识库?
Run "/install knowledge-base" in the OpenClaw or Claude Code chat to install it in one step — no extra setup required.
Is 进击的知识库 free?
Yes, 进击的知识库 is completely free, licensed under MIT-0. You can download, install and use it at no cost.
Which platforms does 进击的知识库 support?
进击的知识库 is cross-platform and runs anywhere OpenClaw / Claude Code is available (cross-platform).
Who created 进击的知识库?
It is built and maintained by 寒武纪智能Cambrian Intelligence (@hitjcl); the current version is v2.4.1.