← Back to Skills Marketplace
知识获取
by
yz6214589-hash
· GitHub ↗
· v2.0.1
· MIT-0
131
Downloads
1
Stars
0
Active Installs
2
Versions
Install in OpenClaw
/install knowledge-acquisition
Description
知识获取:多平台内容解析(小红书/微信/网站等)、8类分类、Markdown 笔记生成、可选飞书云盘归档
README (SKILL.md)
核心能力
- 解析小红书、微信、抖音、普通网站链接,抽取文字/图片/视频
- 视频场景自动执行音频抽取与字幕输出(含时间戳)
- 6大分类:AI、产品经理、经济(投资/股票/保险/加密货币)、心理学、商业机会、灵感
- 分类置信度阈值 90%,低于阈值自动发起人工确认
- 生成标准 Markdown 笔记并输出分类依据日志
- 飞书归档路径:快乐小狗空间/分类/标题+日期,并返回文档 URL 与 token
- 外链安全扫描、24 小时缓存清理、关键步骤 3 次重试
使用方式
直接发送链接/文本即可,支持批量换行发送和混合输入
Usage Guidance
要点与建议:
- 必读:该仓库需要(可选/常用)飞书凭据来启用云盘归档(FEISHU_APP_ID / FEISHU_APP_SECRET / FEISHU_BASE_FOLDER_TOKEN)。尽管技能元数据未声明这些必需项,代码会在运行时读取并在未设置时打印警告。只有在你信任作者并愿意把凭据交给该代码时才提供。
- 如果你只是想试用“提取/分类/生成 Markdown”功能,可先设置 FEISHU_DISABLED=true(README/代码提到)以避免提供飞书凭据。
- 安装/运行注意:该项目使用 Puppeteer(会使用 Chromium)和 ffmpeg;这会拉取较大二进制并需要系统安装 ffmpeg。准备好磁盘与网络并在隔离环境(容器或测试机)中先行测试。
- 凭据放置风险:README 建议把凭据写入 LaunchAgent 环境或使用 launchctl;这些操作会把敏感凭据放入用户会话/系统配置中。除非你了解这对你的系统安全意味着什么,否则优先使用临时环境变量或受控的密钥管理系统。不要在不受信任的环境或共享机器上明文保存凭据。
- 审计建议:如果你关心数据泄露或权限滥用,先在受控环境运行并审查代码路径:确认上传到飞书的内容、权限设置(config/feishu-config.js 中的 defaultFilePermission 与 externalAccess)是否符合你的安全策略;检查是否有任何向未说明第三方发送数据的代码(本仓库看起来只与飞书及目标站点通信)。
- 最佳实践:在启用飞书归档前,先在本地/容器中运行 npm test 与集成测试,使用 FEISHU_DISABLED=true 验证提取与生成功能,然后在最小权限的飞书应用/空间中测试归档功能。
Capability Analysis
Type: OpenClaw Skill
Name: knowledge-acquisition
Version: 2.0.1
The skill bundle is a comprehensive knowledge management tool designed to parse content from platforms like WeChat, Xiaohongshu, Bilibili, and GitHub, and archive it to Feishu (Lark). The code uses standard libraries (Puppeteer, Axios, Cheerio) for scraping and the official Lark SDK for cloud storage integration. While the system defaults to broad file permissions ('anyone_can_view') on Feishu, this behavior is documented and consistent with the stated purpose of the 'Happy Dog' sharing workflow. No evidence of data exfiltration, malicious prompt injection, or unauthorized execution was found across the files (index.js, feishu-config.js, and various plugins).
Capability Tags
Capability Assessment
Purpose & Capability
技能名称/描述与代码实现大体一致(多平台抓取、分类、Markdown 生成、可选飞书归档)。但飞书归档在项目中是核心/常用功能(config/feishu-config.js 会在启动时校验凭据并且 README 把 FEISHU_* 列为“必需”),却在注册元数据与技能要求里没有声明任何必需环境变量或主要凭据(primary credential = none)。这会误导用户关于需要提供哪些敏感凭据。
Instruction Scope
SKILL.md/README 指示直接传链接或文本并导出结果,接口签名 main(input, context) 与代码相符. 但运行时代码读取大量环境变量(FEISHU_APP_ID/FEISHU_APP_SECRET/FEISHU_BASE_FOLDER_TOKEN、GITHUB_TOKEN、ENABLE_* 标志、WEBHOOK_URL 等),并会调用 Puppeteer(启动 Chromium)、ffmpeg(通过 fluent-ffmpeg)以及对外 API(飞书/可能的第三方 API)。这些运行时行为并未在技能元数据中明确列出(尤其是敏感凭据与系统依赖),对非专业用户造成范围不透明。
Install Mechanism
技能没有安装说明写入注册安装块(instruction-only 风格),但仓内包含完整 Node.js 项目(package.json、index.js 等)与大批依赖(puppeteer、fluent-ffmpeg、@larksuiteoapi/node-sdk 等)。README 提供 npm install 与系统级 ffmpeg/Chromium 安装步骤;没有任何远程可疑二进制或不明 URL 下载,代码使用公开 npm 包和常见库。风险主要是:a) Puppeteer 会下载/使用 Chromium(较大);b) 需要手动安装 ffmpeg;c) 未在元数据中暴露这些预期依赖。
Credentials
代码/README/配置文件明确期望敏感环境变量(FEISHU_APP_ID、FEISHU_APP_SECRET、FEISHU_BASE_FOLDER_TOKEN)以及若干可选令牌(GITHUB_TOKEN、WEBHOOK_URL、多项 ENABLE_* 标志),但技能注册信息列出的“Required env vars: none”和“Primary credential: none”与实际需求不符。若用户 enables 飞书同步,他们必须提供凭据;这些凭据有权限在飞书云盘中创建/上传文件并设置权限,因此要求与用途相符,但应在元数据中声明以便用户知情。
Persistence & Privilege
技能没有设置 always: true、也没有请求修改其他技能或系统级配置。运行时会在本地创建缓存目录(./cache/feishu)并在内存中缓存结果,但无持久化到系统范围外的自动常驻权限。
How to Use
- Make sure OpenClaw is installed (local or Docker)
- Run the install command in chat:
/install knowledge-acquisition - After installation, invoke the skill by name or use
/knowledge-acquisition - Provide required inputs per the skill's parameter spec and get structured output
Version History
v2.0.1
No changes were detected in this version; functionality remains the same.
v2.0.0
Version 2.0.0 highlights major upgrades for multi-platform knowledge extraction and note generation:
- Parses content from Xiaohongshu, WeChat, Douyin, and general websites (text, image, video).
- Automatically extracts audio/subtitles (with timestamps) from videos.
- Supports 6 categories: AI, Product Management, Economics, Psychology, Business Opportunities, Inspiration.
- Confidence threshold (90%) for classification—triggers manual check if lower.
- Generates standardized Markdown notes and logs classification rationale.
- Optional Feishu (Lark) cloud archive with URL/token return, organized by category and date.
- Adds link safety scan, 24-hour cache cleanup, and 3-step retry for critical actions.
- Allows users to send links/text directly, with batch and mixed input supported.
Metadata
Frequently Asked Questions
What is 知识获取?
知识获取:多平台内容解析(小红书/微信/网站等)、8类分类、Markdown 笔记生成、可选飞书云盘归档. It is an AI Agent Skill for Claude Code / OpenClaw, with 131 downloads so far.
How do I install 知识获取?
Run "/install knowledge-acquisition" in the OpenClaw or Claude Code chat to install it in one step — no extra setup required.
Is 知识获取 free?
Yes, 知识获取 is completely free, licensed under MIT-0. You can download, install and use it at no cost.
Which platforms does 知识获取 support?
知识获取 is cross-platform and runs anywhere OpenClaw / Claude Code is available (cross-platform).
Who created 知识获取?
It is built and maintained by yz6214589-hash (@yz6214589-hash); the current version is v2.0.1.
More Skills