/install crawl4ai-skill
Crawl4AI Skill - Web Crawler & Scraper
Web Crawling 网页爬虫 | Web Scraping 网页爬取 | LLM 优化输出
智能网页爬虫和爬取工具,支持搜索、全站爬取、动态页面抓取。Free web crawler and scraper with LLM-optimized Markdown output.
核心功能 | Core Features
- 🔍 Web Search 网页搜索 - DuckDuckGo search, 免 API key
- 🕷️ Web Crawling 网页爬虫 - Site crawler, spider, sitemap 识别
- 📝 Web Scraping 网页抓取 - Smart scraper, data extraction
- 📄 LLM-Optimized Output - Fit Markdown, 省 Token 80%
- ⚡ Dynamic Page Scraping - JavaScript 渲染页面爬取
快速开始 | Quick Start
安装 | Installation
pip install crawl4ai-skill
Web Search | 网页搜索
# Search the web with DuckDuckGo
crawl4ai-skill search "python web scraping"
Web Scraping | 单页爬取
# Scrape a single web page
crawl4ai-skill crawl https://example.com
Web Crawling | 全站爬虫
# Crawl entire website / spider
crawl4ai-skill crawl-site https://docs.python.org --max-pages 50
使用场景 | Use Cases
场景 1:Web Crawler for Documentation | 文档站爬虫
# Crawl documentation site with spider
crawl4ai-skill crawl-site https://docs.fastapi.com --max-pages 100
爬虫效果 | Crawler Output:
- ❌ 移除:导航栏、侧边栏、广告
- ✅ 保留:标题、正文、代码块
- 📊 Token:50,000 → 10,000(-80%)
场景 2:Search + Scrape | 搜索+爬取
# Search and scrape top results
crawl4ai-skill search-and-crawl "Vue 3 best practices" --crawl-top 3
场景 3:Dynamic Page Scraping | 动态页面抓取
JavaScript 渲染的页面爬取(雪球、知乎等):
# Scrape JavaScript-heavy pages
crawl4ai-skill crawl https://xueqiu.com/S/BIDU --wait-until networkidle --delay 2
命令参考 | Commands
| 命令 Command | 说明 Description |
|---|---|
search \x3Cquery> |
Web search 网页搜索 |
crawl \x3Curl> |
Web scraping 单页爬取 |
crawl-site \x3Curl> |
Web crawling 全站爬虫 |
search-and-crawl \x3Cquery> |
Search + scrape 搜索并爬取 |
常用参数 | Common Options
# Web Search 搜索
--num-results 10 # Number of results
# Web Scraping 爬取
--format fit_markdown # Output format
--output result.md # Output file
--wait-until networkidle # Wait strategy for dynamic pages
--delay 2 # Additional wait time (seconds)
--wait-for ".selector" # Wait for specific element
# Web Crawling 爬虫
--max-pages 100 # Max pages to crawl
--max-depth 3 # Max crawl depth
输出格式 | Output Formats
fit_markdown(推荐 Recommended)
智能提取,节省 80% Token。Smart extraction, save 80% tokens.
crawl4ai-skill crawl https://example.com --format fit_markdown
raw_markdown
保留完整结构。Preserve full structure.
crawl4ai-skill crawl https://example.com --format raw_markdown
为什么选择这个爬虫?| Why This Crawler?
✅ 免费爬虫 Free Crawler - 无需 API key,开箱即用
✅ 智能爬取 Smart Scraper - 自动去噪,提取核心内容
✅ 全站爬虫 Site Crawler - 支持 sitemap,递归爬取
✅ 动态爬取 Dynamic Scraping - JavaScript 渲染页面支持
✅ 搜索集成 Search Integration - DuckDuckGo 搜索内置
链接 | Links
- 确保已安装 OpenClaw(本地或 Docker 部署)
- 在对话框中输入安装命令:
/install crawl4ai-skill - 安装完成后,直接呼叫该 Skill 的名称或使用
/crawl4ai-skill触发 - 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
Crawl4ai Skill 是什么?
Web crawling and scraping tool with LLM-optimized output. 网页爬虫爬取工具 | Web crawler, web scraper, spider. DuckDuckGo search, site crawling, dynamic page scrapin... 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 2666 次。
如何安装 Crawl4ai Skill?
在 OpenClaw 或 Claude Code 对话框中运行命令「/install crawl4ai-skill」即可一键安装,无需额外配置。
Crawl4ai Skill 是免费的吗?
是的,Crawl4ai Skill 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。
Crawl4ai Skill 支持哪些平台?
Crawl4ai Skill 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。
谁开发了 Crawl4ai Skill?
由 lance(@lancelin111)开发并维护,当前版本 v1.0.10。