← 返回 Skills 市场
terrycarter1985

抖音搜索爬虫

作者 terrycarter1985 · GitHub ↗ · v1.0.0 · MIT-0
cross-platform ✓ 安全检测通过
41
总下载
0
收藏
1
当前安装
1
版本数
在 OpenClaw 中安装
/install douyin-search-v2
功能描述
爬取抖音搜索结果和热榜数据,使用 Playwright 自动化浏览器操作。支持自然语言搜索(如"搜索一下海鲜视频")、关键词搜索、获取热榜、提取视频信息等功能。
使用说明 (SKILL.md)

抖音搜索爬虫 Skill

功能概述

使用 Playwright 自动化浏览器操作(移动端模式),爬取抖音搜索结果和热榜数据。

功能特性

  • 🔍 自然语言搜索 - 支持中文自然语言查询,自动提取关键词
  • 🔑 关键词搜索 - 按关键词搜索抖音视频
  • 📊 热榜获取 - 获取抖音热榜数据(公开 API,无需登录)
  • 📝 文案提取 - 提取视频标题、描述、作者等
  • 🎬 互动数据 - 获取播放量、点赞数、评论数等
  • 💾 数据导出 - 支持 JSON / CSV 格式输出

安装依赖

# Python 版本
pip install playwright
playwright install chromium

# Node.js 版本
npm install
npx playwright install chromium

使用方法

自然语言搜索(推荐)

Skill 支持中文自然语言查询,会自动提取关键词:

自然语言输入 提取的关键词
搜索一下海鲜视频 海鲜
帮我找小龙虾相关内容 小龙虾
看看海鲜售卖的视频 海鲜售卖
找一些海鲜做法 海鲜做法

方式一:Python 脚本(推荐)

# 自然语言搜索
python scripts/scraper.py search --keyword "搜索一下海鲜视频" --limit 10

# 关键词搜索
python scripts/scraper.py search --keyword "海鲜" --limit 10

# 获取热榜
python scripts/scraper.py hot --limit 20

# 搜索并保存结果
python scripts/scraper.py search --keyword "海鲜售卖" --limit 20 --output seafood_videos.json

方式二:Node.js 脚本

# 自然语言搜索
node scripts/douyin_scraper.js search "搜索一下海鲜视频" 10

# 关键词搜索
node scripts/douyin_scraper.js search "海鲜" 10

# 获取热榜
node scripts/douyin_scraper.js hot 20

Agent 集成

当用户用自然语言请求搜索时,Agent 应:

  1. 提取关键词 - 从自然语言中提取核心搜索词
  2. 执行搜索 - 调用 python scripts/scraper.py search --keyword "\x3C关键词>" --limit \x3C数量>
  3. 返回结果 - 将搜索结果以简洁格式呈现给用户

示例对话

用户: 搜索一下海鲜视频
Agent: 好的,我来搜索"海鲜"相关的视频...
→ python scripts/scraper.py search --keyword "海鲜" --limit 10
→ [展示结果]

输出数据格式

JSON 格式

[
  {
    "title": "视频标题",
    "description": "视频描述",
    "author": "作者昵称",
    "play_count": 1000000,
    "like_count": 50000,
    "comment_count": 2000,
    "share_count": 1000,
    "url": "https://www.douyin.com/search/海鲜",
    "tags": ["海鲜", "搜索"],
    "publish_time": "2026-06-06"
  }
]

注意事项

⚠️ 重要提示:

  1. 搜索需要 Playwright - 搜索功能使用移动端浏览器渲染,需安装 Playwright 和 Chromium
  2. 验证码 - 抖音可能触发验证码,脚本会自动等待,但频繁请求可能导致封禁
  3. 热榜无需登录 - 热榜 API 是公开的,不需要浏览器
  4. 请求间隔 - 建议在请求之间添加适当延时
  5. 数据用途 - 仅供学习和研究使用

故障排除

问题:浏览器启动失败

playwright install chromium

问题:搜索结果为空

  • 可能遇到验证码,尝试增加 --delay 参数
  • 抖音页面结构可能已更新
  • 检查网络连接

问题:热榜获取失败

  • 检查网络连接
  • API 可能需要更新

技术细节

  • 搜索方式: 使用移动端 User-Agent 访问 douyin.com/search/\x3Ckeyword>,从渲染后的页面提取结果
  • 热榜方式: 直接调用公开 API douyin.com/aweme/v1/web/hot/search/list/
  • 自然语言解析: 使用正则匹配从中文自然语言中提取搜索关键词
安全使用建议
Install only if you are comfortable with browser automation that visits Douyin and may trigger anti-bot checks or platform-rate limits. Use it for explicit Douyin search or hot-list requests, keep limits modest, and avoid logging into personal accounts while running it.
能力评估
Purpose & Capability
The artifacts consistently describe searching Douyin content and hot lists, and the Python/Node scripts only perform Douyin page/API requests plus optional local JSON/CSV output.
Instruction Scope
The skill encourages natural-language activation and automatic command execution for broad Chinese search requests; this is purpose-aligned but users should ensure the request really intends a Douyin scrape.
Install Mechanism
Installation creates a local virtual environment, installs Playwright/Chromium, optionally runs npm install, and includes an optional Docker-based installer; these are disclosed and expected for browser automation.
Credentials
The requested browser automation and network access are proportionate to scraping search results and hot lists, and there is no evidence of local profile, cookie, credential, or broad filesystem access.
Persistence & Privilege
No startup persistence, privilege escalation, background worker, or credential/session reuse was found; local writes are limited to setup artifacts and user-requested result files.
如何使用
  1. 确保已安装 OpenClaw(本地或 Docker 部署)
  2. 在对话框中输入安装命令:/install douyin-search-v2
  3. 安装完成后,直接呼叫该 Skill 的名称或使用 /douyin-search-v2 触发
  4. 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
版本历史
v1.0.0
支持自然语言搜索,修复搜索结果提取,使用移动端模式绕过登录限制
元数据
Slug douyin-search-v2
版本 1.0.0
许可证 MIT-0
累计安装 1
当前安装数 1
历史版本数 1
常见问题

抖音搜索爬虫 是什么?

爬取抖音搜索结果和热榜数据,使用 Playwright 自动化浏览器操作。支持自然语言搜索(如"搜索一下海鲜视频")、关键词搜索、获取热榜、提取视频信息等功能。 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 41 次。

如何安装 抖音搜索爬虫?

在 OpenClaw 或 Claude Code 对话框中运行命令「/install douyin-search-v2」即可一键安装,无需额外配置。

抖音搜索爬虫 是免费的吗?

是的,抖音搜索爬虫 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。

抖音搜索爬虫 支持哪些平台?

抖音搜索爬虫 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。

谁开发了 抖音搜索爬虫?

由 terrycarter1985(@terrycarter1985)开发并维护,当前版本 v1.0.0。

💬 留言讨论