/install yandex-archive-scraper
\r \r
yandex-archive-scraper\r
\r
A powerful skill for searching and extracting data from Yandex.Archive (Яндекс.Архив) using Scrapling to bypass bot protection and Cloudflare Turnstile.\r
\r
Features\r
- Converts natural language queries into optimized Yandex.Archive search URLs.\r
- Uses
Scrapling(StealthyFetcher) to bypass Yandex bot protection.\r - Extracts search results (document titles, text snippets, and direct links).\r
- Supports pagination to collect multiple pages of results.\r
- Can search across all three Yandex.Archive indexes:\r
archive(Архивы) — Metric books, revision tales, confessional statements.\rmass_media(Периодика) — Old newspapers (e.g., "Senate Gazette", "Provincial Gazette").\rdirectories(Справочники) — Address calendars, lists of residents, memorable books.\r \r
Tools\r
\r
yandex_archive_search\r
Search Yandex.Archive based on a natural language query.\r Parameters:\r
query(string): The search query (e.g., "Александр Пушкин Москва").\rindex(string, optional): The index to search in. Options:archive(default),mass_media,directories.\rmax_pages(integer, optional): Maximum number of pages to scrape (default 1).\r \r
Requirements\r
scrapling\rplaywright\rcurl_cffi\rpatchright\rmsgspec\rbrowserforge\r \r ---\r \r
yandex-archive-scraper (Русский)\r
\r
Мощный скилл для поиска и извлечения данных из Яндекс.Архива с использованием фреймворка Scrapling для обхода защиты от ботов и Cloudflare Turnstile.\r
\r
Возможности\r
- Преобразует запросы на естественном языке в оптимизированные URL для поиска по Яндекс.Архиву.\r
- Использует
Scrapling(StealthyFetcher) для обхода защиты Яндекса.\r - Извлекает результаты поиска (названия документов, текстовые фрагменты/сниппеты и прямые ссылки).\r
- Поддерживает пагинацию для сбора нескольких страниц результатов.\r
- Умеет искать по всем трем базам Яндекс.Архива:\r
archive(Архивы) — Метрические книги, ревизские сказки, исповедные ведомости.\rmass_media(Периодика) — Старые газеты (например, "Сенатские ведомости", "Губернские ведомости").\rdirectories(Справочники) — Адрес-календари, списки жителей, памятные книжки.\r \r
Инструменты (Tools)\r
\r
yandex_archive_search\r
Поиск по Яндекс.Архиву на основе текстового запроса.\r Параметры:\r
query(string): Поисковый запрос (например, "Александр Пушкин Москва").\rindex(string, optional): Раздел для поиска. Варианты:archive(по умолчанию),mass_media,directories.\rmax_pages(integer, optional): Максимальное количество страниц для парсинга (по умолчанию 1).\r \r
Зависимости\r
scrapling\rplaywright\rcurl_cffi\rpatchright\rmsgspec\rbrowserforge
- 确保已安装 OpenClaw(本地或 Docker 部署)
- 在对话框中输入安装命令:
/install yandex-archive-scraper - 安装完成后,直接呼叫该 Skill 的名称或使用
/yandex-archive-scraper触发 - 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
Yandex Archive Scraper 是什么?
Search and extract data from Yandex.Archive (Яндекс.Архив) — metric books, newspapers, directories. Bypasses bot protection via Scrapling. 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 108 次。
如何安装 Yandex Archive Scraper?
在 OpenClaw 或 Claude Code 对话框中运行命令「/install yandex-archive-scraper」即可一键安装,无需额外配置。
Yandex Archive Scraper 是免费的吗?
是的,Yandex Archive Scraper 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。
Yandex Archive Scraper 支持哪些平台?
Yandex Archive Scraper 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。
谁开发了 Yandex Archive Scraper?
由 Flo(@flobo3)开发并维护,当前版本 v1.0.0。