/install yandex-archive-scraper
\r \r
yandex-archive-scraper\r
\r
A powerful skill for searching and extracting data from Yandex.Archive (Яндекс.Архив) using Scrapling to bypass bot protection and Cloudflare Turnstile.\r
\r
Features\r
- Converts natural language queries into optimized Yandex.Archive search URLs.\r
- Uses
Scrapling(StealthyFetcher) to bypass Yandex bot protection.\r - Extracts search results (document titles, text snippets, and direct links).\r
- Supports pagination to collect multiple pages of results.\r
- Can search across all three Yandex.Archive indexes:\r
archive(Архивы) — Metric books, revision tales, confessional statements.\rmass_media(Периодика) — Old newspapers (e.g., "Senate Gazette", "Provincial Gazette").\rdirectories(Справочники) — Address calendars, lists of residents, memorable books.\r \r
Tools\r
\r
yandex_archive_search\r
Search Yandex.Archive based on a natural language query.\r Parameters:\r
query(string): The search query (e.g., "Александр Пушкин Москва").\rindex(string, optional): The index to search in. Options:archive(default),mass_media,directories.\rmax_pages(integer, optional): Maximum number of pages to scrape (default 1).\r \r
Requirements\r
scrapling\rplaywright\rcurl_cffi\rpatchright\rmsgspec\rbrowserforge\r \r ---\r \r
yandex-archive-scraper (Русский)\r
\r
Мощный скилл для поиска и извлечения данных из Яндекс.Архива с использованием фреймворка Scrapling для обхода защиты от ботов и Cloudflare Turnstile.\r
\r
Возможности\r
- Преобразует запросы на естественном языке в оптимизированные URL для поиска по Яндекс.Архиву.\r
- Использует
Scrapling(StealthyFetcher) для обхода защиты Яндекса.\r - Извлекает результаты поиска (названия документов, текстовые фрагменты/сниппеты и прямые ссылки).\r
- Поддерживает пагинацию для сбора нескольких страниц результатов.\r
- Умеет искать по всем трем базам Яндекс.Архива:\r
archive(Архивы) — Метрические книги, ревизские сказки, исповедные ведомости.\rmass_media(Периодика) — Старые газеты (например, "Сенатские ведомости", "Губернские ведомости").\rdirectories(Справочники) — Адрес-календари, списки жителей, памятные книжки.\r \r
Инструменты (Tools)\r
\r
yandex_archive_search\r
Поиск по Яндекс.Архиву на основе текстового запроса.\r Параметры:\r
query(string): Поисковый запрос (например, "Александр Пушкин Москва").\rindex(string, optional): Раздел для поиска. Варианты:archive(по умолчанию),mass_media,directories.\rmax_pages(integer, optional): Максимальное количество страниц для парсинга (по умолчанию 1).\r \r
Зависимости\r
scrapling\rplaywright\rcurl_cffi\rpatchright\rmsgspec\rbrowserforge
- Make sure OpenClaw is installed (local or Docker)
- Run the install command in chat:
/install yandex-archive-scraper - After installation, invoke the skill by name or use
/yandex-archive-scraper - Provide required inputs per the skill's parameter spec and get structured output
What is Yandex Archive Scraper?
Search and extract data from Yandex.Archive (Яндекс.Архив) — metric books, newspapers, directories. Bypasses bot protection via Scrapling. It is an AI Agent Skill for Claude Code / OpenClaw, with 108 downloads so far.
How do I install Yandex Archive Scraper?
Run "/install yandex-archive-scraper" in the OpenClaw or Claude Code chat to install it in one step — no extra setup required.
Is Yandex Archive Scraper free?
Yes, Yandex Archive Scraper is completely free, licensed under MIT-0. You can download, install and use it at no cost.
Which platforms does Yandex Archive Scraper support?
Yandex Archive Scraper is cross-platform and runs anywhere OpenClaw / Claude Code is available (cross-platform).
Who created Yandex Archive Scraper?
It is built and maintained by Flo (@flobo3); the current version is v1.0.0.