/install pdf-ocr-zc
PDF OCR 处理技能
何时使用
- 需要对大量扫描件 PDF 进行文字识别(OCR)
- 希望直接得到可搜索的 PDF(文字层)或提取的纯文本/Markdown
- 需要在老师 Agent 工作流中自动化该步骤
基本使用方式
# 运行一次 OCR(需要已安装 Tesseract 与 ocrmypdf)
openclaw exec python skills/pdf-ocr/scripts/ocr_batch.py \x3Cinput-pdf> \x3Coutput-pdf>
\x3Cinput-pdf>:原始扫描 PDF 路径\x3Coutput-pdf>:输出带文字层的 PDF(同目录或指定路径)
高级选项
- 若想一次性处理目录下所有 PDF,使用
--batch-dir参数:
openclaw exec python skills/pdf-ocr/scripts/ocr_batch.py --batch-dir \x3Cpdf-dir>
- 可加
--lang chi_sim指定中文简体模型(默认 tesseract 会自动检测语言)
脚本说明 (scripts/ocr_batch.py)
- 检测并确保
ocrmypdf可用;如未安装会提示安装指令 - 使用
ocrmypdf完成 OCR,内部调用已装好的 Tesseract - 支持批量目录模式,遍历
*.pdf并生成对应带文字层文件 - 错误会记录到
logs/pdf_ocr_error.log,便于排查
参考资源
references/ocr_tips.md:常见 OCR 参数调优技巧(如 DPI、图片预处理)references/install_ocr.md:在 Windows 上安装 Tesseract 与 ocrmypdf 的详细步骤
与老师 Agent 的集成
在老师 Agent 的工作流(如 auto_ingest)中,可在 HEARTBEAT.md 或 cron 中加入如下调用,以实现每日自动 OCR:
openclaw exec python skills/pdf-ocr/scripts/ocr_batch.py --batch-dir /path/to/teacher-pdfs
这样老师 Agent 在 ingest 前就已拥有文字层,后续向量化、检索都能顺畅进行。
使用示例
- 单文件 OCR:
openclaw exec python skills/pdf-ocr/scripts/ocr_batch.py D:\docs\scan1.pdf D:\docs\scan1_text.pdf
- 批量目录 OCR:
openclaw exec python skills/pdf-ocr/scripts/ocr_batch.py --batch-dir D: eacher-pdfs
如需更细粒度的文本(Markdown),可在脚本后接 pdf2txt.py 转换。
注意:此技能仅在本机执行,不会触发外部网络请求,符合安全策略。
- Make sure OpenClaw is installed (local or Docker)
- Run the install command in chat:
/install pdf-ocr-zc - After installation, invoke the skill by name or use
/pdf-ocr-zc - Provide required inputs per the skill's parameter spec and get structured output
What is pdf-ocr-byzhangchong?
批量 OCR 处理扫描 PDF,自动生成带文字层的 PDF 并可导出为 Markdown/纯文本。使用场景包括老师 Agent 需要将大量扫描教材 PDF 转化为可检索文本。 It is an AI Agent Skill for Claude Code / OpenClaw, with 75 downloads so far.
How do I install pdf-ocr-byzhangchong?
Run "/install pdf-ocr-zc" in the OpenClaw or Claude Code chat to install it in one step — no extra setup required.
Is pdf-ocr-byzhangchong free?
Yes, pdf-ocr-byzhangchong is completely free, licensed under MIT-0. You can download, install and use it at no cost.
Which platforms does pdf-ocr-byzhangchong support?
pdf-ocr-byzhangchong is cross-platform and runs anywhere OpenClaw / Claude Code is available (cross-platform).
Who created pdf-ocr-byzhangchong?
It is built and maintained by 张翀 (@openclawzhangchong); the current version is v1.0.0.