← Back to Skills Marketplace
j-levee

Smartlib Literature Search Clawhub

by J-levee · GitHub ↗ · v1.0.0 · MIT-0
cross-platform ⚠ suspicious
41
Downloads
0
Stars
1
Active Installs
1
Versions
Install in OpenClaw
/install smartlib-literature-search
Description
中外文学术文献检索服务。覆盖8000万篇授权中文期刊全文+12.28亿条全球文献元数据(含期刊7.19亿、专利2.15亿、会议论文7155万、学位论文2473万、标准268万等)。 内置三级检索策略(宽检索高查全/窄检索高查准/平衡策略),支持关键词检索、文献详情查看、全文下载(中文直接下载+外文十级渠道自动探测...
README (SKILL.md)

\r \r

中外文学术文献检索服务 / Academic Literature Search Service\r

\r

中文 / Chinese | [English below each section]\r \r 通过 SmartLib 开放平台 API 提供中外文学术文献检索能力。\r \r Powered by SmartLib Open Platform API. Search across 80M Chinese journal articles and 1B global literature records.\r \r ---\r \r

⚡ 启动前必须执行 / Pre-flight Checklist\r

\r

Step A:凭证自动检测 & 注册 / Auto Credential Check & Registration\r

\r 每次执行本技能时,按以下流程处理凭证(从 config.json 读取):\r \r

读取技能目录下的 config.json\r
检查 SMARTLIB_EMAIL 是否已配置\r
  ├── 已配置 → 进入 Step B (配额检查)\r
  │\r
  └── 未配置 → 自动注册流程:\r
        ├── ① 展示检索计划 + 询问邮箱(一句话):\r
        │      "📋 我将用中英文关键词检索... 首次使用需绑定邮箱(免费 100 次/月,仅用于配额管理),请输入邮箱即可开始:"\r
        │      用户输入 → 写入 config.json\r
        │\r
        ├── ② 调智能网关注册(无需验证码,极速注册):\r
        │     POST {SMARTLIB_GATEWAY_URL}/register\r
        │     Headers: {"Authorization": "Bearer {SMARTLIB_GATEWAY_SECRET}"}\r
        │     Body: {"email": "{用户邮箱}"}\r
        │\r
        ├── 成功 (201/200) → Gateway 返回配额信息\r
        │     提示: "已注册,本月免费 100 次。确认邮件已发送,建议尽早验证邮箱。"\r
        │     → 继续 Step B 配额检查 → 检索\r
        │\r
        └── 失败 → 提示原因 (服务暂不可用 / 网络错误等) → 终止\r
```\r
\r
> **注意**:注册无需验证码,极速完成。注册后发送确认邮件(可选操作,不影响使用)。\r
> \r
\r
### Step B:配额检查 / Quota Check\r
\r
```\r
凭证就绪后, 调网关查询配额:\r
  GET \x3CSMARTLIB_GATEWAY_URL>/quota?email=\x3CSMARTLIB_EMAIL>\r
  Headers: {"Authorization": "Bearer \x3CSMARTLIB_GATEWAY_SECRET>"}\r
\r
  返回字段: total_remain, email_verified, plan\r
  (完整返回: user_id, email, plan, trial_total, trial_used, trial_remain, paid_total, paid_used, paid_remain, paid_expires_at, total_remain, email_verified)\r
  \r
  total_remain > 20 → 静默进入检索\r
  total_remain 5-20 → 尾部轻提示: "📊 本月剩余 {n} 次"\r
  total_remain 1-5  → 警告: "⚠️ 接近用尽(剩余 {n} 次),回复「充值」查看套餐(数字 1-4 选)"\r
  total_remain 0    → 配额耗尽处理(见配额耗尽章节)\r
\r
  额外检查:\r
```\r
\r
### Step C:按接口调用次数消耗配额 / Per-API-Call Quota Consumption\r
\r
本技能的配额按**实际 API 接口调用次数**计费,不是按对话会话计费。\r
\r
共涉及 **5 个接口**(分3类),每次调用其中任意一个接口计 **1 次**配额。\r
\r
> Quota is consumed **per API call**, not per conversation session. **5 interfaces** in 3 categories, each call = 1 quota.\r
\r
**计费接口清单(5个)/ Billable Interfaces (5 total):**\r
\r
| 类别 | 接口 | API 端点 | 计费 |\r
|------|------|---------|------|\r
| **检索** | 中文期刊检索 | API 1 `Articlesearch` | 每次调用 **1 次** |\r
| **检索** | 全球文献检索 | API 4 `Articlesearch` | 每次调用 **1 次** |\r
| **详情** | 中文期刊详情 | API 1/5 `Articledetail` | 每次调用 **1 次** |\r
| **详情** | 全球文献详情 | API 4/5 `Articledetail` | 每次调用 **1 次** |\r
| **下载** | 中文期刊全文下载 | API 3 `GetArticleFile` | 每次调用 **1 次** |\r
\r
> 注:全球文献(API 4)无全文下载接口,仅返回元数据。\r
\r
**计次示例 / Counting Examples:**\r
\r
```\r
示例1:用户请求"查10篇工业母机论文,下载5篇中文PDF"\r
  → 检索接口:中文1次 + 英文1次         = 2 次\r
  → 详情接口:查5篇详情                   = 5 次\r
  → 下载接口:下载5篇PDF                  = 5 次\r
  → 合计消耗: 12 次配额\r
```\r
\r
```\r
示例2:用户请求"帮我看看这篇论文的详情"(1篇)\r
  → 详情接口:1次                         = 1 次\r
  → 合计消耗: 1 次配额\r
```\r
\r
```\r
示例3:用户仅请求"检索人工智能论文"(不查看详情、不下载)\r
  → 检索接口:1次(或2次,若中英文并行) = 1-2 次\r
  → 合计消耗: 1-2 次配额\r
```\r
\r
**扣减方式 / Deduction Method:**\r
\r
**⚠️ 强制执行规则:每次调用计费接口前,必须先调 `/consume` 获取 token,再用 token 调 `/search`。**\r
\r
每次调用计费接口的流程:\r
\r
```\r
① POST \x3CSMARTLIB_GATEWAY_URL>/consume\r
   Headers: {"Authorization": "Bearer \x3CSMARTLIB_GATEWAY_SECRET>"}\r
   Body: {"email": "\x3CSMARTLIB_EMAIL>"}\r
\r
   返回 200 → 获取 consume_token,继续\r
   返回 429 → 配额已用完,终止后续调用,提示充值\r
\r
② POST \x3CSMARTLIB_GATEWAY_URL>/search\r
   Headers: {"Authorization": "Bearer \x3CSMARTLIB_GATEWAY_SECRET>"}\r
   Body: {\r
       "email": "\x3CSMARTLIB_EMAIL>",\r
       "consume_token": "\x3C上一步返回的token>",\r
       "api_path": "/openapi/t/data0012/doccenter/Articlesearch",\r
       "api_body": {\x3C检索请求体>}\r
   }\r
\r
   返回 200 → 检索成功\r
   返回 401 → token 无效/过期/已用,需重新 /consume\r
```\r
\r
> **MANDATORY**: Call `/consume` → `/search` for **EACH** billable API call. Token is single-use, expires in 60s. If 401 on /search, re-consume.\r
\r
**🛡️ Token 绑定调用链 / Token-Bound Call Chain:**\r
\r
> **强制安全机制 — 不可绕过:**\r
> 每次调用计费接口前,必须通过 `/consume` 获取 `consume_token`,然后将 token 传给 `/search` 代理端点。\r
> Gateway 验证 token 签名 + 有效期 + 防重放后才转发检索请求。\r
> Token 由 GATEWAY_SECRET 签名,AI 无法伪造。无有效 token 则 /search 直接 401。\r
>\r
> **调用流程 / Call Flow:**\r
> ```\r
> 1. POST /consume {"email":"..."} → 返回 consume_token\r
> 2. POST /search {"email":"...", "consume_token":"...", "api_path":"...", "api_body":{...}}\r
>    → Gateway 验证 token → 代理转发到检索 API → 返回检索结果\r
> ```\r
>\r
> **注意**:每个 consume_token 只能使用一次(防重放),有效期 60 秒。每次检索 API 调用前都需要先 /consume 获取新 token。\r
\r
**🆕 v36 行为:仅成功调用消耗配额 / Quota Deducted on Success Only:**\r
\r
> `/consume` 仅验证配额可用性 + 签发 token,**不预扣配额**。配额在实际调用 SmartLib API 且返回成功后,由 Gateway 自动扣除。\r
> **失败的 API 调用不消耗配额**(如参数错误导致 400、网络错误导致 500 等)。\r
> `/consume` 返回的 `total_remain, email_verified, plan` 反映的是当前已成功调用的次数,非预扣后的值。\r
\r
**不计费的操作 / Non-billable Operations:**\r
\r
| 操作 / Operation | 说明 / Note |\r
|------|------|\r
| /consume 配额消费 | Gateway 验证,不计费 |\r
| 联网关键词扩展 | Web search,不计费 |\r
| 结果排序/格式化展示 | 本地处理,不计费 |\r
| 多级 OA PDF 探测 | 外部免费 API(ArXiv/Unpaywall/CORE/OpenAlex等),**不消耗 SmartLib 配额** |\r
| 原始来源链接展示 | Source 字段随详情接口返回,不计额外费用 |\r
\r
\r
---\r
\r
## 💰 支付与充值 / Payment & Recharge\r
\r
### 触发时机\r
1. 配额为 0 (gateway 返回 429)\r
2. 用户说 "充值" "续费" "购买"\r
\r
### 套餐列表\r
\r
| 套餐 | plan key | 价格(元) | 配额 | 说明 |\r
|------|----------|---------|------|------|\r
| 体验包 | `trial` | 9.90 | 1000 次 | 限购 1 次 |\r
| 基础月付 | `basic` | 29.00 | 5000 次/月 | 个人用户 |\r
| 进阶月付 | `pro` | 99.00 | 20000 次/月 | 轻度团队 |\r
| 专业月付 | `enterprise` | 299.00 | 100000 次/月 | 重度使用 |\r
\r
> **plan key**:调用 `/api/pay/create` 时传 `trial`/`basic`/`pro`/`enterprise`。金额单位为**元**(非分)。\r
\r
### 支付流程(对话交互,数字选套餐)\r
\r
全部在对话中完成,用户只需回复数字:\r
\r
```\r
配额耗尽/用户说"充值" →\r
    ↓\r
⓪ 展示套餐卡片(show_widget),用数字①②③④标注:\r
   ① 体验包 ¥9.90 — 1,000 次/月\r
   ② 基础月付 ¥29.00 — 5,000 次/月\r
   ③ 进阶月付 ¥99.00 — 20,000 次/月 [推荐]\r
   ④ 专业月付 ¥299.00 — 100,000 次/月\r
   用户回复数字 (如 "3")\r
    ↓\r
   映射: "1"→trial, "2"→basic, "3"→pro, "4"→enterprise\r
    ↓\r
① 调 Gateway 生成订单:\r
  POST {SMARTLIB_GATEWAY_URL}/api/pay/create\r
  Headers: {"Authorization": "Bearer {SMARTLIB_GATEWAY_SECRET}"}\r
  Body: {"plan": "basic", "amount": 29.00, "quota": 5000, "email": "{SMARTLIB_EMAIL}"}\r
\r
  返回: {"code_url": "weixin://...", "out_trade_no": "WB...", "amount": 29.00, "plan": "basic", "quota": 5000}\r
    ↓\r
② 生成带订单信息的二维码 HTML 页面,用 preview_url 在对话内展示:\r
\r
  **页面必须包含:套餐名称、金额、配额标签、二维码、订单号**\r
  用 qrcode.js CDN 将 code_url 渲染为二维码。\r
  样式参考:渐变紫色背景 + 白色卡片 + 居中布局。\r
\r
  ⚠️ 不要在卡片内容中显示用户邮箱\r
\r
    ↓\r
③ 轮询支付状态:\r
  GET {SMARTLIB_GATEWAY_URL}/api/pay/status?out_trade_no=xxx\r
  (间隔 3s 轮询,最多轮询 20 次 ≈ 60s,超时提示重新发起)\r
\r
  支付成功时返回:\r
  {"status":"paid", "auto_recharged":true, "quota_remain":5000, "quota_total":5100, "quota_used":100}\r
    ↓\r
④ 对话中通知结果:\r
  "✅ 支付成功! 已自动充值 5000 次,当前剩余 5000 次。"\r
    ↓\r
  自动重试上次中断的检索\r
```\r
\r
### 为什么不需要 /recharge?\r
支付回调 (`/api/pay/notify`) 由微信支付服务器直接通知 Gateway,Gateway 在回调中**同一事务内**完成标记订单 paid + 累加配额。`/api/pay/status` 查询到 paid 时配额已到账,无需额外操作。\r
\r
### 安全机制\r
- 网关通过 `out_trade_no` UNIQUE 索引防重复充值\r
- 二维码 5 分钟有效, 超时需重新发起\r
- `/api/pay/status` 为公开端点(无需 Bearer Token),可直接轮询\r
- `SMARTLIB_GATEWAY_SECRET` 仅供后端调用, 不在对话中输出\r
- ⚠️ 生成的支付 HTML 页面上**禁止显示用户邮箱**,仅显示套餐信息\r
\r
---\r
\r
## 🔒 配额耗尽处理 / Quota Exhaustion\r
\r
配额耗尽后,**暂停新的检索请求**,不再展示任何部分结果。\r
\r
| 状态 | 行为 |\r
|------|------|\r
| **配额充足** (>0) | 正常执行检索,完整展示所有结果(含详情查看、全文下载、智能排序) |\r
| **配额耗尽** (=0) | Gateway 返回 429,**拒绝服务**,直接提示充值 |\r
\r
配额耗尽后的提示格式:\r
\r
```\r
⚠️ 您的 SmartLib 检索配额已用尽(0/100次)。\r
\r
当前配额不支持发起新检索。请充值后继续使用。\r
\r
> 💰 充值套餐:\r
> 体验包:¥9.90 / 1000次\r
> 月付基础:¥29.00 / 5000次/月\r
> 月付进阶:¥99.00 / 20000次/月\r
> 月付专业:¥299.00 / 100000次/月\r
> 回复「充值」查看套餐(回复数字 1-4 选择),支付后立即生效。\r
```\r
\r
**重要规则**:\r
- 配额耗尽后,**所有检索请求一律拒绝**,不展示任何结果\r
- 用户需先充值恢复配额,才能继续使用检索功能\r
- 充值后立即生效,无需等待\r
\r
---\r
\r
## 输出规范 / Output Standards\r
\r
**每次检索结果末尾必须展示配额状态:**\r
\r
```\r
📊 本次消耗 3 次 | 剩余 82 次 (共 100 次/月)\r
```\r
或接近耗尽时:\r
```\r
⚠️ 剩余 3 次 (共 100 次/月),回复「充值」选套餐\r
```\r
\r
```\r
```\r
\r
## 核心能力 / Core Capabilities\r
\r
| 能力 / Capability | 说明 / Description |\r
|------|------|\r
| **中文期刊检索 / Chinese Journal Search** | 8000万篇授权中文期刊文献,支持全文下载 / 80M authorized Chinese journal articles with full-text download |\r
| **全球文献检索 / Global Literature Search** | 10亿篇中外文文献元数据(含中英文论文、专利、标准、学位论文等)/ 1B global literature metadata (papers, patents, standards, theses) |\r
| **文献详情 / Article Detail** | 查看摘要、DOI、基金资助、核心收录等完整信息 / View abstracts, DOI, funding, core journal indexing |\r
| **全文下载 / Full-text Download** | 授权中文期刊支持 PDF 全文下载 / PDF download for authorized Chinese journals |\r
| **原始来源链接 / Source Links** | 每篇文献提供多个原始数据库详情链接(覆盖300+数据库,如Scopus/WoS/EI/PubMed等),覆盖率100%,平均4.75个/篇,可直接验证文献真实性 / Multi-database source links for authenticity verification |\r
| **OA文献免费下载 / OA Free Download** | 十级多渠道自动探测OA文献PDF(ArXiv/Unpaywall/CORE/OpenAlex等),Gold/Hybrid/Bronze/Green OA免费获取,**不消耗SmartLib配额** / OA PDF auto-detection via 10 channels, no quota consumption |\r
| **智能关键词扩展 / Smart Keyword Expansion** | 联网检索中英文同义词/近义词,自动扩展检索词,提升召回率 / Web search for synonyms to expand search terms |\r
| **核心期刊优先排序 / Core Journal Priority** | 联网查询核心收录情况(SCI/EI/北大核心/CSSCI等),优先展示高水平文献 / Rank by core journal indexing (SCI/EI/CSSCI etc.) |\r
| **相关性智能排序 / Relevance Ranking** | 基于题名、关键词、摘要语义分析,对检索结果进行二次相关性排序 / Semantic relevance re-ranking |\r
| **少结果智能扩展 / Low-result Expansion** | 结果过少时自动推荐上位词、相关机构、学科分类号等多种扩展策略 / Auto-suggest broader terms and alternative strategies |\r
\r
## 能力边界 / Capability Boundaries\r
\r
### 支持的功能 / Supported\r
\r
- 中文期刊论文检索、详情、全文下载(8000 万篇授权文献)\r
- 全球文献元数据检索(10 亿篇,含论文/专利/标准/学位论文等)\r
- 关键词智能扩展、核心期刊优先排序、少结果自动扩展\r
- 自然语言输入,无需学习检索语法\r
\r
### 不支持的功能 / Not Supported\r
\r
- **付费墙内英文文献全文下载**:通过 SmartLib API 4 查到的全球文献仅返回元数据。本技能已集成十级多渠道下载策略(ArXiv/Unpaywall/CORE/OpenAlex/Semantic Scholar/Crossref/DOI.org/Europe PMC/bioRxiv/medRxiv + CDP浏览器),可免费获取 OA 版本(Gold/Hybrid/Bronze/Green OA),**OA 下载不消耗 SmartLib 配额**。但付费墙内(closed access)文献无法获取全文\r
- **付费墙内文献**:不提供需单独购买的文献全文\r
- **批量导出**:不提供 EndNote/BibTeX 等格式的批量导出功能\r
- **文献查重/查新**:不具备论文查重或科技查新功能\r
\r
### 使用限制 / Limitations\r
\r
| 限制项 / Limit | 说明 / Description |\r
|------|------|\r
| **单次查询条数 / Per-query limit** | PageSize 20-1000,建议 ≤100 以保证速度 / Recommend ≤100 |\r
| **翻页上限 / Max pages** | 无硬限制,但建议不超过 50 页(共 1000 条)/ No hard limit, but ≤50 pages recommended |\r
| **请求频率 / Rate limit** | 有频率限制(未公开数值),触发 429 时自动等待重试 / Undisclosed limit; auto-retry on 429 |\r
| **Token 有效期 / Token TTL** | Access Token 30 秒,Refresh Token 2 小时。系统自动管理刷新 / Access Token 30s, Refresh Token 2h. Auto-managed. |\r
| **下载链接有效期 / Download URL TTL** | 约 10 分钟,过期需重新调用下载接口 / ~10min, re-call download API |\r
| **依赖 / Dependencies** | 完全依赖 SmartLib API 和网络连接,离线不可用 / Requires network + SmartLib API |\r
\r
### 触发意图区分 / Trigger Intent Differentiation\r
\r
| 用户表达 / User Expression | 系统行为 / System Behavior | 区分逻辑 / Rationale |\r
|------|------|------|\r
| "查论文"、"找文献"、"检索XX" / "Search XX papers" | **触发本 Skill**,精准检索,默认平衡策略 | 明确的检索意图 |\r
| "写文献综述"、"帮我写综述" / "Write a literature review" | **触发本 Skill**,切换为综述模式:宽检索策略、去重合并、按主题聚类 | 综述需更全的覆盖范围和聚类分析 |\r
| "帮我写论文开头/引言" / "Write paper intro, need citations" | **触发本 Skill**,窄检索策略:找 3-5 篇最相关引用,核心期刊优先 | 写作引用需要精准而非全面 |\r
| "这段论述有文献支撑吗"、"找几篇引用" / "Find supporting citations" | **触发本 Skill**,窄检索 + 核心期刊优先,提供可引用的高质量文献 | 文献支撑场景需要高可信度来源 |\r
| "这篇论文是真的吗"、"核查引用" / "Verify this citation" | **不触发本 Skill**,应转至 smartlib-citation-checker | 引用核查是独立能力 |\r
| "帮我写论文"、"写作辅助" / "Help me write" | **不触发本 Skill** | 论文写作不是文献检索功能 |\r
| "下载这篇论文的 PDF" / "Download this paper's PDF" | **触发本 Skill**(若有中文期刊 ID) | 下载是检索的延伸功能 |\r
\r
## 数据范围 / Data Coverage\r
\r
平台累计汇聚各类资源元数据总量达 **12.28 亿条**。\r
\r
> The platform aggregates **1.228 billion** metadata records.\r
\r
### 核心文献类型存量规模 / Core Literature Type Inventory\r
\r
| 文献类型 / Type | 存量规模 / Inventory | 说明 / Notes |\r
|------|------|------|\r
| **期刊文献 / Journal Articles** | **7.19 亿条 / 719M** | 平台核心资源 / Largest category |\r
| **专利资源 / Patents** | **2.15 亿条 / 215M** | 第二大品类 / Second largest |\r
| **会议论文 / Conference Papers** | **7155 万条 / 71.55M** | — |\r
| **学位论文 / Theses & Dissertations** | **2473 万条 / 24.73M** | — |\r
| **标准资源 / Standards** | **268 万条 / 2.68M** | — |\r
\r
### 可检索数据集 / Searchable via API\r
\r
- **中文期刊数据集 / Chinese Journal Dataset**:8000 万篇授权中文期刊文献,支持全文下载 / 80M authorized Chinese journal articles with full-text download\r
- **全球文献数据集 / Global Literature Dataset**:覆盖全平台 12.28 亿条元数据 / Covers all 1.228B metadata records\r
\r
## 环境配置 / Environment Configuration\r
\r
配置存储于技能目录下的 `config.json`:\r
\r
> Config persisted at skill-level config.json:\r
\r
```json\r
{\r
  "SMARTLIB_GATEWAY_URL": "https://\x3Cyour-gateway>.ap-shanghai.tencentscf.com",\r
  "SMARTLIB_GATEWAY_SECRET": "\x3Cyour-gateway-secret>",\r
  "SMARTLIB_EMAIL": null\r
}\r
```\r
\r
Gateway 自动管理 SmartLib 凭证, 你不需要 APPID/APPSECRET。用户的 EMAIL 在首次注册后自动写入。运行前先读取 config.json 获取网关地址和密钥。\r
\r
## Token 管理 / Token Management\r
\r
SmartLib 的 OAuth Token 由 Gateway 全权管理。你无需获取或缓存 Token。\r
\r
Gateway 支持两种检索调用模式:\r
\r
### 推荐:语义化端点(v36+,更简洁)\r
\r
```\r
POST /search\r
Headers: {"Authorization": "Bearer \x3CSECRET>"}\r
Body: {\r
  "email": "\x3CSMARTLIB_EMAIL>",\r
  "consume_token": "\x3Ctoken>",\r
  "endpoint": "/search/cn",     // 或 /search/global, /detail/cn, /detail/global\r
  "rule": "K=人工智能",          // 检索表达式\r
  "page_index": 1,\r
  "page_size": 20,\r
  "sort": 1                     // 可选\r
}\r
```\r
\r
支持的 endpoint:`/search/cn` `/detail/cn` `/download/cn` `/search/global` `/detail/global`\r
\r
### 兼容:全代理模式(旧版,仍可用)\r
\r
```\r
POST /search\r
Body: {\r
  "email": "...",\r
  "consume_token": "...",\r
  "api_path": "/openapi/t/data0012/doccenter/Articlesearch",\r
  "api_body": {"Rule": "...", "PageIndex": 1, "PageSize": 20}\r
}\r
```\r
\r
## 检索接口选择策略 / Search Interface Selection\r
\r
| 用户需求特征 / User Intent | 推荐接口 / Recommended API | 原因 / Reason |\r
|-------------|---------|------|\r
| 查中文论文/需要全文 / Chinese papers, need full-text | 接口1(中文期刊检索)/ API 1 | 支持全文下载 / Full-text available |\r
| 查英文论文/国际期刊 / English papers, intl. journals | 接口4(全球文献检索)/ API 4 | 覆盖范围更广 / Broader coverage |\r
| 需要专利/标准/学位论文 / Patents, standards, theses | 接口4(全球文献检索)/ API 4 | 支持多种文献类型 / Multi-type support |\r
| 不确定/跨语言检索 / Uncertain, cross-language | 优先接口4,再补充接口1 / API 4 first, supplement API 1 | 互为补充 / Complementary |\r
| 明确指定中文来源 / Explicit Chinese source | 接口1(中文期刊检索)/ API 1 | 数据更精准 / More precise |\r
\r
## 检索策略分级体系 / Search Strategy Hierarchy\r
\r
### 策略选择决策表 / Strategy Selection Matrix\r
\r
| 检索场景 / Scenario | 推荐策略 / Strategy | 目标 / Goal |\r
|------|------|------|\r
| 开题报告、文献综述、查新 / Thesis proposal, literature review, novelty check | **宽检索 / Broad** | 查全优先 / Recall-first |\r
| 精准溯源、单篇确认、引用支撑 / Precise trace, citation verification, evidence finding | **窄检索 / Narrow** | 查准优先 / Precision-first |\r
| 常规文献调研、一般检索 / General literature survey | **平衡策略 / Balanced (default)** | 查全查准兼顾 / Balanced |\r
\r
### 策略切换信号 / Strategy Switch Signals\r
\r
执行检索后,系统根据结果自动评估是否需要切换策略:\r
\r
- 结果 > 500 条且前 10 条相关性差 → 提示切换为**窄检索**\r
- 结果 \x3C 5 条 → 提示切换为**宽检索**(执行「结果数量自适应策略」)\r
- 结果方向偏(前 10 条均不相关)→ 提示**更换关键词或字段**\r
\r
---\r
\r
## 可用接口 / Available Interfaces\r
\r
### 1. 中文期刊文献检索 / Chinese Journal Search\r
\r
通过 Gateway /search 代理访问:\r
\r
```\r
POST {SMARTLIB_GATEWAY_URL}/search\r
Headers: {"Authorization": "Bearer \x3CSMARTLIB_GATEWAY_SECRET>"}\r
Content-Type: application/json\r
\r
Body: {\r
  "email": "\x3CSMARTLIB_EMAIL>",\r
  "consume_token": "\x3C通过 /consume 获取的 token>",\r
  "api_path": "/openapi/t/data0012/doccenter/Articlesearch",\r
  "api_body": {\r
    "Rule": "\x3C检索表达式>",\r
    "PageIndex": 1,\r
    "PageSize": 20,\r
    "Sort": 1,\r
    "FilterRule": "\x3C可选:过滤表达式>"\r
  }\r
}\r
```\r
\r
**检索表达式规则(Rule,必填):**\r
- 字段代码:`T`=题名,`A`=作者,`K`=主题词,`P`=出版物名称,`O`=机构,`U`=全部字段\r
- 逻辑运算符(必须大写,两边空格):`AND` `OR` `NOT`\r
- 示例:`(K=人工智能 OR K=机器学习) AND O=清华大学`、`T=深度学习`\r
\r
**过滤表达式规则(FilterRule,可选):**\r
- 字段代码:`L`=中图分类号,`C`=学科分类号,`Y`=出版年份,`TY`=文献类型,`LA`=语言\r
- 文献类型 TY:3=期刊文献,4=学位论文,5=标准,7=专利,等\r
- 示例:`TY=3 AND Y=2024`\r
\r
**排序 Sort:** 1=相关度(默认),2=时效性倒序,3=时效性正序\r
**PageSize 范围:** 20~1000\r
\r
### 2. 中文期刊文献详情 / Chinese Journal Detail\r
\r
通过 Gateway /search 代理访问:\r
\r
```\r
POST {SMARTLIB_GATEWAY_URL}/search\r
Headers: {"Authorization": "Bearer \x3CSMARTLIB_GATEWAY_SECRET>"}\r
Content-Type: application/json\r
\r
Body: {\r
  "email": "\x3CSMARTLIB_EMAIL>",\r
  "consume_token": "\x3C通过 /consume 获取的 token>",\r
  "api_path": "/openapi/t/data0011/doccenter/Articledetail",\r
  "api_body": {\r
    "Identifier": "\x3C文献ID>"\r
  }\r
}\r
```\r
\r
返回完整文献详情,包含摘要、DOI、页码、基金资助、核心收录、原始数据库来源链接等。\r
\r
### 3. 中文期刊文献下载 / Chinese Journal Download\r
\r
仅限授权中文期刊全文下载。\r
\r
通过 Gateway /search 代理访问:\r
\r
```\r
POST {SMARTLIB_GATEWAY_URL}/search\r
Headers: {"Authorization": "Bearer \x3CSMARTLIB_GATEWAY_SECRET>"}\r
Content-Type: application/json\r
\r
Body: {\r
  "email": "\x3CSMARTLIB_EMAIL>",\r
  "consume_token": "\x3C通过 /consume 获取的 token>",\r
  "api_path": "/openapi/t/data0013/doccenter/GetArticleFile",\r
  "api_body": {\r
    "Identifier": "\x3C文献ID>"\r
  }\r
}\r
```\r
\r
返回 / Response:`{"Data": {"Url": "\x3C下载链接>", "Identifier": "\x3C文献ID>"}}`\r
\r
---\r
\r
### 3b. 全球文献全文多渠道下载 / Multi-channel Full-text Download\r
\r
SmartLib API 3 仅覆盖中文期刊全文。对于 API 4(全球文献检索)查到但有 DOI 的国际论文,本技能提供多级多渠道下载策略,最大化免费获取成功率。\r
\r
#### ⚡ 执行触发条件 / Execution Trigger\r
\r
**仅在用户主动请求全文下载时才执行外文文献下载流程。** 检索结果展示后,默认只展示元数据;用户说"下载全文"/"获取PDF"/"帮我下载"时才触发。\r
\r
> Full-text download is **user-triggered only**. After search results are displayed, only metadata is shown. Execute download only when the user explicitly requests full-text (e.g., "下载全文", "获取PDF", "帮我下载").\r
\r
**触发关键词 / Trigger Keywords:**\r
- 中文:「下载全文」「获取PDF」「帮我下载」「我要看全文」「下载这篇/这些」\r
- 英文:`download full-text` / `get PDF` / `download this paper`\r
\r
**执行规则 / Execution Rules:**\r
\r
```\r
用户请求下载全文:\r
  ├── 中文期刊文献 → 调 API 3 下载 PDF(直接)\r
  └── 外文文献(API 4,有 DOI)\r
       ├── 按渠道优先级 1→10 自动逐级尝试\r
       ├── 任一渠道成功 → 停止后续渠道,标记结果\r
       ├── 全部失败 → 按失败分类标记\r
       └── 每篇文献独立执行,并行处理(最多 10 篇并发)\r
```\r
\r
**结果标记规范 / Result Tagging Standard:**\r
\r
每篇外文文献下载完成后,必须在结果列表中标记获取状态。标记使用明确的图标+文字:\r
\r
| 标记 / Tag | 含义 / Meaning | 触发条件 |\r
|------|------|------|\r
| `[全文:已获取 ✓]` | PDF 已成功下载 | 任一渠道成功获取 PDF 文件 |\r
| `[全文:在线 📖]` | 可在线阅读但无法自动下载 | Bronze OA / 出版商防盗链 |\r
| `[全文:付费 💰]` | 付费墙内,需机构订阅或购买 | Closed access / 所有渠道均返回 403 |\r
| `[全文:手动 🔍]` | 所有渠道均失败,需用户手动获取 | 无 OA 版本 / 网络错误 / 无 DOI |\r
| `[全文:未尝试 -]` | 无 DOI 或未触发下载流程 | 文献无 DOI 或 API 4 未返回 DOI |\r
\r
**结果展示格式 / Display Format:**\r
\r
检索结果列表中,每篇外文文献末尾追加标记:\r
\r
```\r
1. [SCI一区] Attention Is All You Need\r
   Vaswani A, Shazeer N, Parmar N, et al.\r
   Advances in Neural Information Processing Systems, 2017\r
   摘要: The dominant sequence transduction models are based on...\r
   DOI: 10.5555/3295222.3295349\r
   [全文:已获取 ✓] → papers/attention_is_all_you_need.pdf\r
```\r
\r
**渠道执行报告 / Channel Execution Report:**\r
\r
所有文献下载完成后,在结果末尾输出汇总表:\r
\r
```\r
## 📥 外文文献全文获取报告 / Full-text Retrieval Report\r
\r
| # | 文献标题 | DOI | 成功渠道 | 状态 | 备注 |\r
|---|---------|-----|---------|------|------|\r
| 1 | Attention Is All You Need | 10.5555/xxx | ArXiv (渠道1) | [全文:已获取 ✓] | — |\r
| 2 | BERT: Pre-training of... | 10.18653/v1/xxx | Unpaywall (渠道2) | [全文:已获取 ✓] | — |\r
| 3 | Closed-access paper | 10.1000/xxx | — | [全文:付费 💰] | Elsevier 付费墙 |\r
| 4 | Bronze OA paper | 10.1093/xxx | DOI.org (渠道7) | [全文:在线 📖] | OUP Bronze OA,需手动保存 |\r
| 5 | No DOI paper | — | — | [全文:手动 🔍] | 无 DOI,建议联系作者 |\r
\r
> ✅ 成功 2/5 篇 | 📖 需在线阅读 1 篇 | 💰 付费墙 1 篇 | 🔍 需手动获取 1 篇\r
```\r
\r
#### 渠道优先级 / Channel Priority\r
\r
| 优先级 | 渠道 | 适用条件 | 可靠性 | 费用 |\r
|:--:|------|------|:--:|------|\r
| **1** | **ArXiv 直链** | 论文有 arxiv ID | ★★★★★ | 免费 |\r
| **2** | **Unpaywall OA 探测** | 有 DOI + 邮箱 | ★★★★☆ | 免费 |\r
| **3** | **CORE OA 聚合器** | 有 DOI + API Key | ★★★★☆ | 免费 |\r
| **4** | **OpenAlex 存档 PDF** | 有 DOI + API Key | ★★★★☆ | 免费 $1/天 |\r
| **5** | **Semantic Scholar PDF** | 有 API Key | ★★★☆☆ | 免费 |\r
| **6** | **Crossref 链接提取** | 有 DOI | ★★★☆☆ | 免费 |\r
| **7** | **DOI.org 重定向** | 有 DOI | ★★☆☆☆ | 免费 |\r
| **8** | **Europe PMC + PMC** | 生命科学/医学 DOI | ★★★☆☆ | 免费 |\r
| **9** | **bioRxiv/medRxiv** | 生命科学预印本 | ★★★★☆ | 免费 |\r
| **10** | **真实浏览器 CDP** | Bronze/Green OA | ★★★★☆ | 需服务器 |\r
\r
#### 下载决策树 / Download Decision Tree\r
\r
```\r
用户请求下载某篇论文\r
  ├─ 文献来自 API 1(中文期刊)→ 调 API 3(中文期刊下载)\r
  └─ 文献来自 API 4(全球文献)或仅有 DOI\r
       ├─ 有 ArXiv ID? → 渠道 1:ArXiv 直链\r
       ├─ 获取 DOI → 渠道 2:Unpaywall OA状态探测\r
       ├─ 渠道 3:CORE 全球OA聚合器\r
       ├─ 渠道 4:OpenAlex 存档PDF\r
       ├─ 渠道 5:Semantic Scholar PDF\r
       ├─ 渠道 6:Crossref PDF 链接提取\r
       ├─ 渠道 7:DOI.org 内容协商重定向\r
       ├─ 渠道 8:Europe PMC + PMC\r
       ├─ 生物医学 → 渠道 9:bioRxiv/medRxiv 预印本\r
       └─ 全部失败 + Bronze/Green OA? → 渠道 10:真实浏览器 CDP\r
```\r
\r
#### 出版商排障表 / Publisher Troubleshooting\r
\r
| 出版商 | 常见错误 | 原因 | 应对方案 |\r
|------|------|------|------|\r
| **OUP (Oxford)** | 403 Forbidden | Bronze OA,不开放自动化下载 | 渠道 10 CDP 模拟人工点击 |\r
| **IEEE** | 403 / 418 | 需机构订阅 IP | CC-BY 论文可直接下;其余需机构权限 |\r
| **Elsevier** | 403 | 付费墙 | 查 Green OA 版本 |\r
| **Springer Nature** | 403 / 418 | 付费墙 + 机器人检测 | 查 ArXiv 预印本 |\r
| **Nature / Science** | 403 | 几乎无免费 PDF | 查作者自存档 |\r
| **Wiley** | 403 | 付费墙 | 同 Elsevier |\r
\r
#### 失败分类与用户引导 / Failure Classification\r
\r
| 失败原因 | 用户提示 |\r
|------|------|\r
| **Bronze OA(出版商防盗链)** | 该论文为 Bronze OA——出版商允许免费阅读但禁止自动化下载。建议:[点击在线阅读]({url}) 手动保存 |\r
| **Closed(付费墙)** | 该论文在付费墙内。建议:1) 通过机构图书馆访问 2) 搜索 ArXiv/bioRxiv 预印本 3) 通过科研通求助 |\r
| **所有渠道均失败** | 所有下载渠道均未获取到全文。建议:[在线阅读]({url}) 或联系通讯作者请求 PDF |\r
\r
---\r
\r
### 4. 全球文献检索 / Global Literature Search\r
\r
通过 Gateway /search 代理访问:\r
\r
```\r
POST {SMARTLIB_GATEWAY_URL}/search\r
Headers: {"Authorization": "Bearer \x3CSMARTLIB_GATEWAY_SECRET>"}\r
Content-Type: application/json\r
\r
Body: {\r
  "email": "\x3CSMARTLIB_EMAIL>",\r
  "consume_token": "\x3C通过 /consume 获取的 token>",\r
  "api_path": "/openapi/t/skrs2/doccenter/Articlesearch",\r
  "api_body": {\r
    "Rule": "\x3C检索表达式>",\r
    "PageIndex": 1,\r
    "PageSize": 20,\r
    "Sort": 1,\r
    "FilterRule": "\x3C可选:过滤表达式>"\r
  }\r
}\r
```\r
\r
检索表达式和过滤规则与中文期刊检索完全相同。返回数据结构同 API 1,结果列表字段为 `Data.List`。\r
\r
### 5. 全球文献详情 / Global Literature Detail\r
\r
通过 Gateway /search 代理访问:\r
\r
```\r
POST {SMARTLIB_GATEWAY_URL}/search\r
Headers: {"Authorization": "Bearer \x3CSMARTLIB_GATEWAY_SECRET>"}\r
Content-Type: application/json\r
\r
Body: {\r
  "email": "\x3CSMARTLIB_EMAIL>",\r
  "consume_token": "\x3C通过 /consume 获取的 token>",\r
  "api_path": "/openapi/t/skrs1/doccenter/Articledetail",\r
  "api_body": {\r
    "Identifier": "\x3C文献ID>"\r
  }\r
}\r
```\r
\r
---\r
\r
## 使用指南 / Usage Guide\r
\r
### 完整工作流 / Complete Workflow\r
\r
```\r
                    ┌──────────────────────────────────┐\r
                    │ 1. 理解需求 / Understand Intent    │\r
                    └───────────────┬──────────────────┘\r
                                    ↓\r
                    ┌──────────────────────────────────┐\r
                    │ 2. 选定检索策略 / Select Strategy │ ← 宽检索/窄检索/平衡\r
                    └───────────────┬──────────────────┘\r
                                    ↓\r
              ┌─────────────────────────────────────────┐\r
              │ 3. 关键词智能扩展 / Keyword Expansion     │\r
              │ 4. 构建检索式 / Build Expression          │\r
              │ 5. 选择接口 / Select API                  │\r
              │ 6. 执行检索 / Execute Search              │\r
              │ 7. 结果智能排序 / Smart Ranking           │\r
              └─────────────────────┬───────────────────┘\r
                                    ↓\r
                    ┌──────────────────────────────────┐\r
                    │ 8. 结果评估 / Evaluate Results     │\r
                    └───────────────┬──────────────────┘\r
                          ┌─────────┴─────────┐\r
                          ↓                   ↓\r
              ┌───────────────────┐  ┌───────────────────┐\r
              │ 结果满意 / Good   │  │ 结果需调整 / Needs │\r
              │ → 步骤9          │  │ Adjustment         │\r
              └───────┬───────────┘  └─────────┬─────────┘\r
                      ↓                        ↓\r
              ┌───────────────┐    ┌──────────────────────┐\r
              │ 9. 展示结果   │    │ 9a. 策略调整          │\r
              │ 10. 深入查看  │    │ 过多→窄化 / 过少→宽化 │\r
              │ 11. 全文下载  │    │ 方向偏→换关键词       │\r
              │  (中文直接下) │    └──────────┬───────────┘\r
              │  (外文自动走) │\r
              │  (十级渠道)   │\r
              └───────────────┘\r
                                              ↓\r
                                    ┌──────────────────────┐\r
                                    │ 9b. 二次检索         │\r
                                    │ 回到步骤3-7          │\r
                                    └──────────────────────┘\r
```\r
\r
检索→评估→调整→再检索是核心工作流。首次检索后自动评估结果质量,必要时调整策略重新检索。\r
\r
**Step 11 全文下载(用户触发):** 仅当用户主动请求时才执行全文下载:\r
- **中文期刊**:直接调 API 3 下载 PDF\r
- **外文文献**:走十级多渠道 OA PDF 探测(见 3b 章节),每篇独立并行执行\r
- 下载结果以标记形式追加到结果列表中,并在末尾输出「全文获取报告」汇总表\r
- **未触发下载时**:仅展示元数据,不执行任何下载操作\r
\r
### 关键词智能扩展 / Smart Keyword Expansion\r
\r
每次检索前,先对用户提供的核心关键词进行中英文同义词扩展,以显著提升召回率。\r
\r
**扩展维度 / Expansion Dimensions:**\r
\r
| 维度 | 说明 | 示例 |\r
|------|------|------|\r
| 中文同义词 | 学术语境下的等价表述 | "大语言模型" → "大模型" "LLM" |\r
| 英文同义词 | 英文学术常用表述 | "deep learning" → "deep neural network" |\r
| 中英互译 | 中英文之间的对照词 | "知识图谱" ↔ "knowledge graph" |\r
| 缩写/全称 | 学术缩写及其展开 | "NLP" → "natural language processing" |\r
| 上下位词 | 更泛化或更具体的表述 | "深度学习" → "机器学习"(上位) |\r
\r
**检索表达式构建规则:** 同义词组内用 `OR` 连接,不同概念组间用 `AND` 连接。扩展词数量控制在每概念组 3-8 个。\r
\r
### 结果智能排序 / Smart Result Ranking\r
\r
检索结果需进行二次智能排序,综合考虑以下因素(优先级从高到低):\r
\r
1. **核心收录权重**:SCI/SSCI > EI > CSSCI > 北大核心 > CSCD > 普通期刊\r
2. **内容相关性权重**:题名匹配 > 题名+关键词 > 摘要相关 > 仅关键词命中\r
3. **时效性权重**:近 3 年文献给予适当加分\r
\r
### 结果数量自适应策略 / Adaptive Result Strategy\r
\r
**结果过少(\x3C 5 篇)— 宽化扩展:**\r
\r
1. 上位词扩展:联网搜索更泛化的术语\r
2. 字段放宽:`T=` → `K=` → `U=`\r
3. 相关机构检索:查找领域代表性机构\r
4. 学科分类号检索:使用中图分类号或教育部分类号\r
5. 放宽过滤条件:去掉时间/语言/文献类型限制\r
6. 关键词拆分/重组\r
\r
**结果过多(> 500 条或相关性差)— 窄化收缩:**\r
\r
1. 字段收窄:`U=` → `K=` → `T=`\r
2. 增加 AND 限定\r
3. 核心词精简\r
4. 强化过滤条件(限定文献类型/语言/年份)\r
5. 排序优化\r
\r
### 自然语言转检索表达式示例 / NL-to-Query Examples\r
\r
| 用户需求 | 扩展后的 Rule | FilterRule | 接口 |\r
|---------|------|-----------|------|\r
| 找关于深度学习的论文 | `(U=深度学习 OR U=深度神经网络 OR U=deep learning OR U=DNN)` | - | 接口1+4 |\r
| 清华大学发表的人工智能相关论文 | `(K=人工智能 OR K=AI) AND O=清华大学` | `TY=3` | 接口1 |\r
| 2024年中文期刊上关于大模型的文章 | `(K=大语言模型 OR K=大模型 OR K=LLM)` | `TY=3 AND Y=2024 AND LA=ZH` | 接口1 |\r
| Nature 期刊上的量子计算论文 | `(K=quantum computing) AND P=Nature` | - | 接口4 |\r
| 查找计算机领域的专利 | `(K=计算机 OR K=computer)` | `TY=7` | 接口4 |\r
| 2023-2025年的深度学习综述 | `(T=深度学习 OR T=deep learning) AND (T=综述 OR T=review)` | `Y=2023 OR Y=2024 OR Y=2025` | 接口1+4 |\r
\r
### 高级检索技巧 / Advanced Search Techniques\r
\r
#### 引文追溯策略 / Citation Tracing\r
\r
| 追溯方向 | 操作方式 | 适用场景 |\r
|------|------|------|\r
| **作者追踪** | `A=作者名` | 追踪核心研究者团队全部成果 |\r
| **期刊溯源** | `P=期刊名 AND K=相关主题词` | 锁定高水平期刊中该领域全部论文 |\r
| **机构扩展** | `O=机构名` | 了解机构在相关领域的研究布局 |\r
| **参考文献反向查** | 提取参考文献标题,用 `T=` 逐一检索验证 | 确认引用文献是否在数据库中 |\r
| **引用链追踪** | `L=分类号 OR C=分类号` | 在相同分类号下发现更多相关文献 |\r
\r
#### 分类号体系利用 / Classification-based Search\r
\r
利用中图分类号(`L=`)和教育部学科分类号(`C=`)检索可绕过关键词歧义。常用分类号:`TP18`=人工智能,`TP391.1`=自然语言处理,`O413`=量子论,`0812`=计算机科学与技术。\r
\r
#### 字段选择策略矩阵 / Field Selection Matrix\r
\r
| 字段 | 精度 | 覆盖 | 最佳场景 |\r
|------|------|------|------|\r
| `U=` 全部字段 | 低 | 最高 | 宽泛探索 |\r
| `K=` 关键词 | 中 | 高 | 常规检索(默认) |\r
| `T=` 题名 | 最高 | 低 | 精准匹配、引用确认 |\r
| `A=` 作者 | 高 | 低 | 追踪特定研究者 |\r
| `O=` 机构 | 中 | 中 | 了解机构研究布局 |\r
| `P=` 出版物 | 高 | 中 | 限定高质量期刊 |\r
\r
### 结果展示规范 / Result Display Standards\r
\r
**检索结果列表**以编号列表形式展示,每篇文献包含:序号、核心收录标注、标题、作者、来源出版物、出版日期、摘要(截取前200字)、文献ID。\r
\r
**文献详情**额外展示:DOI、核心收录、原始数据库链接、SmartLib 详情页、基金资助、页码。\r
\r
结果按「结果智能排序」策略排列。展示后主动提示用户:\r
- "输入文献编号可查看详情"\r
- "中文期刊文献支持全文下载"\r
- "如需更多结果,可以说'下一页'"\r
\r
### 检索结果质量判断 / Result Quality Assessment\r
\r
#### 核心收录标注解读\r
\r
| 标注 | 含义 | 权重 |\r
|------|------|------|\r
| `[SCI一区]` | 国际顶级期刊(影响因子前 25%) | 最高 |\r
| `[SCI二区]` | 国际高水平期刊 | 高 |\r
| `[SSCI]` | 社会科学国际核心期刊 | 最高 |\r
| `[EI]` | 工程领域国际核心收录 | 高 |\r
| `[CSSCI]` | 中文社会科学引文索引(南大核心) | 高 |\r
| `[CSCD]` | 中国科学引文数据库 | 中高 |\r
| `[北大核心]` | 北京大学核心期刊目录 | 中 |\r
| `[CCF-A]` | 中国计算机学会 A 类会议/期刊 | 最高 |\r
\r
#### 用户自检清单 / User Quality Checklist\r
\r
在引用或深入阅读文献前,建议用户快速核对:\r
- [ ] **来源**:发表在什么期刊/会议上?是否为核心收录?\r
- [ ] **时效**:出版年份是什么?对当前领域是否足够新?\r
- [ ] **作者**:作者是否是该领域的活跃研究者?\r
- [ ] **相关性**:标题和摘要是否与我的研究问题直接相关?\r
- [ ] **可获取性**:是中文期刊(可下载全文)还是全球文献(仅元数据)?\r
\r
---\r
\r
### 错误处理 / Error Handling\r
\r
错误处理必须给出具体可操作的解决方案。网络波动时自动重试(最多 3 次,指数退避 1s→2s→4s)。\r
\r
#### 错误码处理表 / Error Code Handling\r
\r
| 状态码 | 含义 | 具体处理步骤 |\r
|------|------|------|\r
| **401** | Token 无效或过期 | Gateway 自动管理 Token 刷新, 无需处理。若持续 401,请检查 consume_token 是否有效 |\r
| **403** | 权限不足 | 提示"当前凭证无此接口权限,请确认 API 套餐是否已开通此接口" |\r
| **429** | 请求频率超限 | 等待 5 秒后自动重试 |\r
| **499** | 参数错误 | 检查 Rule 语法(运算符大写、有空格)、FilterRule 字段代码、PageSize 范围 |\r
| **500/502/503** | 服务端错误 | 自动重试 3 次 → 全部失败后提示"SmartLib 服务暂时不可用" |\r
| **网络超时** | 请求无响应 | 自动重试 3 次 → 提示"请检查网络是否可访问 data.smart.vipslib.com" |\r
| **无结果** | API 返回空列表 | 按「结果数量自适应策略」自动提供扩展建议 |\r
| **凭证缺失** | 环境变量未设置 | 自动触发 Pre-flight 注册流程 |\r
\r
---\r
\r
### 常见问题(FAQ)\r
\r
| 问题 | 答案 |\r
|------|------|\r
| **检索不到想要的论文怎么办?** | 1. 去掉过滤条件扩大范围 2. 尝试上位词 3. 用英文关键词在接口4再试 4. 用 `U=` 替代 `T=` |\r
| **全文下载失败怎么办?** | 仅中文期刊支持全文下载。下载 URL 约 10 分钟有效,过期需重新调用。英文文献自动走多渠道下载策略获取 OA 版本。 |\r
| **Token 多久过期?** | Access Token 30 秒,Refresh Token 2 小时。系统自动管理刷新,用户无感知。 |\r
| **英文文献能不能下全文?** | 本技能集成十级多渠道下载策略(ArXiv → Unpaywall → CORE → OpenAlex 等),Gold/Green/Hybrid OA 论文成功率 >85%。付费墙内论文无法获取。 |\r
| **配额耗尽后还能用吗?** | 不能。配额耗尽后 Gateway 返回 429 拒绝所有检索请求,必须先充值恢复配额才能继续使用。 |\r
\r
---\r
\r
### API 调用注意事项 / API Call Notes\r
\r
- **检索结果数据路径**:列表字段为 `Data.List`,解析时先尝试 `List`,回退 `Items`\r
- **Source 字段需详情接口获取**:检索列表中 `Source` 为空数组,原始数据库链接需调用详情接口。Source 数组元素结构为 `{"Source_DbId": "scopusjournal", "Source_DbTitle": "Scopus", "Source_Link": "https://..."}`,字段说明:`Source_DbId`=数据库标识符,`Source_DbTitle`=数据库中文名称,`Source_Link`=原始数据库详情页链接。平台覆盖300+数据库,100篇样本实测平均每篇4.75个链接,覆盖率100%。\r
\r
---\r
\r
## 注意事项 / Notes\r
\r
- 检索策略遵循三级分级体系:默认平衡策略,综述自动切换宽检索,引用自动切换窄检索\r
- 检索→评估→调整→再检索是核心工作流\r
- Access Token 有效期 30 秒,Refresh Token 2 小时,系统自动管理刷新\r
- 全球文献检索(接口4)仅提供元数据,部分无全文\r
- 中文期刊(接口1-3)支持全文下载,是核心优势,应优先推荐\r
- PageSize 建议不超过 100\r
- 检索表达式中的运算符必须大写且两边有空格\r
- 英文关键词建议同时检索接口1和接口4以提高覆盖率\r
- 展示文献详情时,务必从详情接口取 `Source` 字段并展示原始数据库链接(`Source_DbTitle` + `Source_Link`)\r
- 引文追溯是提升检索质量的捷径:从一篇确认的高质量文献出发追踪\r
- 分类号检索(`L=` / `C=`)可绕过关键词歧义\r
\r
---\r
\r
## 版本历史 / Version History\r
\r
| 版本 | 日期 | 核心变更 |\r
|------|------|---------|\r
| v1.0 | 2026-05 | 初始版本:中文期刊检索+下载,基础OAuth流程 |\r
| v1.5 | 2026-05-22 | 新增全球文献检索(API 4/5),双轨数据源 |\r
| v1.6 | 2026-05-25 | 新增检索策略分级体系、迭代工作流、结果数量自适应策略(双向)、高级检索技巧、检索结果质量判断、触发意图扩展 |\r
| v2.0 | 2026-05-28 | 计次规则重构:从"按会话计费"改为"按接口调用次数计费" |\r
| v2.1 | 2026-05-28 | Step C 重写:明确 Per-API-Call 计费,新增计费接口表格、计次示例、不计费操作表格 |\r
| v2.2 | 2026-05-29 | 计费接口精确化为5个(中文检索/全球检索/中文详情/全球详情/全文下载),每次调用计1次,更新计次示例3个 |\r
| v2.3 | 2026-05-29 | 外文文献下载流程增强:自动走完十级渠道(非用户触发)、新增结果标记规范(5种状态标记)、新增渠道执行报告汇总表、工作流 Step 11 细化为自动下载 |\r
| v2.4 | 2026-05-29 | **修正 v2.3 的错误**:下载全文改为「用户主动触发」而非自动执行。恢复 Step 11 为"用户触发"模式,触发关键词列表加入 Skill |\r
| v2.5 | 2026-05-29 | **安全加固 H1**:反攻击保护从文字指令改为 Token 绑定调用链(/consume 签发 HMAC token → /search 验证后代理转发),AI 无法绕过 |\r
| v2.6 | 2026-05-28 | **修正 Source 字段文档**:明确 Source 元素结构为 `{Source_DbId, Source_DbTitle, Source_Link}` 三元组,经100篇英文文献实测验证,覆盖率100%,平均每篇4.75个链接,100篇样本覆盖28个数据库(实际平台覆盖300+数据库) |\r
| v2.7 | 2026-05-28 | **亮点更新**:① 原始来源链接作为核心亮点写入 frontmatter + 核心能力表(300+数据库,100%覆盖率);② 新增 OA 文献免费下载能力声明(十级渠道,不消耗 SmartLib 配额) |\r
| v2.8 | 2026-06-04 | **v36 对齐**:① 配额改为成功调用后扣除(失败不消耗配额);② 新增语义化端点推荐(endpoint + rule 格式);③ `/consume` 行为说明更新(仅签发 token,不预扣配额) |\r
| v2.9 | 2026-06-05 | **Production aligned**: Updated production URL to v38 (version 34), fixed token management description, added production environment info |\r
| v3.0 | 2026-06-06 | **v39 生产部署**:恢复 /register 单步注册(无验证码),修复 v38 用户卡住问题;email_verified 延后至付费时验证 |\r
| v3.1 | 2026-06-06 | **v44 审计对齐**:代码审计确认 trial_total=100(注册赠送100次),套餐配额1000起;与 smartlib-gateway v44 (version 46) 完全对齐 |\r
Usage Guidance
Install only if you are comfortable with the skill contacting SmartLib services, storing your email locally, creating or using an external account/quota flow, and downloading files to disk. Do not use the CDP/browser-automation fallback to bypass publisher restrictions; keep retrieval to open-access or otherwise authorized sources and review output paths before batch downloads.
Capability Tags
requires-oauth-tokenrequires-sensitive-credentials
Capability Assessment
Purpose & Capability
The core purpose of searching and downloading scholarly papers is coherent, but the documented escalation to browser automation/CDP and anti-hotlinking bypass goes beyond ordinary authorized literature retrieval.
Instruction Scope
Activation appears broad, and the runtime instructions do not consistently require explicit user consent before registration, quota use, local persistence, batch downloads, subprocess fallback, or protected-content retrieval attempts.
Install Mechanism
No supplied artifact evidence shows malicious install-time behavior, obfuscated setup, or hidden package execution; VirusTotal telemetry is clean.
Credentials
The skill uses external network services, local file writes, subprocess curl fallback, browser automation, and user email handling; these are high-impact enough to need clearer scoping and consent than the artifacts appear to provide.
Persistence & Privilege
The artifacts indicate persistent local config storage for email and persistent downloaded documents, with unclear deletion, overwrite, quota, and rollback controls.
How to Use
  1. Make sure OpenClaw is installed (local or Docker)
  2. Run the install command in chat: /install smartlib-literature-search
  3. After installation, invoke the skill by name or use /smartlib-literature-search
  4. Provide required inputs per the skill's parameter spec and get structured output
Version History
v1.0.0
Smartlib-literature-search v1.0.0 - Launch of academic literature search skill, supporting both Chinese and global sources. - Covers 80 million authorized Chinese journal articles and 1.22 billion global literature records (journals, patents, conferences, theses, standards). - Features three-tier search strategies, keyword search, citation tracing, classification search, and full-text download (direct for Chinese, OA detection for English). - Fully automated credential registration, 100 free quota/month, pay-per-API-call across 5 interfaces. - In-dialog quota tracking, automatic pause and recharge guidance when quota is low or depleted. - Triggers on a wide range of academic search intents in both Chinese and English; suitable for literature review, citation, and research support.
Metadata
Slug smartlib-literature-search
Version 1.0.0
License MIT-0
All-time Installs 1
Active Installs 1
Total Versions 1
Frequently Asked Questions

What is Smartlib Literature Search Clawhub?

中外文学术文献检索服务。覆盖8000万篇授权中文期刊全文+12.28亿条全球文献元数据(含期刊7.19亿、专利2.15亿、会议论文7155万、学位论文2473万、标准268万等)。 内置三级检索策略(宽检索高查全/窄检索高查准/平衡策略),支持关键词检索、文献详情查看、全文下载(中文直接下载+外文十级渠道自动探测... It is an AI Agent Skill for Claude Code / OpenClaw, with 41 downloads so far.

How do I install Smartlib Literature Search Clawhub?

Run "/install smartlib-literature-search" in the OpenClaw or Claude Code chat to install it in one step — no extra setup required.

Is Smartlib Literature Search Clawhub free?

Yes, Smartlib Literature Search Clawhub is completely free, licensed under MIT-0. You can download, install and use it at no cost.

Which platforms does Smartlib Literature Search Clawhub support?

Smartlib Literature Search Clawhub is cross-platform and runs anywhere OpenClaw / Claude Code is available (cross-platform).

Who created Smartlib Literature Search Clawhub?

It is built and maintained by J-levee (@j-levee); the current version is v1.0.0.

💬 Comments