← 返回 Skills 市场
liweixiaogui10

Scisurvey

作者 liweixiaogui10 · GitHub ↗ · v1.0.0 · MIT-0
cross-platform ✓ 安全检测通过
40
总下载
0
收藏
0
当前安装
1
版本数
在 OpenClaw 中安装
/install scisurvey
功能描述
SciSurvey — Systematic Survey × Sciverse。全自动系统性学术综述生成器:自动识别领域 → 选择 Survey/Review 类型 → 领域自适应关键词 → meta-catalog 确认 → 多策略并行检索(语义 + 结构化 meta-search + 引用链追踪)→ 质量过...
使用说明 (SKILL.md)

SciSurvey — Systematic Survey × Sciverse

SciSurvey = Sciverse 专属深度检索 × Systematic Survey 方法论

"Survey 是逛超市把所有商品分类记下来;Review 是测评博主挑三款深度试用告诉你哪个好。SciSurvey 两者皆能,且都有学术严谨性保障。"

快速参数(执行前声明)

在启动综述前,确认以下参数(用户不指定则按领域自动推断):

参数 选项 自动推断规则 说明
--type systematic-survey / systematic-review / scoping-review / narrative-review CS/AI/工程 → systematic-survey;医学/心理/社科 → systematic-review;新兴/交叉领域 → scoping-review 综述类型,决定结构和关键词策略
--format markdown / latex / docx / pdf markdown 最终输出格式
--citation-style gbt / apa / ieee / vancouver / chicago / mla CS → ieee;医学 → vancouver;社科 → apa;中文 → gbt 参考文献格式

用法示例:

  • 大语言模型幻觉检测综述 → 自动推断:--type systematic-survey --citation-style ieee
  • 抑郁症认知行为疗法综述 --type systematic-review --citation-style apa --format docx
  • 元宇宙应用场景调研 --type scoping-review

Survey vs Review:类型选择指南

类型 核心动作 适用领域 典型标题 SciSurvey 输出结构
Systematic Survey 普查式分类 + 横向对比 CS / AI / 工程 / 跨领域方法论 "A Survey of X" / "X: A Comprehensive Survey" Taxonomy → 方法分类详解 → 比较表
Systematic Review 批判性评价 + 深度判断 医学 / 心理学 / 教育 / 社会科学 "A Systematic Review of X" / "X: A Critical Review" PRISMA → 历史脉络 → 核心争论 → 批判分析
Scoping Review 摸清领域边界,宽松纳入 新兴领域 / 跨学科 "A Scoping Review of X" 领域地图 → 研究分布 → 空白识别
Narrative Review 传统叙述,无严格筛选 经验分享 / 教学 "X: An Overview" 主题叙述 → 关键论点

Survey vs Review 核心判断:

  • 问"有哪些方法?各自优缺点?" → systematic-survey
  • 问"这领域到哪了?接下来往哪走?" → systematic-review
  • 问"这领域边界在哪?有哪些子方向?" → scoping-review

概述

本 skill(SciSurvey)利用 Sciverse MCP 服务器,根据用户主题自动识别学科领域和综述类型,采用领域自适应关键词策略进行系统性文献检索,输出结构化、可投稿级别的学术综述,支持多格式导出和六种国际标准引用格式。

可用 Sciverse 工具

工具 用途
mcp__sciverse__list_catalog meta-catalog:获取所有可过滤/排序字段的完整 schema,含枚举取值样本。用于确认字段名、操作符,避免后续检索参数错误
mcp__sciverse__search_papers meta-search:结构化精确检索,支持 filters_advanced 任意字段过滤(引用量、语言、FWCI、OA 状态等),返回丰富元数据
mcp__sciverse__semantic_search agentic-search:自然语言语义检索,返回相关文献片段(RAG 模式),适合宽泛主题发现
mcp__sciverse__read_content content:按字节范围读取文献全文(最大 16384 字节/次),结合 next_offset / more 字段分段读完
mcp__sciverse__get_resource 读取 read_content Markdown 中引用的图片/表格(![alt](file_name) 占位符)

关键元数据字段速查(search_papers 默认返回)

字段 类型 用途
doc_id String 唯一标识符,用于去重和 read_content
title / abstract String 标题/摘要,可 BM25 全文搜索
language String 资源语言(zh/en 等),filterable,用于国内/国际分层
author List[string] 作者列表,filterable
publication_published_year Integer 发表年份,filterable + sortable
publication_venue_name String 期刊/会议名,filterable
publication_venue_type String 载体类型(journal/conference),filterable
publication_venue_biblio_volume/issue/pages String 卷/期/页码(非默认,需 filters_advanced 请求)
publication_published_country List[string] 发表国家,filterable,用于国内文献识别
keywords List[string] 关键词列表,filterable + searchable
citation_count Integer 被引次数,filterable + sortable
influential_citation_count Integer 高影响力被引次数,filterable + sortable
fwci Float 领域加权引用影响力,filterable + sortable
citation_normalized_percentile Object 同类型/年份/领域被引百分位,质量评估核心指标
cited_by_percentile_year Object 按年份细分的被引百分位(min/max,越高越优秀)
references List[string] 本文引用的文献 doc_id 列表,用于引用链追踪
related_works List[string] 本文相关工作 doc_id 列表,用于相关文献扩展
access_is_oa / access_oa_url String 开放获取状态及 URL,指导全文读取优先级
doi String DOI,用于参考文献格式化

执行流程(8 阶段,全自动)


阶段 0 — Meta-Catalog 确认(每次综述开始前必执行)

目标: 确认字段 schema,避免后续检索参数错误。

mcp__sciverse__list_catalog(include_sample_values=true)

从返回结果中确认:

  • language 字段的实际枚举值(如 zhenchineseenglish
  • publication_venue_type 的枚举值
  • access_oa_status 的枚举值
  • metadata_type 的枚举值(paper / ebook)

若 list_catalog 返回与预期不同的枚举值,必须用实际值替换后续检索中的过滤条件。


阶段 1 — 领域识别、类型推断与检索策略规划

目标: 识别学科领域,推断综述类型,构建领域自适应的中英双语检索关键词矩阵。

1.1 学科领域识别

根据用户输入的主题关键词,识别所属学科领域(可多选):

领域代码 学科范围 典型主题词
CS/AI 计算机科学、人工智能、机器学习、NLP、CV neural network / LLM / algorithm / model / dataset
BioMed 医学、生物学、临床研究、药学、公共卫生 clinical trial / patient / treatment / disease / therapy
PsychSoc 心理学、社会学、教育学、行为科学 behavior / cognitive / intervention / outcome / scale
EngrPhys 工程学、物理学、材料科学、化学 design / experiment / simulation / material / performance
EconMgmt 经济学、管理学、金融 market / firm / policy / regression / panel data
HumLang 人文、历史、语言学、文学 discourse / narrative / cultural / historical / text
Interdis 跨学科、新兴领域 无固定词汇,综合多领域特征

1.2 综述类型自动推断

基于领域代码 + 用户意图,推断 --type

领域 = CS/AI / EngrPhys  →  --type systematic-survey  (方法多,需分类对比)
领域 = BioMed / PsychSoc →  --type systematic-review  (有RCT/干预,需PRISMA)
领域 = Interdis / 新兴   →  --type scoping-review     (先摸清边界)
领域 = EconMgmt / HumLang →  --type narrative-review  (叙述为主)

用户明确说"全面调研/有哪些方法"  → systematic-survey
用户明确说"深度分析/批判性评价"  → systematic-review
用户明确说"领域地图/摸清边界"    → scoping-review

推断结果须向用户确认,用户可覆盖。

1.3 领域自适应关键词矩阵

核心原则: 不同领域习惯用不同词描述综述文献,检索时必须匹配领域惯例。

CS/AI 领域(systematic-survey 主导)
英文综合词(优先 survey):
  "[topic] survey"
  "[topic] comprehensive survey"
  "[topic] taxonomy"
  "[topic] overview"
  "[topic] benchmark"
  "survey of [topic]"

英文语义检索组:
  "[core term] methods approaches techniques"
  "[core term] deep learning neural network"
  "[core term] evaluation benchmark dataset"
  "[core term] recent advances 2023 2024 2025"

中文检索组:
  "[核心词]综述"
  "[核心词]方法分类"
  "[核心词]进展"

典型期刊/会议关键词补充:
  NeurIPS / ICLR / ICML / ACL / EMNLP / CVPR / ICCV / ACM Computing Surveys / IEEE TPAMI
医学/生物(systematic-review 主导)
英文综合词(优先 review + PRISMA 词汇):
  "[topic] systematic review"
  "[topic] meta-analysis"
  "[topic] randomized controlled trial"
  "[topic] clinical trial"
  "[topic] evidence-based"
  "[topic] Cochrane review"

英文语义检索组:
  "[condition] treatment intervention outcomes"
  "[condition] efficacy safety adverse effects"
  "[condition] epidemiology prevalence incidence"
  "PRISMA [topic] inclusion exclusion criteria"

中文检索组:
  "[核心词]系统综述"
  "[核心词]荟萃分析"
  "[核心词]临床研究"
  "[核心词]随机对照试验"

典型期刊关键词:
  Cochrane / NEJM / Lancet / BMJ / JAMA / PubMed / Clinical Trial
心理学/社会科学(systematic-review 主导)
英文综合词:
  "[topic] systematic review"
  "[topic] meta-analysis"
  "[topic] critical review"
  "[topic] scoping review"
  "[topic] literature review"

英文语义检索组:
  "[construct] measurement scale validity reliability"
  "[intervention] effect size Cohen's d"
  "[topic] qualitative quantitative mixed methods"
  "[topic] longitudinal cross-sectional"

中文检索组:
  "[核心词]系统综述"
  "[核心词]实证研究"
  "[核心词]量表测量"

典型期刊关键词:
  Psychological Bulletin / Psychological Review / Annual Review of Psychology
工程/物理(systematic-survey 主导)
英文综合词:
  "[topic] review"
  "[topic] state of the art"
  "[topic] recent progress"
  "[topic] advances"
  "[topic] comprehensive review"

英文语义检索组:
  "[topic] performance comparison experimental"
  "[topic] fabrication synthesis method"
  "[topic] simulation modeling"
  "[topic] application industrial"
经济/管理(narrative-review / scoping-review
英文综合词:
  "[topic] literature review"
  "[topic] research agenda"
  "[topic] bibliometric analysis"
  "[topic] systematic literature review"

英文语义检索组:
  "[topic] empirical evidence panel data"
  "[topic] theory framework model"
  "[topic] institutional policy"
人文/语言学(narrative-review
英文综合词:
  "[topic] review"
  "[topic] overview"
  "[topic] critical perspective"
  "[topic] discourse analysis"

英文语义检索组:
  "[topic] corpus analysis text"
  "[topic] historical development evolution"
  "[topic] theoretical framework"

1.4 构建本次综述的实际关键词矩阵

结合 1.3 中对应领域的词组 + 用户主题,生成:

中文语义检索组(3-5 组,根据领域选词):
  [核心词], [核心词+领域惯用综述词], [核心词+方法/干预/模型], [核心词+评测/效果], [核心词+挑战/展望]

英文语义检索组(4-6 组):
  [core term + 领域惯用综述词(survey/review/meta-analysis)]
  [core term + method/approach/technique]
  [core term + evaluation/benchmark/experiment]
  [core term + application/clinical/industrial]
  [core term + recent advances + 近2年年份]

meta-search BM25 关键词(精简,1-3 词):
  [最小化核心词组,不加修饰词]
  1. 规划检索轮次(见阶段 2 详述)

阶段 2 — 多策略并行文献检索

目标: 通过语义检索 + meta-search 结构化检索 + 引用链追踪三路并行,覆盖 80+ 篇候选文献。

执行原则: 不同轮次之间尽量并行(在同一 response 中多次调用),节省时间。


2.1 语义检索(英文,agentic-search 路线)

对每组英文关键词,调用:

mcp__sciverse__semantic_search(
  query="\x3C英文关键词组>",
  mode="quality",    # LLM 改写 + 混合检索,最高质量
  top_k=20
)

至少执行 4 组不同角度的英文语义检索(主题/方法/应用/评测各一组)。

返回字段重点记录:doc_idtitlechunk(文摘片段)、score(相关性得分)、offset(用于后续 read_content 定位)。


2.2 语义检索(中文,agentic-search 路线)

mcp__sciverse__semantic_search(
  query="\x3C中文关键词组>",
  mode="quality",
  top_k=15
)

至少执行 3 组中文语义检索。


2.3 结构化 Meta-Search(search_papers 路线)

⚠️ 关键约束:querysort_by_year 互斥 Sciverse 后端不允许 BM25 全文检索(query 参数)与显式年份排序同时使用。 规则:只要传了 querysort_by_year 必须设为 "none",否则返回 INVALID_REQUEST 若需要按年排序,删除 query 参数,改用 filters_advanced 做内容过滤(如 title CONTAINS)。

使用 filters_advanced 覆盖下列 6 类精确检索,每类都能发现语义检索遗漏的文献:

① 高引用量奠基性文献(landmark papers)

mcp__sciverse__search_papers(
  query="\x3C核心英文关键词>",
  year_from=2015,
  sort_by_year="none",          # 不按年排序,让 BM25 相关性主导
  filters_advanced=[
    {"field": "citation_count", "operator": "FILTER_OP_GTE", "value": 200},
    {"field": "metadata_type", "operator": "FILTER_OP_EQ", "value": "paper"}
  ],
  page_size=30
)

② 高 FWCI 高影响力文献(跨领域质量保障)

mcp__sciverse__search_papers(
  query="\x3C核心英文关键词>",
  year_from=2018,
  sort_by_year="none",          # 不按年排序,让 BM25 相关性主导(query + sort_by_year="desc" 会触发 INVALID_REQUEST)
  filters_advanced=[
    {"field": "fwci", "operator": "FILTER_OP_GTE", "value": 2.0},
    {"field": "influential_citation_count", "operator": "FILTER_OP_GTE", "value": 1}
  ],
  page_size=20
)

③ 国内中文文献(language 过滤)

mcp__sciverse__search_papers(
  query="\x3C核心关键词(可中英文)>",
  year_from=2018,
  sort_by_year="none",          # 不按年排序,让 BM25 相关性主导
  filters_advanced=[
    {"field": "language", "operator": "FILTER_OP_IN", "value": ["zh", "chinese"]}
  ],
  page_size=30
)

若中文文献不足,补充用 publication_published_country CONTAINS "China" 过滤

④ 中国机构英文发表文献(补充国内研究)

mcp__sciverse__search_papers(
  query="\x3C核心英文关键词>",
  year_from=2019,
  sort_by_year="none",          # 不按年排序,让 BM25 相关性主导
  filters_advanced=[
    {"field": "publication_published_country", "operator": "FILTER_OP_CONTAINS", "value": "China"},
    {"field": "language", "operator": "FILTER_OP_EQ", "value": "en"}
  ],
  page_size=20
)

⑤ 最新前沿文献(近 2 年)

mcp__sciverse__search_papers(
  query="\x3C核心关键词>",
  year_from=\x3Ccurrent_year - 2>,
  sort_by_year="none",          # 不按年排序,让 BM25 相关性主导
  filters_advanced=[
    {"field": "citation_count", "operator": "FILTER_OP_GTE", "value": 3}
  ],
  page_size=25
)

⑥ 开放获取文献(优先可读全文)

mcp__sciverse__search_papers(
  query="\x3C核心英文关键词>",
  year_from=2020,
  sort_by_year="none",          # 不按年排序,让 BM25 相关性主导
  filters_advanced=[
    {"field": "access_is_oa", "operator": "FILTER_OP_EQ", "value": "true"},
    {"field": "citation_count", "operator": "FILTER_OP_GTE", "value": 20}
  ],
  page_size=20
)

2.4 引用链追踪(citation graph expansion)

目标: 从高质量文献的 referencesrelated_works 字段出发,发现关键词检索遗漏的奠基性文献。

步骤:

  1. 从阶段 2.1-2.3 的结果中,选取 citation_count 最高的 Top-10 文献
  2. 提取它们的 references 列表(doc_id 数组),合并去重,统计每个 doc_id 出现频次
  3. 出现频次 ≥ 3 的 doc_id 为高度被引用的奠基论文,通过 search_papers 获取其元数据:
mcp__sciverse__search_papers(
  filters_advanced=[
    {"field": "doc_id", "operator": "FILTER_OP_IN", "value": ["\x3Cdoc_id_1>", "\x3Cdoc_id_2>", ...]}
  ],
  page_size=20
)
  1. 同理处理 related_works 字段,扩展相关文献图谱

说明: 引用链追踪是发现综述领域奠基性论文(通常年代较早、引用极高)的最可靠方法,弥补关键词检索对经典文献的系统性遗漏。


2.5 记录检索过程(PRISMA 方法学)

维护内部检索记录表:

检索轮次 策略 关键词/过滤条件 命中数 纳入候选数
2.1-EN-1 语义 ...
2.1-EN-2 语义 ...
2.3-① meta-search 高引 citation_count≥200
2.4 引用链追踪 Top-10 references

阶段 3 — 质量过滤、去重与分类

目标: 从 80+ 候选文献中筛选出 40-60 篇高质量、无重复文献,并正确分层为国内/国际。

3.1 去重(按 doc_id)

  • doc_id 为主键去重;重复文献保留元数据最完整的记录
  • 合并同文献不同检索路径的信息(如 semantic_search 的 chunk 片段 + search_papers 的完整元数据)

3.2 质量评分

每篇文献综合以下指标计算质量得分,用于优先级排序:

指标 说明 权重
citation_count 绝对被引量,按年龄调整
fwci 领域加权影响力(>1.0 为高于均值,>2.0 为顶尖)
influential_citation_count 高影响力被引(>0 为里程碑论文)
cited_by_percentile_year.max 同年文献中的百分位(>90 为顶尖)
citation_normalized_percentile 同类型/年份/领域被引百分位
access_is_oa 开放获取(可读全文加分)

年龄调整引用量阈值(最低纳入线,可动态降低保证覆盖度):

发表距今 最低 citation_count 最低 fwci
0-1 年 ≥ 2(允许最新成果) 任意
1-2 年 ≥ 8 ≥ 0.5
2-5 年 ≥ 30 ≥ 1.0
5-10 年 ≥ 100 ≥ 1.2
10 年以上 ≥ 300 ≥ 1.5

若高阈值后文献总量 \x3C 20 篇,适当降低阈值并在综述方法节说明。

3.3 国内/国际分类(三重判断逻辑)

按优先级依次判断:

  1. language 字段 = zh/chinese → 国内文献
  2. publication_published_country 字段 包含 China/People's Republic of China → 国内文献(含中国机构英文发表)
  3. author 字段中存在中文姓名 或 所属机构含中国机构关键词(北京大学/清华/中科院/Peking/Tsinghua/CAS 等) → 国内文献

满足任一条件即归为国内文献;三者均不满足则为国际文献。

目标分布:

  • 国内文献:15-25 篇
  • 国际文献:25-40 篇
  • 总计:40-60 篇

阶段 4 — 深度元数据提取与全文读取

目标: 充分利用默认返回的丰富元数据,并对高优先级文献进行全文精读。

4.1 元数据深度提取

对所有纳入文献,从 search_papers 返回结果中系统提取:

【元数据卡片】
doc_id:
标题(title):
作者(author,前 3 位):
发表年份(publication_published_year):
期刊/会议(publication_venue_name):
载体类型(publication_venue_type):
语言(language):
发表国家(publication_published_country):
关键词(keywords):
DOI(doi):
被引量(citation_count):
高影响被引(influential_citation_count):
FWCI(fwci):
同年被引百分位(cited_by_percentile_year.max):
开放获取(access_is_oa / access_oa_url):
引用文献数(reference_count):
本文引用列表(references,前 10 个 doc_id):   ← 用于引用链追踪
相关工作列表(related_works,前 10 个 doc_id):  ← 用于相关文献扩展

4.2 选取精读文献(全文 read_content)

精读优先级:

  1. influential_citation_count > 0 的所有文献(里程碑论文,必读)
  2. fwci > 3.0 的顶尖影响力文献
  3. cited_by_percentile_year.max 降序,国内 Top-12、国际 Top-18

OA 优先策略:

  • 优先选取 access_is_oa = "true" 的文献进行全文读取(可获取完整正文)
  • 非 OA 文献通过 read_content 尝试读取(可能仅有摘要/已收录内容)

doc_id 格式与全文可读性:

  • 哈希格式 doc_id(如 c5568f8a703c...):来自 semantic_search 返回,Sciverse 已建立全文索引,read_content 成功率高 → 优先精读
  • DOI 格式 doc_id(如 paper:10.1007/s10639-024-12949-9):来自 search_papers 返回,全文爬取覆盖率不完整,read_content 可能返回 502 → 降低优先级
  • 精读候选列表中,哈希格式 doc_id 排在 DOI 格式 doc_id 之前

retrieve_content_failed(502)快速跳过规则:

  • read_content 返回 502 → 立即标记该文献为"仅摘要",不重试,继续处理下一篇
  • 仅摘要文献的处理见 4.4 精读卡片顶部注释要求:写作时不引用任何具体数字

4.3 全文读取策略

# 第一段:最大字节读取(含摘要、引言、方法核心段落)
mcp__sciverse__read_content(
  doc_id="\x3Cdoc_id>",
  offset=0,
  limit=16384   # 使用最大限制,获取尽可能多的内容
)

# 若 more=true,继续读取关键章节(结论/实验/讨论)
mcp__sciverse__read_content(
  doc_id="\x3Cdoc_id>",
  offset=\x3Cnext_offset>,  # 使用上一次返回的 next_offset
  limit=16384
)

# 若 more 仍为 true,读取最后章节(结论/参考文献附近)
mcp__sciverse__read_content(
  doc_id="\x3Cdoc_id>",
  offset=\x3Cnext_offset>,
  limit=8192
)

对于精读文献,至少读取前两段(前 32768 字节),确保覆盖摘要、引言、主要方法章节。

4.4 全文信息提取模板

【文献精读卡片】
doc_id:                              ← 必填,用于后续证据映射
标题(来自 title 字段,原文):
作者(来自 author 字段,前 3 位):    ← 只写元数据实际返回的名字,不推测
通讯作者机构(来自全文或摘要):
发表年/期刊:
卷/期/页码(来自 publication_venue_biblio_* 字段或全文):
citation_count / fwci / influential_citation_count:
cited_by_percentile_year.max:
DOI(来自 doi 字段,原文):
---
研究问题:(全文中提取的原始问题描述,加引号标注原文出处段落)
核心方法名称:(从全文确认的正式方法名,注意区分缩写与全称)
核心方法描述:(2-3句,来自方法章节,非摘要推测)
主要实验结果(含5要素):
  指标名称:
  数据集名称:
  对比基线(baseline model):
  本方法结果:
  提升幅度:
  → 全文原文位置(offset 范围):
数据集/基准(名称 + 规模):
作者自述局限性(原文引用):
模型访问类型:□ 黑盒(无内部访问)□ 白盒(需 logits/hidden states)□ 灰盒(仅需解码)
训练要求:□ 无需训练 □ 推理时调整 □ 需微调 □ 需完整训练
计算成本估计(作者报告或可推断):
与综述主题的关联维度:

严格约束: 精读卡片中的所有字段必须来自 read_content 实际返回的文本,或元数据字段的原文。禁止从文献标题/摘要推测方法细节、实验数据、作者机构。若全文不可读(read_content 返回空或极少),在卡片顶部注明"仅摘要",并将该文献在综述正文中的描述严格限制在摘要范围内,不引用任何数字


阶段 4.5 — 引用证据映射(Citation Evidence Mapping)⚠️ 必执行

目标: 为每一条将写入综述正文的 claim(特别是:方法名、作者归属、实验数字)建立显式的文献证据记录,阻断"合理推测"式写作。

4.5.1 建立证据映射表

在开始写作(阶段 6)之前,逐篇构建证据映射:

【证据映射表】(每条正文 claim 一行)

| 拟写的 claim(正文中要说的话) | 对应 doc_id | 证据来源 | 全文原文节选(20-50字) | 证据可信度 |
|-------------------------------|------------|---------|------------------------|-----------|
| "X 等提出 Y 方法,在 Z 数据集上提升了 N%" | doc_xxx | read_content offset=A | "...原文..." | 高/中/低 |
| "A 方法适用于黑盒模型" | doc_yyy | 摘要/方法章节 | "...原文..." | 高/中/低 |

证据可信度判定规则:

  • :claim 在全文方法章节或实验章节有直接文本支撑(read_content 读到)
  • :claim 仅有摘要支撑,或需要轻微解释才能对应
  • :claim 来自标题/关键词推测,无全文证据

写作规则: 证据可信度为"低"的 claim 不得写入正文;为"中"的 claim 须降级为"据摘要描述"并注明不确定性,不得引用具体数字

4.5.2 方法归属验证清单

在综述中首次提及某方法时,必须完成以下核查:

□ 方法名(缩写/全称)与 read_content 中一致?
□ 作者姓名与 author 字段一致(不是从标题/其他文献推测的)?
□ 该方法确实在这篇论文中"提出",而非只是被引用?
□ 若引用实验数字(N%),已确认:指标名 / 数据集名 / baseline 模型名 / 原文段落?
□ 若描述适用场景(黑盒/白盒/成本),有全文依据或有合理推断说明?

任一项未通过 → 暂停写作,补充 read_content → 重新填写精读卡片后再写。

4.5.3 数字引用五要素规则

综述正文中出现任何百分比、分数、排名等数字时,必须同时标注五要素(可内嵌于括号中):

格式:[数字](指标:[M];数据集:[D];对比基线:[B];来源:[参考文献号])

例:

  • ✅ "DoLa 在 TruthfulQA MC1 子集上达到 57.2%(指标:准确率;数据集:TruthfulQA;对比基线:LLaMA-7B 标准解码;来源:[11])"
  • ❌ "DoLa 将 LLaMA 的准确率提升了约 12%"(缺指标、数据集、基线,不可写入)

若五要素不完整,删除该数字,改为定性描述("显著提升"、"作者报告有所改善")并注明原因。


阶段 5 — 主题聚类与综合分析

目标: 以主题而非文献为轴心,整合元数据统计与内容分析,识别国内外差异,并构建技术演进图谱。

5.0 技术演进图谱构建(必执行,放入第 3 节)

目标: 为初学者提供该领域从萌芽到当前的全局视野,以时间轴可视化呈现关键转折点。

构建步骤:

  1. 从所有纳入文献的元数据和全文中,提取以下类型的里程碑事件

    • 领域奠基/提出核心概念的论文(influential_citation_count > 0 优先)
    • 代表性方法/模型首次提出
    • 重要基准数据集发布
    • 标志性综述/调研出版
    • 近 2 年的突破性进展(高 fwci)
  2. publication_published_year 排列,每年选取 1-3 个最关键事件,控制总节点数在 10-20 个

  3. Mermaid timeline 语法生成图谱(Markdown 原生支持,无需额外工具):

timeline
    title [领域名称]技术演进([起始年]—[结束年])
    [年份] : [里程碑事件 1]
            : [里程碑事件 2(可选)]
    [年份] : [里程碑事件]
    ...
    [当前年] : [最新进展 1]
              : [最新进展 2]
  1. 每个里程碑节点必须对应纳入文献列表中的具体文献(在节点描述后括注参考文献编号),若对应文献不在列表中则不列入图谱。

  2. 在图谱下方附"关键转折点注释表":

年份 事件 意义 参考文献
20XX [方法/概念名] [1-2句话说明为何是转折点] [n]

演进图谱放置位置:

  • systematic-survey → 放在第 3 节"技术演进图谱"
  • systematic-review → 放在第 2 节"领域发展脉络"开头
  • scoping-review → 放在第 3 节"领域全景图"中

5.1 元数据统计分析(量化视角)

在聚类前,先从元数据角度生成量化描述:

  • 年份分布:按 publication_published_year 统计,绘制趋势(是否加速增长?)
  • 期刊/会议分布:按 publication_venue_name 统计 Top-10 发表载体
  • 语言/国家分布:量化国内(中文 + 中国机构英文)vs. 国际比例
  • 高影响文献influential_citation_count > 0 的文献列表及所属主题
  • 关键词共现:从所有文献的 keywords 字段提取高频词(出现 ≥ 3 次的词),作为主题聚类的初始依据

5.2 主题聚类(3-7 个主题)

基于关键词共现分析 + 全文内容,归纳研究主题:

典型维度(根据实际研究领域调整):

  • 理论/分类框架:定义、分类、成因分析
  • 方法/技术路线:核心算法、模型架构、技术创新
  • 评测/基准体系:数据集构建、评估指标、对比实验
  • 应用/垂直场景:特定领域落地
  • 新兴前沿:近 2 年高 fwci 文献集中的新方向

5.3 国内外对比矩阵

维度 国内研究特点 国际研究特点 差距/互补
研究重点
方法论
数据资源
应用场景
发表载体
被引影响(平均 fwci)

5.4 研究空白识别

基于以下信号识别:

  • 高被引文献的"未来工作"段落(全文提取)
  • references 交叉分析:多篇文献共同引用但本次检索未纳入的论文(补充检索)
  • 关键词矩阵中无文献覆盖的子方向

阶段 6 — 综述写作

目标: 根据 --type 参数选择对应结构模板,生成完整、规范的学术综述。

6.0 按 --type 选择输出结构

--type systematic-survey  → 使用 6.1A 结构(分类-方法-对比表)
--type systematic-review  → 使用 6.1B 结构(PRISMA-争论-批判分析)
--type scoping-review     → 使用 6.1C 结构(边界-分布-空白图)
--type narrative-review   → 使用 6.1A 简化版(无严格 PRISMA)

6.1A Systematic Survey 结构(CS/AI/工程,普查式分类)

回答"有哪些方法?各自优缺点是什么?" 标志:技术演进图谱 + 分类体系(Taxonomy)+ 横向比较表 读者视角:面向进入该领域的科研人员,让他们快速建立全局认知

# [研究方向]综述:[副标题]

## 摘要(400-600字:背景、核心发现、分类框架、主要结论、趋势展望)
**关键词:**

## 1. 引言
### 1.1 研究背景与重要性
(回答"这个领域为什么重要?解决什么问题?"——让初学者立刻理解价值)
### 1.2 本综述的范围与结构

## 2. 领域概念框架
### 2.1 核心概念与定义
(给出该领域必须掌握的 3-5 个核心概念,每个配简洁定义和关键文献)
### 2.2 分类体系(Taxonomy)
(用 Mermaid 图或缩进列表呈现方法分类框架;引用高被引综述建立框架)

```mermaid
graph TD
    A[[领域名称]] --> B[一级分类A]
    A --> C[一级分类B]
    A --> D[一级分类C]
    B --> B1[子类 A1]
    B --> B2[子类 A2]
    C --> C1[子类 B1]
    C --> C2[子类 B2]

3. 技术演进图谱

(从 Phase 5.0 输出的 Mermaid timeline + 关键转折点注释表) (让读者在 5 分钟内看懂该领域从哪里来、到了哪里、往哪里去)

4. [类别A]:[最重要的子方向]

(面向读者:先用 1-2 段概述该类别解决什么问题、核心思路是什么)

4.1 代表性方法

(国内外代表性工作混排,按方法逻辑而非国籍分组;每种方法说明:原理/适用场景/优缺点)

4.2 本类别横向比较

| 方法 | 提出者/年 | 模型访问 | 训练要求 | 适用场景 | 核心优势 | 主要局限 | 代表结果 |

5. [类别B]:...

(同 4 节结构)

6. [类别C]:...

7. 全局对比分析

7.1 跨类别方法横向比较矩阵

(所有方法按关键维度对比,便于读者选型)

7.2 国内外研究格局对比

| 维度 | 国内研究特点 | 国际研究特点 | 互补机会 |

8. 研究趋势与前沿方向

(基于近 2 年高 fwci 文献,提炼 3-5 个趋势;每条趋势附具体文献支撑)

9. 开放挑战与未来展望

(未解决的核心问题 + 建议研究方向,3-5 点)

10. 结论

参考文献


附录 A:文献检索方法

(见 6.1 公共附录模板)

附录 B:文献统计摘要与质量自评

(见 Phase 8.4 模板)


---

#### 6.1B Systematic Review 结构(医学/心理/社科,批判性评价)

> 回答"**这个领域到哪了?哪些结论可信?接下来往哪走?**"
> 标志:领域发展脉络(含演进图谱)+ 核心争论 + 批判性分析
> 读者视角:**面向科研人员**,优先呈现发现与判断,检索方法移至附录

[研究方向]系统综述:[副标题]

摘要(结构化:背景 / 研究问题 / 主要发现 / 结论与建议,各 60-100 字)

关键词:

1. 引言

1.1 研究背景与重要性

(回答"这个问题为什么值得系统综述?当前实践痛点是什么?")

1.2 研究问题(PICO 框架)

  • P(研究对象):
  • I(干预/暴露):
  • C(对照条件):
  • O(结局指标):

1.3 本综述的范围与局限说明

2. 领域发展脉络

(让读者先建立历史感,再进入具体证据)

2.1 技术/理论演进图谱

(Phase 5.0 输出的 Mermaid timeline:奠基理论 → 方法突破 → 当前主流范式)

2.2 各阶段特征概述

(每个时期 1-2 段,说明核心转变是什么、哪些研究是里程碑)

3. [主题A] — 研究证据综合

(先总述该主题研究现状,再按证据质量和结论一致性组织)

3.1 主要发现

3.2 证据强度小结(表格)

| 研究 | 设计类型 | 样本量 | 核心结论 | 偏倚风险 |

4. [主题B] — 研究证据综合

(同第 3 节结构)

5. 核心争论点(Key Debates)

(每条争论:正方证据 [n][n] → 反方证据 [n][n] → 综合判断)

6. 批判性分析

6.1 证据质量整体评估

6.2 方法论局限

6.3 发表偏倚风险评估

7. 未来研究方向

(基于证据空白 + 方法局限,提出具体可操作的研究问题,3-5 条)

8. 结论

参考文献


附录 A:文献检索与筛选方法

(PRISMA 流程、检索策略、纳入/排除标准——见 6.1 公共附录模板)

附录 B:纳入文献质量评估与统计

(见 Phase 8.4 模板)


---

#### 6.1C Scoping Review 结构(新兴/交叉领域,边界探索)

> 回答"**这个领域的边界在哪?涉及哪些维度?还有哪些没被研究过?**"
> 读者视角:**面向想进入新领域的科研人员**,提供地图式全景认知

[研究方向]范围综述:[副标题]

摘要(背景 / 范围界定 / 主要发现 / 研究机会)

1. 引言

1.1 为什么需要范围综述(领域新兴/边界模糊的依据)

1.2 综述范围界定

2. 领域全景图

2.1 领域演进轨迹

(Mermaid timeline:从哪些母领域交汇而来,重要时间节点)

2.2 研究规模与分布

(年份分布图/表;地区分布;发表载体分布)

3. 研究维度地图

(有哪些子方向/研究角度——用 Mermaid graph 或表格呈现维度结构)

4. 跨学科关联

(与哪些领域交叉?每个交叉方向的代表性研究是什么?)

5. 研究空白地图

(哪些维度几乎没有研究?用表格呈现"已探索 vs. 待探索") | 维度 | 当前研究密度 | 代表文献 | 空白点描述 |

6. 未来研究机会

(可以进一步做 Systematic Review 或实验研究的具体方向,3-5 条)

7. 结论

参考文献


附录 A:文献检索与筛选方法

(见 6.1 公共附录模板)

附录 B:文献统计摘要

(见 Phase 8.4 模板)


---

#### 6.1 公共附录模板:文献检索说明(所有类型通用,置于附录 A)

> **位置说明:** 此内容不出现在正文中,统一放入**附录 A**。面向需要复现检索过程的读者(编辑审稿、同行复现)提供,不影响正文的读者体验。

附录 A:文献检索与筛选方法

A.1 检索数据库

Sciverse 学术数据库(多源聚合,覆盖 arXiv、ACL Anthology、PubMed、IEEE Xplore 等; 检索执行日期:[YYYY-MM-DD])。

A.2 检索策略

语义检索关键词组(quality 模式):

  • EN-1: "[实际查询串 1]"
  • EN-2: "[实际查询串 2]"
  • ZH-1: "[中文查询串 1]" (逐一列出实际使用的所有查询串)

结构化 meta-search 过滤条件:

  • ① 高引奠基文献:citation_count≥[N], year≥[Y]
  • ② 高 FWCI:fwci≥2.0, influential_citation_count≥1
  • ③ 国内中文:language IN ["zh","chinese"]
  • ④ 中国机构英文:country CONTAINS "China", language=en
  • ⑤ 最新前沿:year≥[current-2], citation_count≥3
  • ⑥ 开放获取:access_is_oa=true, citation_count≥20

引用链追踪: 从 Top-[N] 高引文献 references 字段提取高频 doc_id(出现≥3次)

A.3 纳入/排除标准

标准
纳入 发表年 [起始年]—[结束年];与主题直接相关;引用量满足年龄调整阈值
排除 主题相关性低;重复发表;纯技术报告;无实验验证的纯理论

A.4 PRISMA 筛选流程

阶段 数量
检索总命中(去重前) X 篇
去重后候选 X 篇
摘要相关性筛选后 X 篇
质量阈值过滤后 X 篇
最终纳入 X 篇(国内 X + 国际 X)

年份跨度:[起始年]—[结束年];中位发表年:[年份]


---

#### 6.1D Narrative Review 结构(经验综述/教学概览)

> 面向**需要快速了解一个领域全貌**的读者,风格更轻松,无严格 PRISMA

[研究方向]综述:[副标题]

摘要(背景 / 主要发现 / 实践建议)

1. 引言

1.1 为什么关注这个话题

1.2 本综述的覆盖范围

2. 领域发展脉络

(Mermaid timeline:关键事件和转折点)

3. 核心概念与框架

(定义 + 分类,引用高被引综述建立框架)

4. [主题A]研究进展

(国内外混排;每段 2-4 篇文献支撑;禁止逐篇罗列)

5. [主题B]研究进展

6. 综合讨论与对比分析

(含 5 维度对比矩阵:国内 vs. 国际研究特征)

7. 趋势与未来展望

8. 结论

参考文献


附录 A:文献检索说明

(见 6.1 公共附录模板)

附录 B:文献统计摘要

(见 Phase 8.4 模板)


#### 6.2 写作规范

- **读者优先原则:** 正文面向"需要看综述的科研人员"——先给全局视野(演进图谱),再给分类框架,最后给方法细节。检索过程、PRISMA 流程等方法论内容**统一放入附录**,不出现在正文各节。
- **演进图谱必须存在:** 每篇综述正文必须包含至少一个 Mermaid 可视化图(timeline 或 graph),且所有节点必须对应纳入文献列表中的实际文献。图谱节点 10-20 个,聚焦关键转折点而非罗列所有文献。
- **语言:** 客观学术中文;英文文献保留原英文标题,中文描述内容
- **引用格式:** 正文上标 [n] 或 (作者, 年份);文末 GB/T 7714-2015
- **段落密度:** 每段 150-250 字,包含 2-4 篇文献支撑;**禁止逐篇罗列式**("A 研究了…;B 研究了…")
- **量化支撑:** 引用数字必须满足"四.五.三"五要素规则;不满足条件的数字一律删除,改为定性描述
- **正文长度:** 5000-10000 字(根据文献量调整);附录不计入此字数
- **批判性视角:** 每个方法子章节必须包含以下判断(来自全文证据或合理推断):
  - 该方法适用于黑盒还是白盒模型?
  - 是否需要额外训练?计算成本如何?
  - 该方法在哪些 benchmark 有效,在哪些场景可能失效?
  - 与同类方法相比的核心优缺点?

#### 6.2.1 技术方法比较表(方法类章节必须包含)

在介绍技术方法的章节(检测方法、缓解方法等),除正文描述外,**必须附一张方法横向比较表**:

```markdown
| 方法名 | 提出者/年份 | 模型访问类型 | 训练要求 | 适用场景 | 核心优点 | 主要局限 | 代表性结果 |
|--------|-----------|------------|---------|---------|---------|---------|-----------|
| SelfCheckGPT | Manakul 2023 | 黑盒 | 无需训练 | 通用生成 | 无需标注数据,即插即用 | 多次采样成本高,不适合低延迟场景 | BERTScore 0.64(WikiBio) |
| DoLa | Chuang 2024 | 灰盒(需 logits) | 无需训练 | 解码阶段 | 零额外参数,直接改善 | 需访问层级 logits,不适用 API 模型 | TruthfulQA MC1 57.2%(LLaMA-7B) |

表格规则:

  • "模型访问类型"只填:黑盒 / 灰盒(需 logits/tokens)/ 白盒(需 hidden states)
  • "训练要求"只填:无需训练 / 推理时调整 / 需微调 / 需完整预训练
  • "代表性结果"必须包含指标名 + 数据集名,来自证据映射表;无法填写则标注"[全文未报告]"
  • 同一类别(检测/缓解/基准)的所有方法必须出现在同一张表中,不允许分散

6.3 参考文献格式模板(按 --citation-style 选择)

根据用户声明的 --citation-style 参数选择对应格式模板。所有字段来自 Sciverse 元数据,不编造;缺失字段注明 [信息不完整]


6.3.1 GB/T 7714-2015(--citation-style gbt,默认中文综述)
# 期刊论文(中文)
[n] 作者1, 作者2, 作者3. 题名[J]. 刊名, 年份, 卷(期): 起止页码. DOI.

# 期刊论文(英文)
[n] AUTHOR1 A B, AUTHOR2 C D. Title[J]. Journal Name, Year, Vol(Issue): Pages. DOI.

# 会议论文
[n] 作者. 题名[C]//会议名称全称. 出版地: 出版者, 年份: 起止页码.

# 预印本(arXiv)
[n] AUTHOR1 A. Title[EB/OL]. arXiv preprint arXiv:XXXX.XXXXX, Year.
    https://arxiv.org/abs/XXXX.XXXXX.

6.3.2 APA 7th Edition(--citation-style apa,默认英文综述)
# 期刊论文
[n] Author, A. B., & Author, C. D. (Year). Title of article. Journal Name, Vol(Issue),
    Pages. https://doi.org/xxx

# 会议论文
[n] Author, A. B. (Year). Title of paper. In A. Editor (Ed.), Proceedings title
    (pp. X–XX). Publisher. https://doi.org/xxx

# 预印本(arXiv)
[n] Author, A. B. (Year). Title. arXiv. https://arxiv.org/abs/XXXX.XXXXX

APA 7th 正文引用格式:(Author, Year) 或 Author (Year)


6.3.3 IEEE(--citation-style ieee,工程/计算机领域推荐)
# 期刊论文
[n] A. B. Author and C. D. Author, "Title of article," Abbrev. Journal Name,
    vol. X, no. Y, pp. X–XX, Mon. Year, doi: 10.xxxx/xxxxx.

# 会议论文
[n] A. B. Author, "Title of paper," in Proc. Conf. Name Abbrev., City, Country,
    Year, pp. X–XX, doi: 10.xxxx/xxxxx.

# 预印本(arXiv)
[n] A. B. Author, "Title," arXiv:XXXX.XXXXX [cs.XX], Year.
    [Online]. Available: https://arxiv.org/abs/XXXX.XXXXX

IEEE 正文引用格式:上标数字 [n],按首次引用顺序编号


6.3.4 Vancouver(--citation-style vancouver,医学/生命科学推荐)
# 期刊论文
n. Author AB, Author CD. Title of article. Journal Abbrev. Year;Vol(Issue):Pages.
   doi:10.xxxx/xxxxx.

# 会议论文
n. Author AB. Title. In: Editor AB, editor. Conference Name; Year Month Day-Day;
   City, Country. Place: Publisher; Year. p. X-XX.

# 预印本(arXiv)
n. Author AB. Title [Preprint]. arXiv. Year [cited YYYY Mon DD].
   Available from: https://arxiv.org/abs/XXXX.XXXXX

Vancouver 正文引用格式:上标数字 (n) 或 [n],按首次引用顺序编号


6.3.5 Chicago Author-Date(--citation-style chicago,人文/社科推荐)
# 期刊论文(参考文献列表)
Author, First, and Second Author. Year. "Title of Article." Journal Name Vol (Issue): Pages.
https://doi.org/xxx.

# 会议论文
Author, First. Year. "Title of Paper." In Conference Name, edited by A. Editor, X–XX.
Publisher. https://doi.org/xxx.

# 预印本(arXiv)
Author, First. Year. "Title." Preprint, submitted Month Day. https://arxiv.org/abs/XXXX.XXXXX.

Chicago 正文引用格式:(Author Year) 或 (Author Year, Page)


6.3.6 MLA 9th Edition(--citation-style mla
# 期刊论文
Author, First, and Second Author. "Title of Article." Journal Name, vol. X, no. Y,
Year, pp. X–XX, https://doi.org/xxx.

# 会议论文
Author, First. "Title of Paper." Conference Name, edited by A. Editor,
Publisher, Year, pp. X–XX.

# 预印本(arXiv)
Author, First. "Title." ArXiv, Year, https://arxiv.org/abs/XXXX.XXXXX.

MLA 正文引用格式:(Author Page) 或 (Author)(无页码时)


格式选择建议:

  • 中文期刊投稿 / 学位论文 → gbt
  • 社会科学 / 心理学 → apa
  • 计算机 / 电子工程 → ieee
  • 医学 / 临床研究 → vancouver
  • 历史 / 文学 / 人文 → chicago
  • 语言文学 / 英语类期刊 → mla

阶段 7 — 引用完整性门控 + 质量自评

7.0 引用完整性门控(写作完成后,输出前必须执行)⚠️ 阻塞性检查

此步骤不通过,禁止输出综述正文。

检查 A:数量一致性

□ 统计正文中所有 [n] 编号,获得编号集合 S_text
□ 统计参考文献列表中的条目,获得编号集合 S_ref
□ 验证 S_text == S_ref(无遗漏、无多余)
□ 验证正文中使用的最大编号 == 参考文献条目总数

不一致 → 立即修正,不允许发出。

检查 B:方法归属抽样核验(至少验证正文中 30% 的方法引用)

对每条抽查项,核对:

正文写法:「[作者姓氏] 等提出 [方法名]([参考文献号])」
↓ 核对
参考文献 [n]:标题是 "[实际标题]",作者首位是 "[实际作者]"
↓ 核对
证据映射表 doc_id=[xxx]:read_content 确认该论文提出了 [方法名]? □ 是 □ 否

发现不一致(如:引用的论文实际不是提出该方法的文章)→ 必须:

  1. 通过 read_content 重新确认正确的 doc_id
  2. 修正正文归属描述
  3. 更新参考文献条目
  4. 不允许保留错配,哪怕已知"大意相近"

检查 C:数字溯源抽查(抽查 100% 的百分比/倍数数字)

对正文中每一个出现的定量数字(如 "57.2%"、"提升 12 个百分点"):

□ 在证据映射表中找到对应条目
□ 五要素(指标/数据集/基线/结果/参考文献号)完整?
□ 若不完整 → 删除该数字,改为定性描述

检查 D:国内外声明量化核验

综述中若出现"国内研究主要集中于…""国际研究的特点是…"等归纳性论断:

□ 每条归纳至少有 3 篇文献具体支撑(在括号内列出文献号)?
□ 若无具体文献支撑 → 改写为"初步观察"或删除

7.1 质量自评(六维,各 10 分)

完成门控检查并修正后,进行自评:

维度 评分标准 得分
完整性 涵盖研究方向的主要方面,无明显遗漏 /10
引用准确性 正文 claim 与文献内容严格对应,无错配;数字有五要素 /10
批判深度 方法比较有访问类型/成本/适用场景/局限分析,非罗列 /10
国内外平衡 国内外覆盖充分;比较结论有文献数量/fwci 数据支撑 /10
主题组织 主题式组织;方法章节有横向比较表 /10
前沿性 涵盖近 2 年成果;趋势判断有具体文献和数据依据 /10

总分 ≥ 78:输出
总分 60-77:针对低分维度修订后输出(若引用准确性 \x3C 7,必须重做门控检查)
总分 \x3C 60:返回阶段 2 补充检索,重写低质量部分

特别规则: 若"引用准确性"维度得分 \x3C 6,无论总分多高,必须重做阶段 4.5 和 7.0,不得发出综述。


阶段 8 — 多格式输出与最终交付

8.1 第一步:写入 Markdown 源文件(所有格式的基础)

综述正文始终先写入 Markdown 文件(\x3Ctopic>-review.md),作为后续转换的唯一来源:

# 保存到工作目录
# 文件名格式:\x3C主题关键词>-review.md,如 llm-hallucination-review.md

8.2 第二步:按 --format 参数转换输出

Markdown(默认,无需转换)

直接输出 \x3Ctopic>-review.md
附带 \x3Ctopic>-review-bibliography.bib(若 citation-style=ieee/apa/vancouver/chicago/mla)

LaTeX(--format latex

生成可直接编译的 .tex 文件:

% \x3Ctopic>-review.tex 模板头部
\documentclass[12pt]{article}          % 默认;IEEE 格式改用 IEEEtran
\usepackage[UTF8]{ctex}                % 含中文时使用,xelatex 编译
\usepackage{hyperref}
\usepackage{natbib}                    % apa/chicago/mla;IEEE 改用 \usepackage{cite}
\usepackage{booktabs}                  % 方法比较表
\usepackage{longtable}

% 文档类选择规则:
% --citation-style ieee  → \documentclass{IEEEtran} + \usepackage{cite}
% --citation-style apa   → \documentclass{article}  + \usepackage{natbib} (apalike)
% --citation-style gbt   → \documentclass{article}  + \usepackage{gbt7714}
% 其他                   → \documentclass{article}  + \usepackage{natbib}

\bibliographystyle{\x3Cstyle>}  % gbt7714/apalike/IEEEtran/vancouver/chicago/mla
\begin{document}
% ... 正文(Markdown 转 LaTeX)...
\bibliography{\x3Ctopic>-review}
\end{document}

同时生成 \x3Ctopic>-review.bib(BibTeX 格式,从 Sciverse 元数据字段构建):

@article{AuthorYearKeyword,
  author    = {Author, First and Author, Second},
  title     = {Title from metadata title field},
  journal   = {publication_venue_name},
  year      = {publication_published_year},
  volume    = {publication_venue_biblio_volume},
  number    = {publication_venue_biblio_issue},
  pages     = {publication_venue_biblio_pages},
  doi       = {doi field},
  url       = {access_oa_url or locations[0]}
}

@inproceedings{AuthorYearKeyword,
  author    = {...},
  title     = {...},
  booktitle = {publication_venue_name},
  year      = {...},
  pages     = {...},
  doi       = {...}
}

publication_venue_biblio_volume/issue/pages 字段为空,在 BibTeX 中省略该字段(不编造),并在字段末尾注释 % [元数据缺失]

检测 pdflatex/xelatex 是否可用,若可用则自动编译:

# 检测可用编译器
which xelatex 2>/dev/null && COMPILER=xelatex || which pdflatex 2>/dev/null && COMPILER=pdflatex

# 含中文时必须用 xelatex
$COMPILER \x3Ctopic>-review.tex
bibtex \x3Ctopic>-review
$COMPILER \x3Ctopic>-review.tex
$COMPILER \x3Ctopic>-review.tex   # 两遍确保引用正确

若编译器不可用,仅交付 .tex + .bib 源文件,告知用户本地编译命令。


DOCX(--format docx

检测 Pandoc 是否可用:

which pandoc 2>/dev/null

若可用,从 Markdown 转换:

# 基础转换
pandoc \x3Ctopic>-review.md \
  --from markdown \
  --to docx \
  --reference-doc ~/.claude/skills/sciverse-review/templates/reference.docx \
  --bibliography \x3Ctopic>-review.bib \
  --csl ~/.claude/skills/sciverse-review/csl/\x3Cstyle>.csl \
  -o \x3Ctopic>-review.docx

# CSL 文件映射:
# apa       → apa-7th-edition.csl
# ieee      → ieee.csl
# vancouver → vancouver.csl
# chicago   → chicago-author-date.csl
# mla       → modern-language-association-9th-edition.csl
# gbt       → gb-t-7714-2015-numeric.csl(或 -author-date)

若 Pandoc 不可用:告知用户 brew install pandoc(macOS)或 sudo apt install pandoc(Linux),并提供等效命令;同时交付 .md 源文件作为备选。


PDF(--format pdf

优先路线:Pandoc → PDF(若可用):

pandoc \x3Ctopic>-review.md \
  --from markdown \
  --to pdf \
  --pdf-engine=xelatex \           # 含中文时必须
  --bibliography \x3Ctopic>-review.bib \
  --csl ~/.claude/skills/sciverse-review/csl/\x3Cstyle>.csl \
  -V CJKmainfont="PingFang SC" \   # macOS 中文字体
  -V geometry:margin=2.5cm \
  -o \x3Ctopic>-review.pdf

备选路线:先生成 .tex,再 LaTeX 编译为 PDF(见 LaTeX 路线)。

若两条路线均不可用,告知用户所需工具并交付 .md 源文件。


8.3 格式检测与降级策略

用户请求格式
    │
    ├─ markdown → 直接输出 ✓
    │
    ├─ latex    → 生成 .tex + .bib → 尝试 xelatex/pdflatex 编译
    │                │ 成功 → 交付 .pdf + .tex + .bib
    │                └ 失败 → 交付 .tex + .bib + 编译说明
    │
    ├─ docx     → 检测 pandoc
    │                │ 有   → pandoc 转换 → 交付 .docx
    │                └ 无   → 告知安装方式 → 交付 .md(降级)
    │
    └─ pdf      → 检测 pandoc + xelatex
                     │ 有   → pandoc --pdf-engine=xelatex → 交付 .pdf
                     └ 无   → 尝试 latex 路线 → 失败则交付 .md(降级)

8.4 最终交付清单

文件 必须 说明
\x3Ctopic>-review.md 源文件,含正文 + 附录
\x3Ctopic>-review.\x3Cext> --format 目标格式文件
\x3Ctopic>-review.bib LaTeX/DOCX/PDF 时 BibTeX 参考文献库
技术演进图谱(内嵌于正文第 2/3 节) Mermaid timeline/graph,10-20 节点
附录 A:文献检索方法 PRISMA + 检索策略(不出现在正文中)
附录 B:文献统计摘要与质量自评 检索统计 + fwci 分布 + 六维评分

附录 B 文献统计摘要模板:

## 附录 B:文献统计摘要与质量自评

### B.1 检索统计
检索日期:YYYY-MM-DD
检索策略:语义检索 X 组 + meta-search X 轮(6类过滤)+ 引用链追踪
检索总命中:约 X 篇 → 去重后 X 篇 → 最终纳入 X 篇(国内 X + 国际 X)
年份分布:20XX—20XX(中位年份 20XX)
里程碑论文(influential_citation_count > 0):X 篇
全文精读(read_content 成功):X 篇 | 仅摘要:X 篇
平均 fwci:X.X(国内 X.X / 国际 X.X)
输出格式:\x3Cformat> | 引用风格:\x3Ccitation-style>

### B.2 质量自评(六维,各 10 分)
| 维度 | 评分标准 | 得分 |
|------|---------|------|
| 完整性 | 涵盖主要方面,无明显遗漏 | /10 |
| 引用准确性 | 正文 claim 与文献内容严格对应;数字有五要素 | /10 |
| 批判深度 | 有访问类型/成本/局限分析,非描述性罗列 | /10 |
| 国内外平衡 | 覆盖充分;比较结论有数据支撑 | /10 |
| 可视化表达 | 演进图谱节点对应实际文献;比较表完整 | /10 |
| 前沿性 | 涵盖近 2 年成果;趋势判断有具体依据 | /10 |
总分:__/60

快速参考:完整 API 调用示例

# ── 阶段 0:Meta-Catalog 字段确认 ──────────────────────────────────
mcp__sciverse__list_catalog(include_sample_values=true)

# ── 阶段 2.1:英文语义检索 ─────────────────────────────────────────
mcp__sciverse__semantic_search(
  query="hallucination detection large language models survey",
  mode="quality",
  top_k=20
)

# ── 阶段 2.3-①:高引奠基性文献 meta-search ───────────────────────
mcp__sciverse__search_papers(
  query="LLM hallucination",
  year_from=2015,
  sort_by_year="none",
  filters_advanced=[
    {"field": "citation_count", "operator": "FILTER_OP_GTE", "value": 200},
    {"field": "metadata_type", "operator": "FILTER_OP_EQ", "value": "paper"}
  ],
  page_size=30
)

# ── 阶段 2.3-②:高 FWCI 顶尖文献 ────────────────────────────────
mcp__sciverse__search_papers(
  query="LLM hallucination mitigation",
  year_from=2020,
  sort_by_year="none",          # query + sort_by_year!="none" → INVALID_REQUEST
  filters_advanced=[
    {"field": "fwci", "operator": "FILTER_OP_GTE", "value": 2.0},
    {"field": "influential_citation_count", "operator": "FILTER_OP_GTE", "value": 1}
  ],
  page_size=20
)

# ── 阶段 2.3-③:国内中文文献 ─────────────────────────────────────
mcp__sciverse__search_papers(
  query="大语言模型幻觉",
  year_from=2020,
  sort_by_year="none",          # query + sort_by_year!="none" → INVALID_REQUEST
  filters_advanced=[
    {"field": "language", "operator": "FILTER_OP_IN", "value": ["zh", "chinese"]}
  ],
  page_size=30
)

# ── 阶段 2.3-④:中国机构英文发表 ────────────────────────────────
mcp__sciverse__search_papers(
  query="hallucination large language model",
  year_from=2021,
  sort_by_year="none",          # query + sort_by_year!="none" → INVALID_REQUEST
  filters_advanced=[
    {"field": "publication_published_country", "operator": "FILTER_OP_CONTAINS", "value": "China"},
    {"field": "language", "operator": "FILTER_OP_EQ", "value": "en"}
  ],
  page_size=20
)

# ── 阶段 2.3-⑤:最新前沿文献 ─────────────────────────────────────
mcp__sciverse__search_papers(
  query="hallucination LLM 2024 2025",
  year_from=2023,
  sort_by_year="none",          # query + sort_by_year!="none" → INVALID_REQUEST
  filters_advanced=[
    {"field": "citation_count", "operator": "FILTER_OP_GTE", "value": 3}
  ],
  page_size=25
)

# ── 阶段 2.3-⑥:OA 可读全文文献 ─────────────────────────────────
mcp__sciverse__search_papers(
  query="hallucination detection mitigation benchmark",
  year_from=2020,
  sort_by_year="none",          # query + sort_by_year!="none" → INVALID_REQUEST
  filters_advanced=[
    {"field": "access_is_oa", "operator": "FILTER_OP_EQ", "value": "true"},
    {"field": "citation_count", "operator": "FILTER_OP_GTE", "value": 20}
  ],
  page_size=20
)

# ── 阶段 2.4:引用链追踪(从高引文献的 references 扩展) ──────────
# 假设从 Top-10 文献的 references 字段提取出高频 doc_id
mcp__sciverse__search_papers(
  filters_advanced=[
    {"field": "doc_id", "operator": "FILTER_OP_IN",
     "value": ["doc_id_A", "doc_id_B", "doc_id_C", ...]}
  ],
  page_size=20
)

# ── 阶段 4.3:全文精读(最大字节,优先 OA 文献) ──────────────────
mcp__sciverse__read_content(
  doc_id="\x3Cdoc_id>",
  offset=0,
  limit=16384        # 使用最大限制
)
# 若 more=true,继续读取:
mcp__sciverse__read_content(
  doc_id="\x3Cdoc_id>",
  offset=\x3Cnext_offset>,
  limit=16384
)

注意事项与防幻觉规则

引用与事实

  • 方法归属不推测: 在正文中写"X 等提出 Y 方法"之前,必须通过 read_content 确认:(1) 作者姓名来自 author 字段;(2) 全文中确实"提出"了该方法(而非仅仅引用)。从文献标题猜测方法名或作者是常见错误来源,严格禁止。
  • 数字不引用未溯源的: 任何百分比、提升幅度、准确率等数字,若无法对应到 read_content 中的具体段落,一律删除,改为定性表述("作者报告有改善"、"实验表明有效")
  • 元数据字段原文优先: 标题、作者、DOI、发表年份、期刊名等信息只从 Sciverse 返回的字段读取,不从其他来源拼凑,不编造;缺失字段注明 [元数据缺失]
  • 全文读取失败时降级:read_content 返回空或极少,该文献在正文中的描述严格限制在 abstract 范围,不引用方法细节和任何数字,并在文献卡片顶部注明"仅摘要,全文不可读"

检索与覆盖

  • 字段枚举值: languagepublication_venue_typeaccess_oa_status 等枚举值以 list_catalog 实际返回为准,不硬编码假设值
  • 文献不足时: 若某维度文献 \x3C 10 篇,降低质量阈值并在综述方法节说明;宁可文献少但准确,不要凑数
  • 引用链循环防护: 引用链追踪时,对已纳入的 doc_id 不重复 fetch

写作原则

  • 批判性而非描述性: 每个技术方法子节不能只描述"做了什么",必须回答"适合谁用""在什么条件下有效""局限是什么"
  • 归纳论断需证据: "国内研究偏重应用""国际研究更关注理论"等归纳性论断,必须在括号内附具体文献编号(≥3 篇);无支撑就不写
  • 并行检索原则: 不同检索轮次尽量在同一 response 中并行调用
  • 中文综述为主: 正文用中文;英文文献保留原标题,中文描述内容
安全使用建议
Install this if you want an automated Sciverse-based literature review workflow. Before requesting DOCX, PDF, or LaTeX output, be aware it may create files in the working directory and may run local conversion tools if available; use Markdown output if you want the lowest-side-effect path.
能力评估
Purpose & Capability
The skill’s purpose is to generate systematic academic surveys using Sciverse retrieval, synthesis, citation checks, and Markdown/LaTeX/DOCX/PDF outputs; these capabilities fit the stated purpose.
Instruction Scope
The trigger language is broad for literature-review requests but still scoped to academic surveys/reviews, not unrelated tasks or hidden behavior.
Install Mechanism
The artifact is a single Markdown skill with no executable scripts or package install step; however, the manifest declares no required binaries while the instructions mention optional pandoc, xelatex, pdflatex, and bibtex use.
Credentials
The skill mainly uses Sciverse MCP tools and writes generated review files locally; optional conversion commands are proportionate to DOCX/PDF/LaTeX output but should be user-controlled.
Persistence & Privilege
No persistence, credential collection, background worker, or destructive action is present; the only privilege-related note is fallback guidance telling users how to install pandoc if missing.
如何使用
  1. 确保已安装 OpenClaw(本地或 Docker 部署)
  2. 在对话框中输入安装命令:/install scisurvey
  3. 安装完成后,直接呼叫该 Skill 的名称或使用 /scisurvey 触发
  4. 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
版本历史
v1.0.0
SciSurvey 1.0.0 — Initial Release - Introduces SciSurvey: an automatic, systematic academic survey/review generator based on Sciverse. - Automatically detects research field and suggests suitable review type (systematic-survey, systematic-review, scoping-review, narrative-review). - Builds adaptive, bilingual keyword sets and multi-strategy literature search (semantic, meta-search, citation tracing). - Supports multi-format output (Markdown, LaTeX, DOCX, PDF) and multiple citation styles (APA, IEEE, MLA, Vancouver, GB/T 7714, Chicago). - Ensures reference integrity and provides structured, high-quality academic overviews suitable for publication.
元数据
Slug scisurvey
版本 1.0.0
许可证 MIT-0
累计安装 0
当前安装数 0
历史版本数 1
常见问题

Scisurvey 是什么?

SciSurvey — Systematic Survey × Sciverse。全自动系统性学术综述生成器:自动识别领域 → 选择 Survey/Review 类型 → 领域自适应关键词 → meta-catalog 确认 → 多策略并行检索(语义 + 结构化 meta-search + 引用链追踪)→ 质量过... 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 40 次。

如何安装 Scisurvey?

在 OpenClaw 或 Claude Code 对话框中运行命令「/install scisurvey」即可一键安装,无需额外配置。

Scisurvey 是免费的吗?

是的,Scisurvey 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。

Scisurvey 支持哪些平台?

Scisurvey 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。

谁开发了 Scisurvey?

由 liweixiaogui10(@liweixiaogui10)开发并维护,当前版本 v1.0.0。

💬 留言讨论