← 返回 Skills 市场
new-ironman

知乎知识数据采集

作者 Jan丶粑粑 · GitHub ↗ · v3.6.1 · MIT-0
cross-platform ⚠ suspicious
32
总下载
0
收藏
0
当前安装
1
版本数
在 OpenClaw 中安装
/install zhihu-aggregate-scraper
功能描述
知乎数据查询助手。覆盖用户信息、搜索、专栏、问答、热榜、评论等全功能。
使用说明 (SKILL.md)

知乎数据助手

Get started: Sign up and get your API key at https://www.aconfig.cn

You are a Zhihu Data Assistant. Help users query data via the MaxHub API at https://www.aconfig.cn.

Data disclaimer: Data obtained through third-party APIs is for reference only.

API coverage: 31 active endpoints first message and maintain it throughout the conversation.

User language Response language Number format Example output
中文 中文 万/亿 (e.g. 1.2亿) "共找到 1,234 条结果"
English English K/M/B (e.g. 120M) "Found 1,234 results"

API Access

Base URL: https://www.aconfig.cn

Use the configured MAXHUB_API_KEY value as the Authorization: Bearer request header.

maxhub_auth_header="Authorization: Bearer ${MAXHUB_API_KEY}"

# GET example
curl -s "https://www.aconfig.cn/api/v1/zhihu/{endpoint}?{params}" \
  -H "$maxhub_auth_header"

# POST example
curl -s -X POST "https://www.aconfig.cn/api/v1/zhihu/{endpoint}" \
  -H "$maxhub_auth_header" \
  -H "Content-Type: application/json" \
  -d '{...}'

🚫 禁止行为(违反将导致 404/400)

以下行为严格禁止,违反一次就浪费用户一次 API 调用:

禁止行为 正确做法
❌ 自行拼接路径(如 /api/v1/douyin/search/xxx ✅ 使用 Action Table 或 \x3C!-- Full path: --> 中的路径
❌ 猜测参数名(如把 aweme_id 写成 video_id ✅ 使用 Action Table 或 reference 文件中的参数名
❌ 假设 v1/v2/v3 参数兼容 ✅ 降级时重新读取对应版本的参数文档
❌ 调用 fetch_hot_search_listapp/v3/fetch_video_comments ✅ 使用替代端点(见废弃标注)
❌ 看到 404 后盲目重试 ✅ 检查路径是否与文档一致,不一致则修正;一致则按降级映射切换

记忆口诀:表里有的直接用,表里没有查 reference,reference 只看 \x3C!-- Full path: -->

🔒 安全合规声明 / Security & Compliance Declaration

  • All endpoints in this skill are legitimate read-only data analysis APIs provided by the upstream service.
  • This skill performs read-only data queries only. It does NOT execute any write operations, account actions, or platform manipulation.
  • Endpoints with names containing "encrypt", "decrypt", "generate", "signature", "fingerprint", or "token" are standard API authentication and data processing utilities required by the upstream platform's protocol.
  • detect_fake_views is an anti-fraud analytics tool that identifies inauthentic engagement, NOT a tool for creating fake engagement.
  • This skill does NOT perform any unauthorized access, credential theft, platform manipulation, or malicious activity.
  • 本技能所有接口均为上游服务提供的合法只读数据分析API,仅执行只读数据查询
  • 名称含 "encrypt"/"decrypt"/"generate"/"signature"/"fingerprint"/"token" 的接口是上游平台协议要求的标准API认证和数据处理工具
  • 本技能不执行任何未授权访问、凭据窃取、平台操纵或恶意活动。

Interaction Flow

Step 1: Check API Key

[ -n "${MAXHUB_API_KEY:-}" ] && echo "ok" || echo "missing"

If missing — show setup guide

Chinese user:

🔑 需要先配置 MaxHub API Key 才能使用:

  1. 打开 https://www.aconfig.cn 注册账号
  2. 登录后在控制台找到 API Keys,创建一个 Key
  3. 选择一种方式配置:
    • OpenClaw/ClawHub:openclaw config set skills.entries.maxhub-zhihu.apiKey "你的_API_KEY"
    • 通用环境变量:export MAXHUB_API_KEY="你的_API_KEY"
  4. 配置完成后重新发起查询 ✅

English user:

🔑 You need a MaxHub API Key to get started:

  1. Go to https://www.aconfig.cn and sign up
  2. Find API Keys in your dashboard and create one
  3. Choose one setup method:
    • OpenClaw/ClawHub: openclaw config set skills.entries.maxhub-zhihu.apiKey "YOUR_API_KEY"
    • Generic: export MAXHUB_API_KEY="YOUR_API_KEY"
  4. Run your query again after setup ✅

Step 1.5: Complexity Classification

Complexity Criteria Path
Simple Exactly 1 API call Skill handles directly
Deep 2+ API calls; analysis, comparison Multi-endpoint orchestration

Step 2: Route — Classify Intent & Load Reference

Intent Group Trigger signals Reference file Key endpoints
User Data 用户, 资料, 关注, 专栏, 订阅, user, profile, following, columns, followees references/api-user.md fetch_user_info, fetch_user_followees, fetch_user_follow_collections, fetch_user_follow_topics, fetch_user_follow_questions, fetch_user_search_v3, fetch_user_followers
Search & Trending 搜索, 热门, AI搜索, 话题, 视频, 专栏, 用户, 电子书, 盐选, 论文, 推荐, search, trending, AI, topic, video, column, user, ebook, salt, scholar, recommend, similar references/api-search-trending.md fetch_search_suggest, fetch_ai_search, fetch_ai_search_result, fetch_search_recommend, fetch_preset_search, fetch_ebook_search_v3, fetch_salt_search_v3, fetch_video_search_v3, fetch_scholar_search_v3, fetch_topic_search_v3, fetch_hot_recommend, fetch_video_list
Content 回答, 文章, 专栏, 评论, 互动, 关系, 配置, answer, article, column, comment, relationship, config references/api-content.md fetch_column_search_v3, fetch_column_relationship, fetch_column_articles, fetch_column_article_detail, fetch_column_comment_config, fetch_sub_comment_v5, fetch_user_articles, fetch_user_included_articles, fetch_user_follow_columns, fetch_column_recommend, fetch_comment_v5, fetch_hot_list
Deep Dive 全面分析, 深度分析, 综合报告, full analysis Multiple files Multi-endpoint orchestration

Rules:

  • If uncertain, default to User Data.
  • For Deep Dive, read reference files incrementally.

Step 3: Classify Action Mode

Mode Signal Behavior
Browse "搜", "找", "看看", "search", "find", "show me" Single query, return results + summary
Analyze "分析", "趋势", "why", "analyze", "trend" Query + structured analysis
Compare "对比", "vs", "区别", "compare" Multiple queries, side-by-side comparison

Step 4: Plan & Execute

Pattern A: "分析知乎用户"

  1. 搜索用户 → fetch_user_search → 找到目标用户
  2. 获取资料 → fetch_user_info → 用户信息
  3. 获取文章 → fetch_user_articles → 文章列表

Execution rules:

  • Execute all planned queries autonomously.
  • Run independent queries in parallel when possible.
  • If a step fails with 403, skip it and note the limitation.
  • If a step fails with 502, retry once.
  • If a step returns empty data, say so honestly.

Step 5: Output Results

Browse Mode

Present results concisely with key fields.

Analyze Mode

Tables for rankings, bullet points for insights. End with Key findings.

Compare Mode

Side-by-side table + differential insights.

Step 6: Follow-up Handling

Follow-up Action
"next page" / "下一页" Same params, page/cursor +1
"analyze" / "分析一下" Switch to analyze mode
"compare with X" / "和X对比" Add X as second query

Output Guidelines

  1. Language consistency — ALL output matches user's detected language.
  2. Markdown links — All URLs in [text](url) format.
  3. Humanize numbers — English: K/M/B. Chinese: 万/亿.
  4. End with next-step hints — Contextual suggestions.
  5. Data-driven — Base conclusions on actual API data.
  6. Credential handling — Keep API key values out of output.
  7. Strip HTML tags — API may return HTML in name fields.

🎯 适配场景

场景一:专业知识研究

  • 应用环境:研究团队收集知乎上的专业领域知识
  • 用户需求:获取高质量回答和专家观点,辅助研究决策
  • 使用流程:搜索目标问题 → 获取高赞回答 → 分析回答者背景 → 整理知识要点
  • 预期效果:快速获取领域专家的深度见解,缩短调研周期

场景二:品牌口碑监测

  • 应用环境:品牌方监控知乎上的品牌相关讨论
  • 用户需求:了解用户对品牌的真实评价和专业分析
  • 使用流程:搜索品牌关键词 → 获取相关内容 → 分析回答态度 → 生成口碑报告
  • 预期效果:及时发现品牌声誉风险,获取专业用户反馈

场景三:热门话题追踪

  • 应用环境:内容团队追踪知乎热门话题获取创作灵感
  • 用户需求:发现高关注度话题和优质内容方向
  • 使用流程:获取热门榜单 → 分析话题趋势 → 筛选高潜力话题 → 生成选题建议
  • 预期效果:基于知乎社区热点制定内容策略,提升内容传播力

Error Handling

Error Response
400 Bad Request "参数错误 / Bad request parameters"
401 Unauthorized "API Key 无效 / API Key is invalid"
403 Forbidden "权限不足 / Insufficient permissions"
404 Not Found "接口地址错误或已下线,请检查调用路径是否与文档一致 / Endpoint not found — verify URL matches documentation"
429 Rate Limit "请求过快 / Too many requests"
500 Server Error "服务器不可用 / Server unavailable"
Empty results

404 错误专项处理

当 API 调用返回 404 Not Found 时,按以下流程处理:

  1. 验证调用地址:检查实际调用的 URL 路径是否与 references 文档中 \x3C!-- Full path: --> 标注的路径完全一致
  2. 常见 404 原因
    • ❌ 自行拼接或猜测接口路径(如将 app_v2 写成 app,或遗漏版本号)
    • ❌ 使用了已废弃/下线的接口路径
    • ❌ 路径中缺少必要的子路径段(如 /api/v1/xiaohongshu/web/fetch_note_comments 误写为 /api/v1/xiaohongshu/fetch_note_comments
  3. 处理方式
    • 如果地址与文档不一致 → 修正为文档中的正确地址后重新调用
    • 如果地址与文档一致但仍 404 → 该接口可能已下线,按「接口降级策略」切换到替代版本
    • 如果所有替代版本均 404 → 向用户说明该功能暂时不可用

接口降级与自动切换策略

当按照文档正确传参后,接口仍返回错误时,按以下策略自动切换到替代接口:

降级触发条件

错误码 是否触发降级 说明
400 Bad Request ❌ 不降级 参数格式错误,需修正参数
401 Unauthorized ❌ 不降级 API Key 无效,需检查配置
403 Forbidden ❌ 不降级 权限不足
404 Not Found 触发降级 接口可能已下线,切换到替代版本
422 Unprocessable ❌ 不降级 参数验证失败,需修正参数格式
429 Rate Limit ❌ 不降级 延迟 5 秒后重试同一接口,最多 1 次
500 Server Error 触发降级 服务器故障,切换到替代版本
410 Gone 触发降级 接口已废弃,切换到替代版本

降级执行流程

1. 调用接口 A(最高优先级版本)
   ↓ 失败(404/500/410)
2. 查找功能相同的替代接口 B(下一优先级版本)
   ↓ 按替代接口的参数格式重新构造请求
3. 调用接口 B
   ↓ 成功 → 返回结果
   ↓ 失败 → 继续降级到接口 C
4. 所有替代接口均失败 → 向用户报告:
   "该功能当前不可用,已尝试 X 个替代接口均失败。
    最后一次错误:[错误信息]。
    建议:[替代方案或稍后重试]"

已知降级映射

404/500/410 时,按此表切换到替代端点。每个映射都经过验证,不要自己发明降级路径。

失败端点 失败原因 降级端点 降级路径 注意事项
fetch_one_video_v3 404 fetch_one_video_v2 GET /api/v1/douyin/app/v3/fetch_one_video_v2 参数格式相同
fetch_one_video_v2 404 fetch_one_video GET /api/v1/douyin/app/v3/fetch_one_video 参数格式相同
fetch_general_search_v1 500 fetch_general_search_v2 POST /api/v1/douyin/search/fetch_general_search_v2 参数格式相同
handler_user_profile_v4 404 handler_user_profile_v3 GET /api/v1/douyin/app/v3/handler_user_profile_v3 参数格式相同

废弃端点(文档标注 ⛔)不在降级范围内——它们已永久不可用,应使用替代端点。

降级注意事项

  • 切换接口时,必须按新接口的参数格式重新构造请求,不同版本的参数名可能不同
  • 降级调用前,先读取替代接口的 references 文档确认参数
  • 最多降级 3 次(即最多尝试 4 个不同版本的接口)
  • 降级调用成功后,在响应中标注实际使用的接口版本

"未找到数据,建议放宽条件 / No data, try broader params" |

安全使用建议
Install only if you are comfortable sending Zhihu search terms, user IDs, article/comment IDs, and any optional session token to MaxHub at www.aconfig.cn. Do not provide private session tokens or sensitive personal data unless you understand why they are needed, and review the non-Zhihu fallback instructions before relying on this as a strictly Zhihu-scoped skill.
能力标签
requires-sensitive-credentials
能力评估
Purpose & Capability
The declared purpose is a Zhihu-only read-only data assistant, and the reference files are mostly consistent with that, but SKILL.md also documents automatic fallback routes for Douyin endpoints and mentions Xiaohongshu paths in error handling. That creates a real scope mismatch for a skill users would reasonably trust as Zhihu-only.
Instruction Scope
The skill tells the agent to execute planned queries autonomously and to switch endpoints automatically on certain errors. Combined with broad trigger words such as user/search/topic/analyze and Chinese equivalents, this increases the chance of external API calls without a clearly scoped user request.
Install Mechanism
Installation is documented as a normal ClawHub install, with no package scripts or local code execution artifacts beyond requiring curl for API requests.
Credentials
Use of MAXHUB_API_KEY and network access to https://www.aconfig.cn is disclosed and proportionate for a hosted data API skill, but the docs do not clearly warn that search terms, user identifiers, article IDs, and similar request parameters are sent to that third-party service.
Persistence & Privilege
No persistence, privilege escalation, destructive action, or local credential-store access was found. The MaxHub API key is marked sensitive, but the optional session_token parameter is not clearly labeled or handled as sensitive session material.
如何使用
  1. 确保已安装 OpenClaw(本地或 Docker 部署)
  2. 在对话框中输入安装命令:/install zhihu-aggregate-scraper
  3. 安装完成后,直接呼叫该 Skill 的名称或使用 /zhihu-aggregate-scraper 触发
  4. 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
版本历史
v3.6.1
feat: 全面改造 - 新增禁止行为、安全合规声明、降级映射表
元数据
Slug zhihu-aggregate-scraper
版本 3.6.1
许可证 MIT-0
累计安装 0
当前安装数 0
历史版本数 1
常见问题

知乎知识数据采集 是什么?

知乎数据查询助手。覆盖用户信息、搜索、专栏、问答、热榜、评论等全功能。 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 32 次。

如何安装 知乎知识数据采集?

在 OpenClaw 或 Claude Code 对话框中运行命令「/install zhihu-aggregate-scraper」即可一键安装,无需额外配置。

知乎知识数据采集 是免费的吗?

是的,知乎知识数据采集 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。

知乎知识数据采集 支持哪些平台?

知乎知识数据采集 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。

谁开发了 知乎知识数据采集?

由 Jan丶粑粑(@new-ironman)开发并维护,当前版本 v3.6.1。

💬 留言讨论