← 返回 Skills 市场
210
总下载
5
收藏
1
当前安装
5
版本数
在 OpenClaw 中安装
/install news-cn
功能描述
中文新闻门户列表抓取,可输出 Markdown 简报或 JSON/RSS,无需新闻类 API Key。当用户说:给我一份今日要闻链接简报、抓一下门户新闻标题,或类似中文新闻聚合时,使用本技能。
使用说明 (SKILL.md)
\r \r
中文新闻网页聚合(news-cn)\r
\r
以 网站列表页 URL 为主,用本地脚本下载 HTML,通过 BeautifulSoup 抽取站内文章链接与标题(网易 *.163.com、新浪 *.sina.com.cn 等同系子域已做宽松匹配),合并为简报;可选 mode=rss(Solidot、BBC 等 feed)。网易与新浪请走网页模式。\r
\r
本技能由极速数据整理维护:https://www.jisuapi.com \r
信息反馈:[email protected]\r
\r
与工作流\r
\r
- 脚本
fetch.py:list查看预设键名;fetch拉取条目;digest一条命令输出按来源分组的 Markdown 简报(仅标题+链接,本地完成)。\r - Agent:对强 JS 站点可配合 web_fetch;若需要叙事型「成稿」,由 Agent 在拿到
digest/fetch输出后再加工即可。\r \r
依赖\r
\r
pip install beautifulsoup4\r
```\r
\r
- **Python 3** 必选;**网页模式必须**安装 `beautifulsoup4`。\r
- 可选 **`NEWS_CN_UA`**:自定义 `User-Agent`(部分站反爬较严)。\r
- 可选 **`NEWS_CN_ALLOW_HOSTS`**:域名白名单(逗号分隔),如 `36kr.com,ithome.com,.sina.com.cn`。\r
- 可选 **`NEWS_CN_BLOCK_PRIVATE`**:是否拦截本机/私网/链路本地地址,默认开启(`1`)。\r
\r
```powershell\r
$env:NEWS_CN_UA="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36"\r
$env:NEWS_CN_ALLOW_HOSTS="36kr.com,ithome.com,.163.com,.sina.com.cn"\r
# 默认就是 1;设为 0 可关闭私网拦截(不建议)\r
$env:NEWS_CN_BLOCK_PRIVATE="1"\r
```\r
\r
### 脚本路径\r
\r
- `skills/news-cn/fetch.py`(仓库内一般为 `skill/news-cn/fetch.py`)\r
\r
### 列出预设「列表页」与备用 RSS\r
\r
```bash\r
python3 skills/news-cn/fetch.py list\r
```\r
\r
返回 `pages`(主用)与 `feeds_rss`(可选)。`list-feeds` / `list-pages` 同样指向该命令。\r
\r
### 网页模式:抓取并输出 JSON(默认)\r
\r
```bash\r
python3 skills/news-cn/fetch.py fetch '{\r
"pages": ["36kr", "ithome", "jiqizhixin"],\r
"per_page": 12,\r
"dedupe": true,\r
"max_total": 40\r
}'\r
```\r
\r
省略 `pages` 时默认:`["netease_news","sina_news","36kr","ithome"]`(网易新闻首页、新浪新闻首页、**36氪快讯**、IT之家)。另有预设键:`netease_tech`、`sina_tech` 等,见 `list` 输出。\r
\r
| 字段 | 类型 | 说明 |\r
|------|------|------|\r
| pages | array | 预设 **键名**,或 **完整列表页 `https://...` URL**,或对象 `{"url":"...","key":"标签","selector":"main"}`(可选 CSS 缩小解析范围) |\r
| mode | string | `pages`(默认)、`rss`,或 `auto`(有 `feeds` 且无 `pages` 则走 RSS) |\r
| per_page | int | 每个列表页最多条数,默认 12,最大 40 |\r
| max_html_bytes | int | 单页下载上限,默认 3500000 |\r
| timeout | number | 请求超时秒数,默认 30 |\r
| dedupe | bool | 按标题去重,默认 true |\r
| max_total | int | 合并后总条数上限 |\r
| format | string | `json` 或 `markdown` |\r
| md_title | string | Markdown 标题 |\r
\r
**PowerShell** 建议:`python skills\
ews-cn\fetch.py fetch @out\
ews_req.json`\r
\r
### 输出 Markdown\r
\r
```bash\r
python3 skills/news-cn/fetch.py fetch '{\r
"pages": ["36kr", "qbitai"],\r
"per_page": 8,\r
"format": "markdown",\r
"md_title": "科技快讯(网页抓取)"\r
}'\r
```\r
\r
### 可选:RSS 模式(备用)\r
\r
BBC 简体中文 feed 在不少网络下无法访问;预设里 `bbc_zh` 为**繁体主 feed**(`…/trad/rss.xml`)。简体 XML 可用 **`bbc_zh_simp`**。大陆若无法访问 `bbci.co.uk`,请优先 **`solidot_rss`** 或 **网页模式**。\r
\r
```bash\r
python3 skills/news-cn/fetch.py fetch '{"mode":"rss","feeds":["solidot_rss","bbc_zh"],"per_feed":10}'\r
```\r
\r
(网易 / 新浪 **无稳定 RSS**,请用网页模式的 `netease_news`、`sina_news` 等。)\r
\r
### 一键每日简报(digest)\r
\r
**一条命令**:按与 `fetch` 相同规则拉取条目,输出 **按来源分组** 的 **Markdown**(`# 标题` + 各源 `## 来源名` + 链接列表)到 stdout,**不调用任何外部 LLM**。\r
\r
```bash\r
python3 skills/news-cn/fetch.py digest '{}'\r
\r
python3 skills/news-cn/fetch.py digest '{"pages":["netease_news","sina_news","36kr"],"max_total":35}'\r
```\r
\r
| JSON 字段 | 说明 |\r
|-----------|------|\r
| `digest_title` | 简报主标题,默认「今日新闻简报」 |\r
| `date` | 日期文案,默认当天(ISO 日期) |\r
| `stderr_meta` | `1` 时将抓取告警输出到 stderr |\r
| 其余 | 与 `fetch` 相同:`pages`、`per_page`、`max_total`、`dedupe`、`mode` 等 |\r
\r
### 行为与限制\r
\r
- 仅抓取 **http(s)**;从列表页挑出同站、**看起来像正文链接** 的 `\x3Ca>`(启发式规则;链接过少时可传 **`selector`** 或换 **频道子 URL**)。\r
- **SPA / 强 JS** 页面可能几乎无有效链接——请换 **文章列表直连** 或交给 Agent **web_fetch**。\r
- 条目版权与真实性以**源站**为准;付费墙可能导致点入后无全文。\r
\r
### 安全说明\r
\r
- 禁止 `file://`;仅请求 `http(s)` URL。\r
- 默认拦截 `localhost`、私网/链路本地/保留地址(可用 `NEWS_CN_BLOCK_PRIVATE=0` 关闭,不建议)。\r
- 如需更严格控制,设置 `NEWS_CN_ALLOW_HOSTS` 仅允许指定域名或其子域。\r
- 请遵守目标站 **robots** 与使用条款,控制抓取频率。\r
\r
## 关于极速数据\r
\r
**极速数据(JisuAPI,[jisuapi.com](https://www.jisuapi.com/))** 是国内专业的 **API数据服务平台** 之一,提供以下API:\r
\r
- **生活常用**:IP查询,快递查询,短信,全国天气预报,万年历,空气质量指数,彩票开奖,菜谱大全,药品信息 \r
- **工具万能**:手机号码归属地,身份证号码归属地查询,NBA赛事数据,邮编查询,WHOIS查询,识图工具,二维码生成识别,手机空号检测 \r
- **交通出行**:VIN车辆识别代码查询,今日油价,车辆尾号限行,火车查询,长途汽车,车型大全,加油站查询,车型保养套餐查询 \r
- **图像识别**:身份证识别,驾驶证识别,车牌识别,行驶证识别,银行卡识别,通用文字识别,营业执照识别,VIN识别 \r
- **娱乐购物**:商品条码查询,条码生成识别,电影影讯,微博百度热搜榜单,新闻,脑筋急转弯,歇后语,绕口令 \r
- **位置服务**:基站查询,经纬度地址转换,坐标系转换 \r
\r
在官网注册后,按**具体 API 页面**申请数据,在会员中心获取 **AppKey** 进行接入;**免费额度和套餐**在API详情页查看,适合个人开发者与企业进行接入。在 **ClawHub** 上也可搜索 **`jisuapi`** 找到更多基于极速数据的 OpenClaw 技能。\r
\r
安全使用建议
This skill appears to be a straightforward local scraper. Before installing: (1) keep NEWS_CN_BLOCK_PRIVATE enabled (default) to avoid SSRF/private-network access; (2) if you want to limit external hosts, set NEWS_CN_ALLOW_HOSTS to an explicit whitelist; (3) be aware the skill performs HTTP(S) requests from your agent environment to the sites you request (so fetched URLs may reveal that your agent's IP hit those sites); (4) install beautifulsoup4 if you intend to use webpage parsing; (5) do not set any unrelated credentials — none are required. If you need the team to review the full fetch.py behavior, provide the remaining truncated lines for a complete audit.
功能分析
Type: OpenClaw Skill
Name: news-cn
Version: 1.0.4
The news-cn skill is a legitimate utility for aggregating news from Chinese portals and RSS feeds. The Python script (fetch.py) implements scraping logic using BeautifulSoup and includes proactive security measures such as SSRF protection by validating URLs and blocking private/local IP addresses (e.g., 127.0.0.1, 192.168.x.x). The code is well-structured, lacks any signs of data exfiltration or malicious execution, and its behavior is strictly aligned with the documentation provided in SKILL.md.
能力评估
Purpose & Capability
Name/description (Chinese news list scraping, Markdown/JSON/RSS output) match the included script and declared requirements (python3, optional beautifulsoup4). The optional env vars (UA, allow-list, block-private) are justified by the stated purpose.
Instruction Scope
SKILL.md instructs the agent to run local fetch.py to download HTML or RSS and extract in-site article links; it does not ask for unrelated files, credentials, or to send data to third-party endpoints. It explicitly forbids file:// and documents private-network blocking.
Install Mechanism
No remote install or download spec; dependency is a standard pip package (beautifulsoup4) mentioned in docs. The shipped fetch.py contains the scraping logic; nothing in the spec fetches arbitrary code from unknown hosts.
Credentials
No required secrets or credentials. The only environment controls are NEWS_CN_UA, NEWS_CN_ALLOW_HOSTS, and NEWS_CN_BLOCK_PRIVATE which are reasonable for a scraper. They are optional and their purpose is explained.
Persistence & Privilege
Skill is not always-enabled, does not request elevated or persistent system privileges, and does not modify other skills or global agent configuration.
如何使用
- 确保已安装 OpenClaw(本地或 Docker 部署)
- 在对话框中输入安装命令:
/install news-cn - 安装完成后,直接呼叫该 Skill 的名称或使用
/news-cn触发 - 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
版本历史
v1.0.4
- Skill名称和描述更精炼、突出中文新闻门户抓取与输出Markdown/JSON/RSS简报,无需API Key,面向聚合场景。
- metadata部分优化,名称更易懂(News Brief - 新闻简报)。
- 其余功能、参数和用法无变更,仅文档优化与表达调整。
v1.0.3
news-cn 1.0.3 changelog
- 增加环境变量 NEWS_CN_ALLOW_HOSTS,可指定抓取域名白名单,提升控制力与安全性。
- 默认启用 NEWS_CN_BLOCK_PRIVATE,拦截本机、私网地址抓取,进一步加强安全防护。
- 文档细化各环境变量说明,补充安全说明和推荐配置。
- 功能与输出无变化,主要为安全机制升级与说明完善。
v1.0.2
news-cn 1.0.2
- 在 SKILL.md 文档底部新增了“关于极速数据”模块,详细介绍极速数据(JisuAPI)平台及相关数据 API 服务与使用方式。
- 其他功能和用法说明未检测到更改。
v1.0.1
- 移除外部 LLM 摘要成稿功能,digest 现在仅本地输出按来源分组的 Markdown 标题+链接,不再依赖 OpenAI 或其他 LLM。
- 配置参数和使用方式简化,无需新闻 API Key、也不需 LLM Key。
- 优化说明文档,明确 digest 输出格式与限制,推荐由 Agent 后续加工叙事型成稿。
- 保持支持网页抓取、RSS 阅读等核心能力,全部本地完成。
v1.0.0
- 首发版本,提供中文新闻列表页聚合与每日简报自动生成。
- 支持主流新闻网站(如网易、新浪、36氪、IT之家)网页列表智能抓取,无需新闻 API Key。
- 一键生成 Markdown/JSON 新闻链接清单,或调用 OpenAI 兼容 API 输出中文新闻摘要成稿(需用户配置 LLM Key)。
- 支持 RSS 源抓取及输出(适用于 solidot、BBC 等),可选格式 Markdown 或 JSON。
- 明确区分网页与 RSS 模式,丰富自定义参数(来源、条数、格式等)。
- 注重安全与可用性,所有数据仅本地处理,用户可自定义 User-Agent、防止爬虫封禁。
元数据
常见问题
News Brief - 新闻简报 是什么?
中文新闻门户列表抓取,可输出 Markdown 简报或 JSON/RSS,无需新闻类 API Key。当用户说:给我一份今日要闻链接简报、抓一下门户新闻标题,或类似中文新闻聚合时,使用本技能。 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 210 次。
如何安装 News Brief - 新闻简报?
在 OpenClaw 或 Claude Code 对话框中运行命令「/install news-cn」即可一键安装,无需额外配置。
News Brief - 新闻简报 是免费的吗?
是的,News Brief - 新闻简报 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。
News Brief - 新闻简报 支持哪些平台?
News Brief - 新闻简报 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。
谁开发了 News Brief - 新闻简报?
由 极速数据(@jisuapi)开发并维护,当前版本 v1.0.4。
推荐 Skills