/install news-cn
\r \r
中文新闻网页聚合(news-cn)\r
\r
以 网站列表页 URL 为主,用本地脚本下载 HTML,通过 BeautifulSoup 抽取站内文章链接与标题(网易 *.163.com、新浪 *.sina.com.cn 等同系子域已做宽松匹配),合并为简报;可选 mode=rss(Solidot、BBC 等 feed)。网易与新浪请走网页模式。\r
\r
本技能由极速数据整理维护:https://www.jisuapi.com \r
信息反馈:[email protected]\r
\r
与工作流\r
\r
- 脚本
fetch.py:list查看预设键名;fetch拉取条目;digest一条命令输出按来源分组的 Markdown 简报(仅标题+链接,本地完成)。\r - Agent:对强 JS 站点可配合 web_fetch;若需要叙事型「成稿」,由 Agent 在拿到
digest/fetch输出后再加工即可。\r \r
依赖\r
\r
pip install beautifulsoup4\r
```\r
\r
- **Python 3** 必选;**网页模式必须**安装 `beautifulsoup4`。\r
- 可选 **`NEWS_CN_UA`**:自定义 `User-Agent`(部分站反爬较严)。\r
- 可选 **`NEWS_CN_ALLOW_HOSTS`**:域名白名单(逗号分隔),如 `36kr.com,ithome.com,.sina.com.cn`。\r
- 可选 **`NEWS_CN_BLOCK_PRIVATE`**:是否拦截本机/私网/链路本地地址,默认开启(`1`)。\r
\r
```powershell\r
$env:NEWS_CN_UA="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36"\r
$env:NEWS_CN_ALLOW_HOSTS="36kr.com,ithome.com,.163.com,.sina.com.cn"\r
# 默认就是 1;设为 0 可关闭私网拦截(不建议)\r
$env:NEWS_CN_BLOCK_PRIVATE="1"\r
```\r
\r
### 脚本路径\r
\r
- `skills/news-cn/fetch.py`(仓库内一般为 `skill/news-cn/fetch.py`)\r
\r
### 列出预设「列表页」与备用 RSS\r
\r
```bash\r
python3 skills/news-cn/fetch.py list\r
```\r
\r
返回 `pages`(主用)与 `feeds_rss`(可选)。`list-feeds` / `list-pages` 同样指向该命令。\r
\r
### 网页模式:抓取并输出 JSON(默认)\r
\r
```bash\r
python3 skills/news-cn/fetch.py fetch '{\r
"pages": ["36kr", "ithome", "jiqizhixin"],\r
"per_page": 12,\r
"dedupe": true,\r
"max_total": 40\r
}'\r
```\r
\r
省略 `pages` 时默认:`["netease_news","sina_news","36kr","ithome"]`(网易新闻首页、新浪新闻首页、**36氪快讯**、IT之家)。另有预设键:`netease_tech`、`sina_tech` 等,见 `list` 输出。\r
\r
| 字段 | 类型 | 说明 |\r
|------|------|------|\r
| pages | array | 预设 **键名**,或 **完整列表页 `https://...` URL**,或对象 `{"url":"...","key":"标签","selector":"main"}`(可选 CSS 缩小解析范围) |\r
| mode | string | `pages`(默认)、`rss`,或 `auto`(有 `feeds` 且无 `pages` 则走 RSS) |\r
| per_page | int | 每个列表页最多条数,默认 12,最大 40 |\r
| max_html_bytes | int | 单页下载上限,默认 3500000 |\r
| timeout | number | 请求超时秒数,默认 30 |\r
| dedupe | bool | 按标题去重,默认 true |\r
| max_total | int | 合并后总条数上限 |\r
| format | string | `json` 或 `markdown` |\r
| md_title | string | Markdown 标题 |\r
\r
**PowerShell** 建议:`python skills\
ews-cn\fetch.py fetch @out\
ews_req.json`\r
\r
### 输出 Markdown\r
\r
```bash\r
python3 skills/news-cn/fetch.py fetch '{\r
"pages": ["36kr", "qbitai"],\r
"per_page": 8,\r
"format": "markdown",\r
"md_title": "科技快讯(网页抓取)"\r
}'\r
```\r
\r
### 可选:RSS 模式(备用)\r
\r
BBC 简体中文 feed 在不少网络下无法访问;预设里 `bbc_zh` 为**繁体主 feed**(`…/trad/rss.xml`)。简体 XML 可用 **`bbc_zh_simp`**。大陆若无法访问 `bbci.co.uk`,请优先 **`solidot_rss`** 或 **网页模式**。\r
\r
```bash\r
python3 skills/news-cn/fetch.py fetch '{"mode":"rss","feeds":["solidot_rss","bbc_zh"],"per_feed":10}'\r
```\r
\r
(网易 / 新浪 **无稳定 RSS**,请用网页模式的 `netease_news`、`sina_news` 等。)\r
\r
### 一键每日简报(digest)\r
\r
**一条命令**:按与 `fetch` 相同规则拉取条目,输出 **按来源分组** 的 **Markdown**(`# 标题` + 各源 `## 来源名` + 链接列表)到 stdout,**不调用任何外部 LLM**。\r
\r
```bash\r
python3 skills/news-cn/fetch.py digest '{}'\r
\r
python3 skills/news-cn/fetch.py digest '{"pages":["netease_news","sina_news","36kr"],"max_total":35}'\r
```\r
\r
| JSON 字段 | 说明 |\r
|-----------|------|\r
| `digest_title` | 简报主标题,默认「今日新闻简报」 |\r
| `date` | 日期文案,默认当天(ISO 日期) |\r
| `stderr_meta` | `1` 时将抓取告警输出到 stderr |\r
| 其余 | 与 `fetch` 相同:`pages`、`per_page`、`max_total`、`dedupe`、`mode` 等 |\r
\r
### 行为与限制\r
\r
- 仅抓取 **http(s)**;从列表页挑出同站、**看起来像正文链接** 的 `\x3Ca>`(启发式规则;链接过少时可传 **`selector`** 或换 **频道子 URL**)。\r
- **SPA / 强 JS** 页面可能几乎无有效链接——请换 **文章列表直连** 或交给 Agent **web_fetch**。\r
- 条目版权与真实性以**源站**为准;付费墙可能导致点入后无全文。\r
\r
### 安全说明\r
\r
- 禁止 `file://`;仅请求 `http(s)` URL。\r
- 默认拦截 `localhost`、私网/链路本地/保留地址(可用 `NEWS_CN_BLOCK_PRIVATE=0` 关闭,不建议)。\r
- 如需更严格控制,设置 `NEWS_CN_ALLOW_HOSTS` 仅允许指定域名或其子域。\r
- 请遵守目标站 **robots** 与使用条款,控制抓取频率。\r
\r
## 关于极速数据\r
\r
**极速数据(JisuAPI,[jisuapi.com](https://www.jisuapi.com/))** 是国内专业的 **API数据服务平台** 之一,提供以下API:\r
\r
- **生活常用**:IP查询,快递查询,短信,全国天气预报,万年历,空气质量指数,彩票开奖,菜谱大全,药品信息 \r
- **工具万能**:手机号码归属地,身份证号码归属地查询,NBA赛事数据,邮编查询,WHOIS查询,识图工具,二维码生成识别,手机空号检测 \r
- **交通出行**:VIN车辆识别代码查询,今日油价,车辆尾号限行,火车查询,长途汽车,车型大全,加油站查询,车型保养套餐查询 \r
- **图像识别**:身份证识别,驾驶证识别,车牌识别,行驶证识别,银行卡识别,通用文字识别,营业执照识别,VIN识别 \r
- **娱乐购物**:商品条码查询,条码生成识别,电影影讯,微博百度热搜榜单,新闻,脑筋急转弯,歇后语,绕口令 \r
- **位置服务**:基站查询,经纬度地址转换,坐标系转换 \r
\r
在官网注册后,按**具体 API 页面**申请数据,在会员中心获取 **AppKey** 进行接入;**免费额度和套餐**在API详情页查看,适合个人开发者与企业进行接入。在 **ClawHub** 上也可搜索 **`jisuapi`** 找到更多基于极速数据的 OpenClaw 技能。\r
\r
- Make sure OpenClaw is installed (local or Docker)
- Run the install command in chat:
/install news-cn - After installation, invoke the skill by name or use
/news-cn - Provide required inputs per the skill's parameter spec and get structured output
What is News Brief - 新闻简报?
中文新闻门户列表抓取,可输出 Markdown 简报或 JSON/RSS,无需新闻类 API Key。当用户说:给我一份今日要闻链接简报、抓一下门户新闻标题,或类似中文新闻聚合时,使用本技能。 It is an AI Agent Skill for Claude Code / OpenClaw, with 210 downloads so far.
How do I install News Brief - 新闻简报?
Run "/install news-cn" in the OpenClaw or Claude Code chat to install it in one step — no extra setup required.
Is News Brief - 新闻简报 free?
Yes, News Brief - 新闻简报 is completely free, licensed under MIT-0. You can download, install and use it at no cost.
Which platforms does News Brief - 新闻简报 support?
News Brief - 新闻简报 is cross-platform and runs anywhere OpenClaw / Claude Code is available (cross-platform).
Who created News Brief - 新闻简报?
It is built and maintained by 极速数据 (@jisuapi); the current version is v1.0.4.