← 返回 Skills 市场
jiahuishao

news-scraper-xiaobai

作者 BAI · GitHub ↗ · v1.0.0 · MIT-0
cross-platform ✓ 安全检测通过
192
总下载
0
收藏
0
当前安装
1
版本数
在 OpenClaw 中安装
/install news-scraper-xiaobai
功能描述
从AI新闻网站爬取最新资讯,支持新闻分类和标签,用于内容聚合和舆情监控。
使用说明 (SKILL.md)

新闻爬取 Skill

快速开始

python scripts/crawl.py --site aibase --limit 20

编程调用

import sys
sys.path.insert(0, "news-scraper")
from scripts.crawl import crawl_and_return_json

result = crawl_and_return_json(site="aibase", limit=20)
# AI自行处理返回数据
# 原文链接使用中文路径: https://www.aibase.com/zh/news/xxxxx

分类与标签

每条新闻需要添加分类和标签,便于后续筛选和整理。

分类

分类 说明
大模型 基础模型、LLM、多模态等
AI应用 产品、工具、平台
企业商业 公司动态、财报,合作
安全合规 安全漏洞、政策法规
开源社区 开源项目,社区动态
硬件芯片 GPU、AI芯片、硬件
学术研究 论文、突破
智能体 Agent技术

标签

标签 说明
OpenAI OpenAI相关
Google 谷歌相关
NVIDIA 英伟达相关
Meta Meta相关
Microsoft 微软相关
阿里巴巴 阿里相关
中国 国内动态
国际 国外动态
Agent 智能体
多模态 多模态技术
安全 安全相关

使用方式

在总结输出中添加分类和标签。

总结输出格式

AI在总结新闻时,使用以下markdown格式:

📅 2026-03-17 AI资讯

---

🧠 **智能体**

> 📌 标题:英伟达发布 NemoClaw
> 🏷️ 分类:智能体 | 标签:NVIDIA、Agent
> 📝 概要:英伟达发布企业级AI智能体平台NemoClaw,为OpenClaw提供企业级安全盔甲
> 🔗 链接:https://www.aibase.com/zh/news/26291

> 📌 标题:钉钉发布"悟空"AI原生平台
> 🏷️ 分类:智能体 | 标签:阿里巴巴、Agent
> 📝 概要:阿里B端AI Agent战略落地,支持PC与移动端双端运行
> 🔗 链接:https://www.aibase.com/zh/news/26285

---

🔒 **安全合规**

> 📌 标题:国安部发布OpenClaw安全养殖手册
> 🏷️ 分类:安全合规 | 标签:中国、安全、Agent
> 📝 概要:提醒用户警惕主机接管、数据窃取、言论篡改四大安全风险
> 🔗 链接:https://www.aibase.com/zh/news/26298
安全使用建议
这是一个本地新闻爬虫:它只访问公开的 AIBase 网站并把结果保存到磁盘,不需要 API 密钥或其它敏感凭证。注意事项: - 运行前在预期的目录执行(或显式传入 news_dir),以避免覆盖不相关的文件。脚本默认写入 ./News/news_latest.json(SKILL.md 文档中提到的 ~/Documents/News 与代码默认不一致)。 - 安装前查看 requirements.txt 并在隔离的虚拟环境中安装依赖(requests、beautifulsoup4)。 - 如果你计划让代理自动调用此技能,确认你信任它在本地写文件并在网络上抓取公开页面;技能不会向第三方上报抓取结果,但模型/代理可能会在后续步骤使用或发送这些数据,所以注意模型如何处理返回的 JSON(摘要生成流程)。 - 若打算扩展到其他网站或增加自动摘要,请先审查新增爬虫代码,注意避免爬取需要身份认证或私有内容。
功能分析
Type: OpenClaw Skill Name: news-scraper-xiaobai Version: 1.0.0 The news-scraper skill is a legitimate tool designed to crawl and summarize AI-related news from aibase.com. The code uses standard libraries like requests and BeautifulSoup for web scraping and saves the results locally in JSON and Markdown formats (scripts/crawl.py, scrapers/aibase.py). There is no evidence of data exfiltration, malicious execution, or harmful prompt injection; the instructions in SKILL.md are strictly focused on output formatting and content categorization.
能力评估
Purpose & Capability
技能名/描述为爬取 AI 新闻站点并聚合内容;仓内包含爬虫类、主脚本和配置,所需依赖(requests、BeautifulSoup)与功能一致。没有要求与目的不符的凭证或二进制。
Instruction Scope
SKILL.md 指令直接运行 scripts/crawl.py 或通过 crawl_and_return_json 编程调用,指令与代码行为一致(抓取页面、解析、保存)。注意文档中有小不一致:说明输出 JSON 在 ~/Documents/News,但代码默认使用当前工作目录下的 News 目录;SKILL.md 要求模型生成摘要,但代码本身不调用任何外部 AI 服务(期待由 agent / 使用者 来生成)。
Install Mechanism
无安装规范(instruction-only),但包内包含 requirements.txt。没有来自不可信 URL 的下载或可疑安装步骤;依赖均为常见 Python 库。
Credentials
不要求任何环境变量或凭证(primary credential: none)。代码仅发起到公开网站的 HTTP 请求,不访问系统凭证或外部私有服务。
Persistence & Privilege
技能不会请求常驻(always)权限,也不修改其他技能配置。但会在磁盘上创建/更新文件(默认在当前工作目录的 News 子目录,固定文件名 news_latest.json),可能覆盖已有文件;请在合适的工作目录下运行并避免以高权限用户执行。
如何使用
  1. 确保已安装 OpenClaw(本地或 Docker 部署)
  2. 在对话框中输入安装命令:/install news-scraper-xiaobai
  3. 安装完成后,直接呼叫该 Skill 的名称或使用 /news-scraper-xiaobai 触发
  4. 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
版本历史
v1.0.0
Initial release of news-scraper skill. - Enables scraping of the latest AI news from specified websites. - Allows both command-line and Python programmatic use for news collection. - Each news item includes categories and tags for filtering and organization. - Provides clear output guidelines for news summaries in markdown format.
元数据
Slug news-scraper-xiaobai
版本 1.0.0
许可证 MIT-0
累计安装 0
当前安装数 0
历史版本数 1
常见问题

news-scraper-xiaobai 是什么?

从AI新闻网站爬取最新资讯,支持新闻分类和标签,用于内容聚合和舆情监控。 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 192 次。

如何安装 news-scraper-xiaobai?

在 OpenClaw 或 Claude Code 对话框中运行命令「/install news-scraper-xiaobai」即可一键安装,无需额外配置。

news-scraper-xiaobai 是免费的吗?

是的,news-scraper-xiaobai 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。

news-scraper-xiaobai 支持哪些平台?

news-scraper-xiaobai 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。

谁开发了 news-scraper-xiaobai?

由 BAI(@jiahuishao)开发并维护,当前版本 v1.0.0。

💬 留言讨论