← Back to Skills Marketplace
xingjianliu0417

Data Governance

by XingjianLiu0417 · GitHub ↗ · v1.10.1 · MIT-0
cross-platform ⚠ suspicious
313
Downloads
1
Stars
0
Active Installs
12
Versions
Install in OpenClaw
/install data-governance
Description
数据治理与资产管理技能。用于数据质量评估、元数据管理、数据血缘追踪、数据标准制定、数据合规检查等任务。
README (SKILL.md)

Data Governance Skill

数据治理(Data Governance)是指对数据资产管理行使权力和控制的活动集合。

⚠️ 安全警示

使用前请阅读以下安全建议:

  1. 仅使用环境变量 - 不写入配置文件
  2. 使用最小权限账户 - 生产环境使用只读用户
  3. 勿在命令行明文传密码 - 使用环境变量
  4. 敏感数据脱敏 - 分享报告前移除真实数据

首次配置

1. 安装依赖

# 创建虚拟环境(推荐)
python3 -m venv venv
source venv/bin/activate

# 安装依赖
pip install -r requirements.txt

2. 配置环境变量

当前会话有效:

# MySQL
export DB_HOST=localhost
export DB_PORT=3306
export DB_USER=your_user
export DB_PASS=your_password
export DB_NAME=your_database

# PostgreSQL
export DB_HOST=localhost
export DB_PORT=5432
export DB_USER=your_user
export DB_PASS=your_password
export DB_NAME=your_database

# SQLite(无需凭证)
export DB_PATH=/path/to/your/database.db

使用前导入:

# 每次使用前source环境变量文件(不推荐写入~/.bashrc)
source ~/db-env.sh
python scripts/data_quality_check.py --table users --db-type mysql

3. 运行脚本

# 数据质量检查(必须指定 --db-type)
export DB_HOST=localhost DB_USER=admin DB_PASS=xxx DB_NAME=mydb
python scripts/data_quality_check.py --table users --db-type mysql

# 元数据生成
python scripts/generate_metadata.py --source users --db-type postgresql

# 数据血缘分析(可选加数据库)
python scripts/lineage_analysis.py --table orders --db-type sqlite

# 合规检查
python scripts/compliance_check.py --table users --db-type mysql

依赖

依赖 版本 用途
sqlalchemy ==2.0.25 数据库抽象层
pymysql ==1.1.0 MySQL 连接
psycopg2-binary ==2.9.9 PostgreSQL 连接
pandas ==2.1.4 数据处理

详见 requirements.txt

何时使用

当用户提及以下内容时使用此 skill:

  • 数据质量、数据标准、数据血缘
  • 元数据管理、数据目录、数据资产
  • 数据合规、隐私保护、数据安全
  • 数据治理框架、数据资产管理

核心能力

1. 数据质量评估

评估数据的完整性、准确性、一致性、时效性:

检查维度:

  • 缺失值检测
  • 重复记录检测
  • 格式校验
  • 范围校验
  • 业务规则验证

2. 元数据管理

帮助构建和管理元数据:

技术元数据: 表结构、字段类型、数据来源 业务元数据: 字段定义、业务规则、所有者 运营元数据: 更新频率、ETL信息、访问统计

3. 数据血缘追踪

追踪数据的来龙去脉:

来源追溯: 数据从哪来 转换追踪: 经过哪些处理 下游影响: 谁在使用这些数据

4. 数据标准

制定和执行数据标准:

命名规范: 表名、字段名命名规则 类型规范: 数据类型、格式标准 编码规范: 枚举值、代码表

输出格式

完成数据治理任务后,输出结构化报告:

## 数据治理报告

### 数据质量
- 完整性:XX%
- 准确率:XX%
- 发现问题:N个

### 元数据
- 表数量:N
- 字段数量:N

### 建议
1. ...
2. ...

常见场景

场景 输出
数据质量评估 质量报告 + 问题清单
元数据梳理 数据字典 + 关系图
血缘分析 链路图 + 影响分析
合规检查 合规报告 + 风险点
Usage Guidance
这是一个功能上合理的数据治理工具,但在安装/运行前请注意: - 元数据遗漏:注册表没有声明所需的环境变量/主凭据,但脚本确实会读取 DB_HOST、DB_USER、DB_PASS、DB_NAME、DB_PATH 或接受包含凭据的连接字符串。不要在不了解这一点时把生产凭据交给技能。 - 最小权限:为测试/评估使用只读、受限的数据库账户;绝不要用管理员/写权限生产凭据直连。 - 避免在命令行明文传密码:优先通过短时环境变量会话(export ... 在当前 shell)或使用本地受控 SQLite 副本进行分析,避免把凭据放在 shell 历史或脚本中。 - 代码审查:如果你信任要在敏感环境运行,先在隔离环境中审查并运行脚本(本地或容器),确认脚本不会向网络外发出请求或将数据发布到外部终端。脚本看起来只与数据库交互并在本地生成报告,但最好 grep/监控任何网络相关调用(requests、socket、urllib 外发等)。 - 期望修复:理想情况下,发布者应在 registry 元数据中明确列出所需环境变量/主要凭据(primaryEnv),并在 SKILL.md 中强制推荐只读连接与示例最小权限策略。若发布者无法说明来源或无法更新元数据,谨慎使用并优先在脱敏/非生产副本上运行。 如需更高置信度判断,请提供:发布者/源码仓库链接;是否有维护者签名或发布记录;或让发布者更新 registry 元数据以列出所需环境变量(这会把不一致问题解决)。
Capability Analysis
Type: OpenClaw Skill Name: data-governance Version: 1.10.1 The data-governance skill bundle provides a set of tools for database quality assessment, metadata generation, and compliance checking. The scripts (compliance_check.py, data_quality_check.py, etc.) implement security best practices such as regex-based table name validation to prevent SQL injection and rely on environment variables for sensitive database credentials. No evidence of data exfiltration, malicious execution, or harmful prompt injection was found.
Capability Assessment
Purpose & Capability
技能名与描述(数据质量、元数据、血缘、合规)与包含的脚本一致:所有脚本都以访问数据库并读取表/schema 为核心功能,这与声称的用途相符。值得注意的差异是注册表元数据声明“无需环境变量/主要凭据”,但实际脚本明确依赖 DB_HOST/DB_USER/DB_PASS/DB_NAME/DB_PATH 或接受包含凭据的连接字符串。
Instruction Scope
SKILL.md 明确指导创建虚拟环境、通过环境变量提供数据库连接并运行本地脚本,且包含安全建议(最小权限、不要在命令行明文传密码、脱敏等)。总体上说明与脚本行为相符。需要注意:脚本同时接受 --db/connection 字符串,可能允许将明文凭据放在命令行或 URL 中;SKILL.md 建议使用 env vars,但并未强制化或限制传入方式。
Install Mechanism
这是 instruction-only + 内置 Python 脚本的包;无 install spec、无远程下载、仅列出常见 Python 依赖(sqlalchemy、pymysql、psycopg2、pandas)。没有发现从不受信任源提取代码或创建系统级二进制的行为。
Credentials
注册表元数据显示“无需环境变量/主要凭据”,但 SKILL.md 和所有脚本均从环境变量(DB_HOST, DB_PORT, DB_USER, DB_PASS, DB_NAME, DB_PATH)读取数据库凭据或会接受包含凭据的连接字符串。这是一处不一致:请求的凭据本身与技能用途相关(数据库访问是必要的),但未在元数据中声明会增加意外泄露敏感凭据的风险。
Persistence & Privilege
技能未请求 always:true,也不修改其他技能或系统范围配置;运行方式为本地执行脚本,权限范围受所提供数据库凭据限制。没有迹象表明技能会保持长期驻留或提升自身至平台级特权。
How to Use
  1. Make sure OpenClaw is installed (local or Docker)
  2. Run the install command in chat: /install data-governance
  3. After installation, invoke the skill by name or use /data-governance
  4. Provide required inputs per the skill's parameter spec and get structured output
Version History
v1.10.1
- Minor update to scripts/lineage_analysis.py. - No changes to documentation or overall skill capabilities.
v1.10.0
- Improved functionality in compliance_check.py and lineage_analysis.py scripts. - Version bump to 1.10.0. - No changes to documentation or skill description.
v1.9.0
- Now requires explicit --db-type flag for data quality checks. - Updated example commands in documentation for clarity and accuracy. - Minor improvements to usage instructions for running skill scripts. - No changes to dependencies or skill capabilities.
v1.8.0
data-governance 1.8.0 - 新增 requirements.txt,集中管理依赖及其版本。 - 依赖安装方式改为统一通过 requirements.txt。 - 安全建议显著调整,强调仅使用环境变量,不推荐写入配置文件或 shell 配置。 - 文档更新,简化首次配置流程,移除旧的配置文件示例。 - 依赖信息注明详细版本号,并提供 requirements.txt 路径说明。 - 命令和环境变量用法更规范,提升安全实践指引。
v1.7.0
- Improved error handling and messaging across compliance, data quality, metadata, and lineage analysis scripts. - Enhanced robustness of data validation checks in scripts/data_quality_check.py. - Updated scripts to better handle edge cases in database connections and input parameters. - Minor performance optimizations in scripts/generate_metadata.py and scripts/lineage_analysis.py.
v1.6.0
Major update: Strengthened security, improved configuration, and revised usage recommendations. - Added a new security warning section with best practices for password handling and data protection - Provided step-by-step initial setup and secure database connection configuration (environment variables, config file) - Updated command usage to prioritize security and discourage passing plaintext credentials - Unified and clarified commonly used command examples - Added a dependency list with installation instructions - No breaking changes to core capabilities or commands
v1.5.0
- 移除了 _meta.json 和 references/README.md 文件,简化了项目结构。 - 文档、技能描述和核心能力保持不变。 - 无新增功能或核心逻辑调整,仅为维护性更新。
v1.4.0
- 新增数据合规检查脚本 scripts/compliance_check.py,支持合规与敏感字段检测。 - SKILL.md 增加合规检查相关内容,包括命令和参数示例。 - 更新 _meta.json 以反映新功能。
v1.3.0
data-governance 1.3.0 - Updated scripts/lineage_analysis.py (details not specified) - No changes to user-facing documentation or skill description - Bug fixes or improvements likely applied to lineage analysis functionality
v1.2.0
Version 1.2.0 of data-governance adds expanded database support and improved documentation: - 数据质量检查和元数据生成脚本现支持 SQLite、MySQL、PostgreSQL 数据库类型,命令行参数增加 --db 选项指定连接字符串。 - SKILL.md 增加数据库连接字符串示例和相关命令说明,提升易用性。 - 小幅优化脚本参数说明和文档结构。 - 更新 _meta.json 以反映功能拓展。
v1.1.0
- Added scripts for metadata generation and data lineage analysis: generate_metadata.py and lineage_analysis.py. - Updated metadata to reflect new script capabilities. - Expanded skill functionality to include automated metadata generation and lineage analysis via command line.
v1.0.0
Initial release of the data-governance skill. - Provides tools for data quality assessment, metadata management, lineage tracing, standard definition, and compliance checking. - Supports key tasks such as missing/duplicate value detection, metadata documentation, and lineage analysis. - Includes typical usage scenarios and sample command-line scripts for common operations. - Outputs structured reports for governance tasks, including quality metrics, metadata stats, and recommendations.
Metadata
Slug data-governance
Version 1.10.1
License MIT-0
All-time Installs 0
Active Installs 0
Total Versions 12
Frequently Asked Questions

What is Data Governance?

数据治理与资产管理技能。用于数据质量评估、元数据管理、数据血缘追踪、数据标准制定、数据合规检查等任务。 It is an AI Agent Skill for Claude Code / OpenClaw, with 313 downloads so far.

How do I install Data Governance?

Run "/install data-governance" in the OpenClaw or Claude Code chat to install it in one step — no extra setup required.

Is Data Governance free?

Yes, Data Governance is completely free, licensed under MIT-0. You can download, install and use it at no cost.

Which platforms does Data Governance support?

Data Governance is cross-platform and runs anywhere OpenClaw / Claude Code is available (cross-platform).

Who created Data Governance?

It is built and maintained by XingjianLiu0417 (@xingjianliu0417); the current version is v1.10.1.

💬 Comments