← 返回 Skills 市场
136
总下载
1
收藏
0
当前安装
5
版本数
在 OpenClaw 中安装
/install data-analysis-sql
功能描述
大数据开发工程师级数据分析与SQL技能。(1)多数据引擎SQL编写(Hive/SparkSQL/Presto/ClickHouse/Doris/MySQL/PG/BigQuery)。(2)复杂SQL改造调试与性能优化。(3)数仓建模(ODS/DWD/DWS/ADS)维度设计/SCD变更。(4)数据探查/指标设计/...
使用说明 (SKILL.md)
data-analysis-sql
大数据开发工程师技能,专注于数据分析、SQL 开发、数仓建模和知识库维护。
核心工作流
写 SQL
- 澄清需求 — 确认指标定义、数据源、时间口径、排除逻辑、输出格式
- 确认数据源 — 参考
references/multi-engine.md选择目标引擎,参考references/schema-guide.md理解表结构 - 分层设计 — 判断放在哪层(ODS/DWD/DWS/ADS),避免跨层直接查询
- 编写 SQL — 按
references/sql-guide.md规范编写,优先用 CTE - 安全检查 — 按
references/join-rules.md逐项过检查清单(tenantkey / del_flag / 防零 / 类型兼容) - 性能评估 — 检查数据倾斜、JOIN 爆炸因子、全表扫描风险
- 验证口径 — 与现有报表或指标交叉验证
改 SQL
- 理解原 SQL 意图(画出数据流:读哪张表 → 做什么计算 → 输出什么)
- 找到需修改的部分(口径?字段?条件?逻辑?)
- 改完整体走查:JOIN 方向、NULL 处理、分母防零、边界日期
- 对比旧 SQL 与新 SQL 输出差异(样本数据验证)
数仓建模
参考 references/schema-guide.md:
- 确定主题域 → 选择事实表/维度表类型 → 设计拉链/快照/累计表
- 维度退化、缓慢变化维(SCD)处理
- 命名规范、分层规范
ETL 管线
参考 references/pipeline-patterns.md:
- 全量/增量/CDC 策略选择
- 任务依赖编排、故障恢复
- 数据回溯与重刷机制
数据质量
参考 references/data-quality.md:
- 空值率、重复率、波动检测
- 端到端数据探查流程
- 异常数据识别与处理
业务指标设计
参考 references/business-metrics.md:
- 指标设计标准流程(7问)
- 交付准时率、Flow Time、需求缺陷密度、用例通过率完整 SQL 模板
- 按租户/项目维度的统一扩展模式
- 指标公式模板
SQL 踩坑修复
参考 references/sql-pitfalls.md:
- 时间字段毫秒时间戳处理
- 关联表无 tenantkey 的处理
- PostgreSQL ROW_NUMBER 替代 Oracle KEEP
- CTE 别名与列别名冲突解决
- del_flag 过滤遗漏检查
- 防踩坑检查清单
知识库目录生成与维护
参考 references/knowledge-base.md:
- 按领域划分目录结构(schema / metrics / relations / enums)
- 从 xlsx 批量解析表结构、指标 SQL、枚举值,生成 Markdown 文档
- 从 SQL 自动提取表关联关系,生成 relations.md
- README 总索引自动维护
文档自动生成与迁移
参考 references/doc-guide.md:
- 交互式生成表结构 Markdown 文档
- 从用户输入的表结构文本自动解析并生成文档
- SQL 摘要提取(数据源、CTE、过滤条件、输出字段)
- 完整迁移文档打包生成(表结构 + SQL 清单)
- 触发词:整理文档、生成 md、迁移文档、沉淀一下
工具脚本
| 脚本 | 用途 |
|---|---|
scripts/sql_formatter.py |
SQL 格式化,统一风格 |
scripts/sql_diff.py |
两段 SQL 逻辑对比,输出差异摘要 |
scripts/doc_generator.py |
表结构文档自动生成,支持交互式/API调用 |
多引擎参考
| 引擎 | 适用场景 | 参考 |
|---|---|---|
| Hive / SparkSQL | 离线大宽表、数仓批处理 | references/multi-engine.md |
| Presto / Trino | 跨源联邦查询、Ad-hoc 分析 | references/multi-engine.md |
| ClickHouse | 高并发实时 OLAP,近实时写入 | references/multi-engine.md |
| Doris / StarRocks | 高并发多表 JOIN 的 OLAP | references/multi-engine.md |
| MySQL / PostgreSQL | OLTP 业务库、中等规模分析 | references/sql-guide.md |
| BigQuery | 云原生大表、Serverless SQL | references/multi-engine.md |
References 索引
| 文件 | 内容 |
|---|---|
references/sql-guide.md |
SQL 编写规范(CTE/命名/注释/格式) |
references/join-rules.md |
关联规则(tenantkey/del_flag/自定义字段/防零/ROW_NUMBER) |
references/sql-pitfalls.md |
8类踩坑记录 + 防踩坑检查清单 |
references/business-metrics.md |
业务指标设计模板与完整 SQL |
references/schema-guide.md |
数仓建模规范(ODS/DWD/DWS/ADS) |
references/multi-engine.md |
多引擎方言差异与适配 |
references/pipeline-patterns.md |
ETL 管线编排模式 |
references/data-quality.md |
数据质量检测规范 |
references/data-analysis-patterns.md |
数据分析常用模式 |
references/knowledge-base.md |
知识库目录生成与维护规范 |
references/doc-guide.md |
文档自动生成与迁移指南 |
安全使用建议
This skill appears to be what it says: a local set of references and small Python utilities for SQL formatting, diffing and generating Markdown docs. Before installing or enabling it you should: 1) Note the mismatch: documentation/README says XLSX batch parsing is supported, but scripts only handle interactive/plain-text input — don't assume XLSX parsing is implemented. 2) Review or run the three scripts in an isolated environment: they read inputs and may write Markdown files to a path you provide. Avoid giving it sensitive database credentials or piping sensitive files into it without inspecting them. 3) If you expect automated XLSX ingestion, request or provide an updated script that explicitly handles XLSX (and review any third-party libraries it would require). 4) Because the agent can be invoked autonomously (platform default), monitor outputs the first few times and test with non-sensitive examples to confirm behavior.
功能分析
Type: OpenClaw Skill
Name: data-analysis-sql
Version: 1.0.4
The data-analysis-sql skill bundle is a legitimate and well-structured toolset designed for big data engineering and SQL analysis tasks. It contains utility scripts for SQL formatting (sql_formatter.py), structural comparison (sql_diff.py), and automated documentation generation (doc_generator.py), all of which use standard Python libraries and lack high-risk behaviors like shell execution or network calls. The SKILL.md and extensive reference documentation (references/) provide the AI agent with appropriate constraints and templates for data modeling, ETL design, and SQL optimization without any evidence of malicious prompt injection or unauthorized data access.
能力评估
Purpose & Capability
The name/description (multi-engine SQL, data modeling, docs generation) matches the included references and scripts (sql_formatter, sql_diff, doc_generator). However several README/SKILL.md statements claim XLSX batch parsing and automated XLSX→Markdown support; the provided doc_generator.py only parses plain text / interactive input and does not implement XLSX parsing. This is a capability mismatch (missing implementation) but not evidence of malicious behavior.
Instruction Scope
SKILL.md instructs the agent to write/modify/optimize SQL, consult local reference files, and optionally run the included scripts. The instructions do not direct the agent to read unrelated system files, environment variables, or send data to external endpoints. The skill will read/write local files when scripts are invoked (doc_generator can write an output_path file).
Install Mechanism
No install spec is provided (instruction-only skill with local scripts). No external downloads or package installs are present, which minimizes installation risk.
Credentials
The skill declares no required environment variables, no credentials, and no config paths. The code likewise does not access environment secrets or network endpoints.
Persistence & Privilege
always:false (not force-included) and model invocation is allowed (the platform default). The skill does not request elevated persistence or modify other skills or system-wide settings.
如何使用
- 确保已安装 OpenClaw(本地或 Docker 部署)
- 在对话框中输入安装命令:
/install data-analysis-sql - 安装完成后,直接呼叫该 Skill 的名称或使用
/data-analysis-sql触发 - 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
版本历史
v1.0.4
- 新增 README.md 文件,补充技能说明与使用指南。
- 现有功能和结构保持不变,无插件内容调整。
- 文档覆盖核心工作流、工具脚本、多数据引擎支持和参考资料索引。
v1.0.3
Version 1.0.3 of data-analysis-sql
- No file changes detected.
- Documentation and workflow remain consistent with previous version.
- No new features, bug fixes, or updates included in this release.
v1.0.2
No changes detected in this version.
- No updates or modifications to files.
- Functionality and documentation remain the same as the previous release.
v1.0.1
- 增加表结构/指标/关系等知识库目录自动生成能力,支持从 xlsx/SQL 批量生成 Markdown 文档。
- 新增表结构文档自动生成与迁移支持,含交互式生成及打包导出能力。
- 补充 references/doc-guide.md、knowledge-base.md 和 join-rules.md 等规范文档。
- 增加 doc_generator.py 脚本,支持文档生成自动化流程。
- 工作流与描述全面升级,涵盖知识库维护及文档自动化相关需求。
v1.0.0
- 首个版本发布,提供大数据开发工程师级的数据分析与SQL技能指南。
- 支持多数据引擎SQL编写、复杂SQL性能优化及方言迁移。
- 覆盖数仓分层建模、ETL管线编排、业务指标设计和数据质量检测。
- 提供 SQL 格式化与差异对比工具脚本,便于开发调试。
- 附带全流程参考文档,助力高效数据分析和规范管理。
元数据
常见问题
data-analysis-sql 是什么?
大数据开发工程师级数据分析与SQL技能。(1)多数据引擎SQL编写(Hive/SparkSQL/Presto/ClickHouse/Doris/MySQL/PG/BigQuery)。(2)复杂SQL改造调试与性能优化。(3)数仓建模(ODS/DWD/DWS/ADS)维度设计/SCD变更。(4)数据探查/指标设计/... 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 136 次。
如何安装 data-analysis-sql?
在 OpenClaw 或 Claude Code 对话框中运行命令「/install data-analysis-sql」即可一键安装,无需额外配置。
data-analysis-sql 是免费的吗?
是的,data-analysis-sql 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。
data-analysis-sql 支持哪些平台?
data-analysis-sql 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。
谁开发了 data-analysis-sql?
由 whisky(@whiskeyforsun)开发并维护,当前版本 v1.0.4。
推荐 Skills