← 返回 Skills 市场
zd200572

species_identification_sequence_blast_annotation_tool

作者 Dong Zhao · GitHub ↗ · v1.0.0 · MIT-0
cross-platform ✓ 安全检测通过
166
总下载
0
收藏
0
当前安装
1
版本数
在 OpenClaw 中安装
/install blast-species-identification
功能描述
提供基于BLAST的FASTA序列和OTU表Top ASV的物种注释,支持映射文件、延迟设置和断点续传功能。
使用说明 (SKILL.md)

BLAST 物种注释工具技能

描述

提供BLAST物种注释工具的使用指南和快速调用功能。包含两个主要工具:

  • blast_annotation_tool.py - 对指定FASTA序列进行BLAST注释
  • top_asv_blast.py - 从OTU表提取Top ASV并进行BLAST注释

安装依赖

pip install biopython

工具一:blast_annotation_tool.py

基本用法

# 基本用法:输入FASTA文件和输出目录
python3 blast_annotation_tool.py sequences.fasta results/

# 使用序列ID到样本名的映射文件
python3 blast_annotation_tool.py sequences.fasta results/ --mapping mapping.csv

# 跳过已存在的结果(断点续传)
python3 blast_annotation_tool.py sequences.fasta results/ --skip-existing

参数说明

  • input: 输入FASTA文件路径 (必填)
  • output: 输出目录路径 (必填)
  • --mapping, -m: 序列ID到样本名的映射文件 (CSV格式)
  • --delay, -d: 每次BLAST请求之间的延迟秒数 (默认: 3)
  • --hits, -n: 每个样本保留的BLAST hits数量 (默认: 10)
  • --skip-existing, -s: 跳过已存在的结果文件 (默认: False)

工具二:top_asv_blast.py

基本用法

# 基本用法
python3 top_asv_blast.py taxa_table.xls rep.fasta results/

# 跳过已存在的结果(断点续传)
python3 top_asv_blast.py taxa_table.xls rep.fasta results/ --skip-existing

# 自定义参数
python3 top_asv_blast.py taxa_table.xls rep.fasta results/ --delay 5 --hits 20

参数说明

  • otu_table: OTU表文件 (.xls, .tsv, .csv) (必填)
  • fasta: 代表性序列FASTA文件 (必填)
  • output: 输出目录路径 (必填)
  • --top-n, -n: 每个样本提取前N个ASV (默认: 1)
  • --delay, -d: 每次BLAST请求之间的延迟秒数 (默认: 3)
  • --hits: 每个ASV保留的BLAST hits数量 (默认: 10)
  • --skip-existing, -s: 跳过已存在的结果文件 (默认: False)

输入文件格式

FASTA文件

>ASV1
TAGGGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAG...
>ASV2
TAGGGAATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAG...

映射文件 (可选)

CSV格式,第一列为序列ID,第二列为样本名:

ASV1,D1-8
ASV2,J2-8
ASV3,D3-8

OTU表格式

  • 第一列:ASV/OTU ID
  • 中间列:样本序列计数(支持重复样本自动合并)
  • 最后一列:Taxonomy注释

输出文件

  • 每个样本的BLAST结果CSV文件
  • 汇总表 (blast_summary.csv)
  • Top ASV信息表 (top_asv_info.csv)

注意事项

  1. 需要网络连接访问NCBI BLAST服务
  2. 每次比对可能需要几秒到几十秒
  3. 建议使用--delay参数避免请求过于频繁
  4. 使用--skip-existing可实现断点续传

快速调用

当您需要进行BLAST物种注释时,只需说:

  • "使用blast注释工具"
  • "运行top asv blast"
  • "BLAST物种注释指南"

我会为您提供详细的参数说明和使用方法。

安全使用建议
This skill appears to do exactly what it claims: extract ASV sequences from FASTA/OTU inputs, send them to NCBI BLAST via Biopython, and write CSV results. Before installing or running, check: (1) confirm the filename mismatch (SKILL.md references blast_annotation_tool.py but the repository has blast_annotation.py) and adjust calls accordingly; (2) you will transmit sequence data to NCBI—ensure this is acceptable for privacy/compliance; (3) install Biopython (pip install biopython) and be mindful of NCBI rate limits (use --delay); (4) inspect the hardcoded SAMPLE_TOP_ASV mapping in blast_annotation.py — it may be specific to a dataset and could need updating for your data. If you need the skill to run without network access, it will not work because it relies on NCBI's online qblast service.
功能分析
Type: OpenClaw Skill Name: blast-species-identification Version: 1.0.0 The skill bundle provides legitimate bioinformatics tools for species identification using the NCBI BLAST service. The Python scripts (blast_annotation.py and top_asv_blast.py) use the standard Biopython library to perform online sequence alignments and process the results into CSV reports, with appropriate rate-limiting delays. No evidence of data exfiltration, malicious execution, or prompt injection was found.
能力评估
Purpose & Capability
The skill description (BLAST-based species annotation) matches the included Python scripts which call NCBI BLAST via Biopython. Minor inconsistency: SKILL.md refers to 'blast_annotation_tool.py' while the repository provides 'blast_annotation.py' — the filename mismatch should be verified but does not imply malicious behavior.
Instruction Scope
SKILL.md instructs reading FASTA/OTU files and calling BLAST; the scripts read those files, run NCBIWWW.qblast, parse results, and write CSV summaries. They do not access unrelated system files, environment variables, or external endpoints beyond NCBI BLAST.
Install Mechanism
No automated install spec is provided (instruction-only). SKILL.md asks users to 'pip install biopython', which is appropriate. There is no download/extract of remote code in the install step; included scripts will run locally.
Credentials
The skill requires no credentials or environment variables. Network access to NCBI BLAST is necessary and expected for the stated purpose. No unrelated secrets, keys, or config paths are requested.
Persistence & Privilege
The skill does not request permanent presence (always:false) and does not modify other skills or system-wide configuration. It runs as a local script when invoked.
如何使用
  1. 确保已安装 OpenClaw(本地或 Docker 部署)
  2. 在对话框中输入安装命令:/install blast-species-identification
  3. 安装完成后,直接呼叫该 Skill 的名称或使用 /blast-species-identification 触发
  4. 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
版本历史
v1.0.0
Initial release of BLAST 物种注释工具技能: - 提供两大工具脚本(blast_annotation_tool.py 和 top_asv_blast.py)的详细使用指南。 - 支持对FASTA序列或OTU表中的Top ASV进行BLAST注释,含常用参数(如批量处理、断点续传、延迟控制等)。 - 详细说明输入输出文件格式、依赖安装方式和注意事项。 - 支持用户通过自然语言快速调用和获取使用指南。
元数据
Slug blast-species-identification
版本 1.0.0
许可证 MIT-0
累计安装 0
当前安装数 0
历史版本数 1
常见问题

species_identification_sequence_blast_annotation_tool 是什么?

提供基于BLAST的FASTA序列和OTU表Top ASV的物种注释,支持映射文件、延迟设置和断点续传功能。 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 166 次。

如何安装 species_identification_sequence_blast_annotation_tool?

在 OpenClaw 或 Claude Code 对话框中运行命令「/install blast-species-identification」即可一键安装,无需额外配置。

species_identification_sequence_blast_annotation_tool 是免费的吗?

是的,species_identification_sequence_blast_annotation_tool 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。

species_identification_sequence_blast_annotation_tool 支持哪些平台?

species_identification_sequence_blast_annotation_tool 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。

谁开发了 species_identification_sequence_blast_annotation_tool?

由 Dong Zhao(@zd200572)开发并维护,当前版本 v1.0.0。

💬 留言讨论