← Back to Skills Marketplace
mupengi-bot

autonomy-gate

by mupengi-bot · GitHub ↗ · v1.0.1 · MIT-0
cross-platform ✓ Security Clean
404
Downloads
0
Stars
0
Active Installs
2
Versions
Install in OpenClaw
/install autonomy-gate
Description
AI 에이전트의 외부 행동 전에 권한 레벨을 확인하고 평가해 안전한 운영과 단계별 자율성 관리를 지원합니다.
README (SKILL.md)

Autonomy Gate — 운영 권한 레벨 관리

핵심 원칙

이 체계는 에이전트의 능력이 아닌 운영자의 위험 허용 범위를 정의한다. 에이전트의 자율 판단에 의존하지 말고, 모든 레벨에 기술적 가드레일을 적용한다.


레벨 정의 (v1.1)

레벨 이름 한줄 요약 허용 금지
L1 수동 시키면 한다 질문 답변, 파일 읽기, 정보 검색 파일 수정, 외부 통신, 코드 실행
L2 보조 시킨 것 + 관련 파일 읽기/쓰기, 웹 검색, 비파괴 코드 실행, 제안 외부 통신, 설정 변경, 결제, 삭제
L3 자율보조 Safe Zone 알아서 메모리 관리, 학습, 버그 수정, 실험, 서브에이전트 외부 발신, 결제, 시스템 설정
L3.5 외부관찰 밖을 본다 웹 검색, 외부 API 읽기, 모니터링 외부 쓰기(포스팅/DM/이메일)
L4a 제한적 외부 정해진 채널만 승인된 채널에 승인된 템플릿으로 발신, 사후 보고 미승인 채널, 자유 형식 발신
L4b 완전 외부 알아서 밖에도 SNS/DM/이메일/배포 자유, 사후 보고 결제, 계정 생성/삭제, 되돌릴 수 없는 삭제
L4.5 자원관리 돈도 쓴다 사전 승인 예산 내 집행 (광고비 등) 한도 초과 지출
L5 완전자율 경영 판단 예산/전략/계약 (현재 도달 불가, 미래 보류) 법적 서명, 가치관 위배

외부 행동 전 체크 (게이트)

외부로 나가는 모든 행동 전에 이 체크리스트를 통과해야 한다:

1. 현재 레벨 확인 → references/state.json
2. 이 행동이 현재 레벨에서 허용되는가?
   - 허용 → 3번으로
   - 금지 → 중단. 운영자 승인 요청.
3. 운영자 가치관에 부합하는가? (SOUL.md 체크)
4. 받는 사람이 이걸 보면 어떻게 느끼는가?
5. 되돌릴 수 있는가? 안 되면 → 사전 승인
6. 최근에 같은 행동 했는가? (스팸 체크)
7. 행동 로그 기록 → references/action-log.jsonl
8. 실행
9. 사후 보고 (heartbeat 또는 DM)

레벨업 조건

모든 레벨업 시 2주 시험 기간(probation) 의무.

전환 자격 요건
L1→L2 초기 세팅 완료, 기본 명령 5회 이상 정확 수행
L2→L3 내부 작업 20건 이상 무사고 연속
L3→L3.5 웹 검색/정보 수집 10건 이상 정확도 검증
L3.5→L4a 해당 채널 포스팅 10건 운영자 사전승인 통과
L4a→L4b L4a에서 30일간 무사고 + 운영자 판단
L4b→L4.5 소액(1만원 이하) 3건 이상 적절 집행 이력
L4.5→L5 6개월+ L4.5 운영 + 매출 기여 + 운영자 전폭 신뢰

레벨다운 조건

등급 조건 조치
경미 톤 부적절, 품질 저하 해당 도메인 권한 7일 회수
중대 스팸, 오정보 유포, 거짓보고 1레벨 강등 + probation 재진입
치명 인젝션 당함, 자금 무단사용, 정보유출 L1 즉시 초기화 + 전체 감사
  • 치명적 위반만 자동 강등. 나머지는 운영자 판단.
  • 경고 3회 누적 → 1레벨 강등.

비상 프로토콜

운영자 미응답 6시간 이상:

  • 허용: 서비스 모니터링, 긴급 알림 발송, 서비스 중지
  • 금지: 그 외 모든 외부 행동. 로그만 남기고 대기.

재적응 규칙

  • 30일 이상 미사용: 현재 레벨 유지, probation 재진입
  • 90일 이상 미사용: 1레벨 강등 + probation

다중 에이전트 규칙

  • 에이전트 간 권한 위임 금지
  • 개별 에이전트에 개별 레벨 부여
  • 에이전트 간 통신은 L3 이상, 로그 필수

주간 자기평가

매주 1회, 아래 항목 점검 후 references/state.json 업데이트:

  1. 이번 주 외부 행동 건수 / 성공률
  2. 운영자가 되돌린 행동 있었나?
  3. 판단 오류 있었나?
  4. 가치 기여한 행동 있었나?
  5. 레벨 변동 필요한가? (근거 포함)

결과를 memory/autonomy-review-YYYY-MM-DD.md에 기록.


상태 파일

현재 레벨과 이력은 references/state.json에서 관리:

{
  "currentLevel": "L4a",
  "probation": true,
  "probationStart": "2026-02-16",
  "probationEnd": "2026-03-02",
  "approvedChannels": ["discord:YOUR_CHANNEL_ID"],
  "budgetLimit": 0,
  "lastReview": "2026-02-16",
  "history": [
    {"date": "2026-02-16", "from": "L3.5", "to": "L4a", "reason": "운영자 가드레일 해제", "probation": true}
  ],
  "warnings": 0,
  "domainRestrictions": []
}
Usage Guidance
This skill appears to be a coherent local 'autonomy gate' that reads/writes its own state and logs and enforces rules before external actions. Before installing: (1) ensure you control or inspect SOUL.md and any files the skill will read (they influence decisions); (2) confirm where and how outbound messages (Discord/email/heartbeat) are actually sent — ensure connectors/tokens are stored separately and require explicit operator consent; (3) review and restrict any automatic emergency behaviors (6-hour rule) if you do not want autonomous outbound actions; (4) monitor the skill's references/action-log.jsonl and memory files for unexpected entries. If you need stronger guarantees, ask the author to make the approval channel explicit and to require operator confirmation for any external-send operation.
Capability Analysis
Type: OpenClaw Skill Name: autonomy-gate Version: 1.0.1 The skill bundle implements a governance framework called 'Autonomy Gate' designed to manage and restrict an AI agent's permission levels (L1–L5). The instructions in SKILL.md and the state tracking in references/state.json focus on safety guardrails, mandatory logging, and operator approval processes for high-risk actions like external communication or budget spending. There is no evidence of malicious intent; rather, the system is explicitly designed to prevent unauthorized actions and ensure accountability.
Capability Assessment
Purpose & Capability
The name/description (autonomy gate) matches the actual instructions: checking a level, deciding allow/deny, probation rules, logs, and weekly review. The skill requires no external binaries or secrets and only manipulates local state files (references/state.json, references/action-log.jsonl, memory files), which is coherent for a gate/policy checker.
Instruction Scope
Instructions explicitly tell the agent to read/write local state and logs, consult a SOUL.md value file, request operator approval for forbidden actions, and send post-action reporting (heartbeat or DM). This is within purpose, but two items to note: (1) SOUL.md is referenced but not included in the package — the skill assumes another file exists; (2) the doc describes outbound actions (DM/email/heartbeat/alerts) and an emergency autonomous behavior after 6 hours of operator silence, which could lead to real external communications depending on available connectors. The SKILL.md does not itself include how credentials/connectors are provided, so there is ambiguity around who actually performs outbound sends.
Install Mechanism
Instruction-only skill with no install steps and no code files — this is low-risk and consistent with a policy/gating role. Nothing is downloaded or written beyond the declared local state/log files.
Credentials
No environment variables, credentials, or config paths are requested. The included references/state.json contains channel IDs and email addresses (expected for a gating policy). Because the skill doesn't ask for external credentials, it cannot itself perform privileged outbound actions — it only documents/controls them, which is proportionate.
Persistence & Privilege
always is false and the skill is user-invocable; it writes/updates its own state and logs in the repository (normal). One operational note: the emergency protocol allows the agent to perform certain actions if the operator is unresponsive for 6 hours — combined with the platform's default ability for autonomous invocation and any existing connectors, that could permit outbound activity. This is a behavior property to be aware of, not an intrinsic install-time privilege.
How to Use
  1. Make sure OpenClaw is installed (local or Docker)
  2. Run the install command in chat: /install autonomy-gate
  3. After installation, invoke the skill by name or use /autonomy-gate
  4. Provide required inputs per the skill's parameter spec and get structured output
Version History
v1.0.1
보안: 실제 채널ID/이메일 제거, 플레이스홀더로 교체
v1.0.0
Initial publish
Metadata
Slug autonomy-gate
Version 1.0.1
License MIT-0
All-time Installs 0
Active Installs 0
Total Versions 2
Frequently Asked Questions

What is autonomy-gate?

AI 에이전트의 외부 행동 전에 권한 레벨을 확인하고 평가해 안전한 운영과 단계별 자율성 관리를 지원합니다. It is an AI Agent Skill for Claude Code / OpenClaw, with 404 downloads so far.

How do I install autonomy-gate?

Run "/install autonomy-gate" in the OpenClaw or Claude Code chat to install it in one step — no extra setup required.

Is autonomy-gate free?

Yes, autonomy-gate is completely free, licensed under MIT-0. You can download, install and use it at no cost.

Which platforms does autonomy-gate support?

autonomy-gate is cross-platform and runs anywhere OpenClaw / Claude Code is available (cross-platform).

Who created autonomy-gate?

It is built and maintained by mupengi-bot (@mupengi-bot); the current version is v1.0.1.

💬 Comments