Agentsop Aider
/install agentsop-aider
Aider SOP — 终端结对编程的操作系统
一句话:Aider 是“git 工作树 + tree-sitter 仓库地图 + 编辑格式 + 人类在环 REPL”的四元组。理解这四个原语,剩下的都是配置。
1. 何时激活本技能
下列任一情形成立时,按本 SOP 进入 Aider 工作模式:
- 任务是编辑已有 git 仓库里的代码(不是从零起项目)。
- 你能把改动范围收敛到 2–5 个文件,或愿意先用
/ask让模型借助 repo-map 把范围找出来。 - 你需要逐步可回滚的修改历史(每次编辑一个 commit,
/undo一步回退)。 - 你在终端里工作(tmux / 远程 ssh / CI);或者你在写一个把 Aider 当子进程驱动的 agent。
- 你关心编辑格式对模型质量的影响(diff / udiff / whole / patch 的选择问题)。
- 你需要 BYOM(自带模型),跑本地 LLM 或非主流厂商。
不应激活的反面信号:见 §6 反模式与边界。
2. 核心心智模型
2.1 四个原语
+------------------+ +------------------+ +------------------+ +------------------+
| 1. Git working | | 2. Tree-sitter | | 3. Edit format | | 4. REPL loop |
| tree | | repo-map | | (wire proto) | | (你在环里) |
| | | | | | | |
| - per-edit | | - symbol-level | | - diff / udiff | | - /ask /code |
| commit | | summary | | / whole / | | /architect |
| - /undo | | - PageRank over | | patch | | - 每轮人手确认 |
| - dirty 文件 | | import graph | | - 模型适配选择 | | - 不自主 |
| 先 commit 再编 | | - 动态预算 | | - JSON 是反模式 | | |
+------------------+ +------------------+ +------------------+ +------------------+
四者缺一不可:
- 去掉 git → 失去回滚与审计;
- 去掉 repo-map → 大仓库里 LLM 找不到正确文件(SWE-Bench Lite 上 repo-map 让 Aider 70.3% 命中正确文件 [aider.chat/2024/05/22/swe-bench-lite.html]);
- 用错 edit format → 出现“lazy coding”、SEARCH 块找不到、JSON 句法破坏(udiff 在 GPT-4 Turbo 上把 refactor 基准从 20% 拉到 61% [aider.chat/2023/12/21/unified-diffs.html]);
- 放弃 REPL → 退化为自主 agent,但 Aider 在 SWE-Bench 上恰好证明“人在环 + 多次尝试”比纯自主链路更稳。
2.2 LLM 看到的上下文分三层(优先级递减)
| 层 | 内容 | 谁能改 |
|---|---|---|
| 系统提示 + 编辑格式说明 | Aider 固化 | Aider |
| 只读上下文 | repo-map + /read 文件 + CONVENTIONS.md |
你(通过 --read) |
| 读写上下文 | /add 的文件 |
LLM 只能编辑这里的文件 |
铁律:LLM 只允许编辑
/add-ed 的文件。这是 Aider 的安全边界。模型“改错了文件”几乎总是因为该文件没/add或你/add了太多无关文件。
2.3 上下文预算(25k 信号阈)
"Above about 25k tokens of context, most models start to become distracted." [aider.chat/docs/troubleshooting/edit-errors.html]
把这条当硬约束:超过 25k tokens,编辑准确率断崖式下降。/tokens 持续监控。
2.4 Repo-map 不是 RAG
repo-map 是 tree-sitter 提取的符号清单(类、函数、签名),用 PageRank 在源文件依赖图上排序,塞给 LLM 当地图。这不是 embedding 检索。
为什么不用 embeddings:
- LLM 能读签名,但读不懂向量。
- 不需要维护索引/重建/失效;代码改了下次自动重生成。
/map可以打印出来人工审计,向量做不到。
预算是动态的:你不 /add 任何文件时,map 占用大;/add 了正确文件后,map 自动缩小,省下的 token 给真正的代码。
2.5 编辑格式是“模型适配问题”,不是“用户偏好”
| 格式 | 谁用 | 强项 | 弱项 |
|---|---|---|---|
whole |
弱模型 / GPT-3.5 / 应急回退 | 解析最稳,无 merge 错误 | 贵;4k 输出上限会截断 |
diff (SEARCH/REPLACE) |
GPT-4o, Sonnet, 多数强模型 | token 高效 | SEARCH 块必须字节匹配 |
diff-fenced |
Gemini 系列 | 路径放在 fence 内 | 非主流 |
udiff |
GPT-4 Turbo (1106) | 模仿 patch 程序的严格性,降低 laziness | 提示更重 |
patch |
GPT-4.1 (OpenAI patch 协议) | 多动作鲁棒 | 模型特定 |
editor-diff / editor-whole |
architect 模式的 editor 子模型 | 提示更瘦,专注编辑 | 仅在 architect 下有意义 |
Aider 已经对常见模型选好默认值;只有出现编辑错误时才覆盖。
⇒ 不要把代码编辑包进 JSON tool-call。所有模型在 Aider 的实测里都因此变差,包括 Sonnet(详见 §5 案例 6 与引文)。
3. SOP 工作流
Phase 1 — Bootstrap(每次会话开始)
# 0. 在 git 仓库根目录。stash 或 commit 在途修改。
git status
# 1. 选模型(榜单当前前列:gpt-5, claude-3.7-sonnet, o3-pro, gemini-2.5-pro)
# [aider.chat/docs/leaderboards/]
# 2. 最小启动 — 让 repo-map 帮 LLM 自己找路
aider
# 3. 范围已知 — 直接预加 + 风格文件
aider src/auth.py tests/test_auth.py --read CONVENTIONS.md
# 4. 强思考 + 廉价编辑(architect 模式)
aider --architect --model o1-preview --editor-model gpt-4o
# 5. 自动测试回路
aider --test-cmd "pytest -x" --auto-test
# 6. 巨型 monorepo
cd packages/feature-foo && aider --subtree-only
# 并维护 .aiderignore
Phase 2 — 收敛范围(/add 纪律)
不知道改哪个文件?
→ /ask which files implement \x3Cfeature>? (LLM 用 repo-map 回答)
→ /add 它命名的文件(只加这些)
知道改哪个文件?
→ 启动时 CLI 直接传,或 /add path/to/file.py
需要参考但不允许改的文件(schema, config, conventions)?
→ /read path/to/ref.md
铁律重申:少 /add,敢 /drop。/tokens 看现状。
Phase 3 — 讨论再动手(/ask → /code)
> /ask 当前的 auth 怎么实现?如果改成 JWT 会有什么破坏?
\x3C [模型基于 repo-map + 已 /add 的文件作答]
> /ask 那我们用 PyJWT 还是 authlib?给出权衡。
\x3C [...]
> /code 按刚才讨论的方案,把 sessions 改成 JWT。
\x3C [模型给出 diff]
[Aider 自动应用 → 自动 git commit]
> /test pytest
\x3C [失败时模型看到输出并尝试修复]
"Break your goal down into bite sized steps. Do them one at a time." [aider.chat/docs/usage/tips.html]
Phase 4 — Architect 模式(reasoning ≠ editing)
何时开启:你最好的 reasoner 编辑能力差(典型:o1-preview 单独跑 79.7%,搭配 Sonnet 当 editor 拉到 82.7% [aider.chat/2024/09/26/architect.html])。
| 组合 | Polyglot Pass@2 | 备注 |
|---|---|---|
| o1-preview (architect) + o1-mini (editor, whole) | 85% | SOTA 当时;慢,不适合交互 |
| o1-preview + Sonnet | 82.7% | "entirely practical" |
| Sonnet + Sonnet | 80.5% | 比单跑 77.4% 高 |
| GPT-4o + GPT-4o | 75.2% | 比单跑 71.4% 高 |
启用:--architect 或 /architect。Aider 自动把 editor 切到 editor-diff / editor-whole。
Phase 5 — 验证(lint / test / run)
/lint # 默认 --auto-lint 已开
/test pytest -x # 失败时输出回填到 chat
/run npm run typecheck # 输出可选择性回填
/diff # 看上一轮的 diff
"Aider will try and fix any errors if the command returns a non-zero exit code." [aider.chat/docs/usage/lint-test.html]
formatter 注意:把会重写文件并返回非零的 formatter 包装在双跑脚本里(第一遍 format,第二遍验证)。
Phase 6 — 上下文卫生
| 症状 | 操作 |
|---|---|
/tokens > 25k |
/drop 不再需要的文件 |
| 话题切换 | /clear(保留文件,清历史) |
| 想全新开始 | /reset(丢文件 + 清历史) |
| 模型反复改错文件 | /ls 检查;/drop 多余的;/add 缺的 |
| 反复 edit format 错误 | /clear;换模型;--edit-format whole 兜底 |
Phase 7 — 收尾
git log --oneline看一次会话的提交链。- 想压成一个 feature commit:
git rebase -i HEAD~N(先保留中间 commit 当 undo 栈,最后压)。 - 提 PR — 提交信息已经是 Conventional Commits 风格。
4. 操作模型(命令速查)
源:[aider.chat/docs/usage/commands.html]
/add \x3Cfiles> 把文件加入 chat(LLM 可编辑)
/read \x3Cfile> 加为只读(LLM 不能编辑)
/drop \x3Cfiles> 从 chat 移除
/ls 列出已知文件 + 标注哪些在 chat 里
/ask \x3Cq> 只讨论,不动文件
/code \x3Creq> 明确要求改代码(不加前缀也行)
/architect \x3Creq> 双模型 architect+editor
/model \x3Cname> 切换主模型
/clear 清 chat 历史(保留文件)
/reset 丢文件 + 清历史
/tokens 当前 token 占用
/map 打印当前 repo-map
/diff 上一轮的 diff
/undo 回退最近一次 Aider commit
/commit 为 chat 外的改动生成 commit
/run \x3Ccmd> 跑命令,可选回填输出(别名 !)
/test \x3Ccmd> 跑测试,失败时回填
/web \x3Curl> 抓网页转 markdown 进 chat
/copy 复制最后一条回复
/help \x3Cq> 关于 Aider 本身的问题
CLI 关键标志:
--model X 主模型
--editor-model Y editor 子模型(architect 用)
--edit-format whole|diff|udiff|patch
--editor-edit-format ... editor 子模型的格式
--architect 进入 architect 模式
--read FILE 只读上下文(可多次)
--map-tokens N repo-map 预算;N=0 关闭
--subtree-only 仅本子目录 + 子树
--auto-lint / --no-auto-lint
--test-cmd CMD --auto-test
--no-auto-commits 关掉自动提交(不建议)
--no-git 完全脱 git(失去安全保障)
--message "..." 一次性非交互模式(脚本/agent 用)
--yes 全部确认(脚本/agent 用)
配置文件:.aider.conf.yml(持久 CLI 默认)、.aiderignore(排除 repo-map 路径)、CONVENTIONS.md(用 --read 加载)。
5. 困境决策案例 (Examples / Scenarios)
案例 1 — “模型一直改错文件”
触发:LLM 改的不是你想改的文件,或编造路径。
诊断:LLM 只能安全编辑 /add 的文件。要么目标没 /add,要么 /add 太多导致干扰。
决策规则:
/ls看现状。- 缺目标 →
/add path/to/target.py。 - 太多文件(>4–5 或 tokens > 25k)→
/drop无关的。 - 不知道哪个文件 →
/ask which file implements X?,让 repo-map 替你答。
为什么有效:/add-ed 文件就是写集合(write-set)。repo-map 只是可读地图,不是写集合。
案例 2 — “大仓库里上下文炸了”
触发:tokens 涨到 25–50k+,响应被截断,模型在 monorepo 上明显变笨。
决策规则(从最便宜的做起):
| 步 | 动作 |
|---|---|
| 1 | /tokens 看占用分布 |
| 2 | /drop 不再需要的文件 |
| 3 | /clear 清聊天历史(保留文件) |
| 4 | --map-tokens 1024(或弱模型 0) |
| 5 | monorepo:进子目录 + --subtree-only;加 .aiderignore |
| 6 | 拆任务:每个子任务一个会话 |
关键认知:不要“为了保险全 /add”。SWE-Bench 数据,只靠 repo-map Aider 仍然 70.3% 选对文件 [aider.chat/2024/05/22/swe-bench-lite.html]。
案例 3 — “diff 格式不停 hallucinate / SEARCH 块找不到”
触发:Aider 报 “SEARCH block not found in file”。
诊断:模型给的 SEARCH 文本和文件字节不匹配(空白、前次失败后状态漂移、纯臆造)。
决策规则:
/tokens— 接近 25k 时合规率下降。/drop+/clear减负。- 升级模型;弱模型“更容易违背系统提示” [aider.chat/docs/troubleshooting/edit-errors.html]。
- 兜底格式:
--edit-format whole。贵但稳。 - 试
--architect—— 双步流程对“执行编辑指令”的依从性更高。
历史教训:GPT-4 Turbo 上 unified-diff 把 refactor 基准从 20% 拉到 61%,并把 “lazy comment” 砍到 1/3 [aider.chat/2023/12/21/unified-diffs.html]。说明 格式工程的边际收益经常高于换模型。
案例 4 — “architect 模式值得花这个钱吗?”
触发:硬推理任务;你有 o1/o3(强 reasoner,但编辑差)。
决策规则:
| 情况 | 建议 |
|---|---|
| reasoner 编辑也干净(GPT-4o, Sonnet) | 不开 architect。单跑就行 |
| reasoner 编辑差(o1-preview 单跑 79.7%) | 开 architect:o1-preview + Sonnet → 82.7% |
| 追 SOTA、能等 | o1-preview + DeepSeek/o1-mini whole → 85%(慢,"probably not practical for interactive use") |
| 例行编辑 | 单跑更快更省 |
反直觉点:连 Sonnet 自配 editor 也涨(77.4 → 80.5%)。但 +3pp 是否值翻倍的 token 成本,取决于场景。
案例 5 — “Sonnet 写超长被 4k 截断”
触发:Claude 3.5 Sonnet 回复在编辑中段截断。
诊断:Sonnet 倾向写太多——整文件 SEARCH/REPLACE 而不是最小 diff [aider.chat/2024/07/01/sonnet-not-lazy.html]。
决策规则:
- 升级 Aider;它已经支持 “multiple 4k token responses... seamlessly combines them” 并加了精简提示。修复后 Sonnet 的 refactor 基准 55.1 → 64.0%。
- 还截断时,手动追加:“Make minimal SEARCH/REPLACE blocks. Do not quote unchanged sections.”
案例 6 — “该用 JSON tool-call 包代码吗?”
触发:自建 agent 包 Aider 时考虑结构化 tool-call。
决策规则:不要把代码包进 JSON tool-call。
"All of the models did worse on the benchmark when asked to return code in a structured JSON response." [aider.chat/2024/08/14/code-in-json.html]
即便用 OpenAI strict mode 强制 JSON 合法,JSON 里的代码本身也劣化(更多 SyntaxError / IndentationError)。若 harness 必须 tool-call,把代码塞单一字符串字段,并预期质量损失。
6. 反模式与边界
不要用 Aider 的场景
| 场景 | 替代 |
|---|---|
| 从零起项目(无 git history、无现有代码) | Cursor 一类,或纯 LLM 对话 |
| 跨千个文件的机械重构 | 先用 sed / AST 工具 / IDE 重构;Aider 收尾语义部分 |
| 不能用 git 的工作流(Perforce-only、二进制资产) | 别用 Aider;它的安全保障建立在 git 之上 |
| 需要 IDE/浏览器感知(实时 diagnostics、devtools) | Cline / Continue / Cursor — Aider 看不到 IDE |
| 完全自主的 ticket→PR | OpenHands / Devin — Aider 是人在环设计 |
常见错误
- 多
/add求保险——反而干扰模型。/drop才是常态操作。 - 忽略 repo-map——以为“模型不知道”就乱加文件。
/map看一下它已经知道什么。 - architect 模式用弱 editor——再好的 reasoner,editor 不会写格式也白搭。Sonnet / DeepSeek / GPT-4o 才是合格 editor。
- 不
/clear——长会话历史漂移会让模型“记住错的东西”。话题切换就清。 - 关 auto-commit “保历史干净”——失去
/undo栈。正确做法是事后git rebase -i压。 - CONVENTIONS.md 不写——风格(用 httpx 不用 requests、加 type hints)反复纠正不如一次写进
--read CONVENTIONS.md;formatter 返回非零会搞砸 auto-lint,用双跑脚本包一下。
Aider 有意不做的事(硬边界)
- 不渲染 IDE(保持终端纯净)。
- 不维护 embedding 索引(repo-map 按需重生成)。
- 默认不自主(人在环是设计哲学,Paul 论证过这是生产力优势)。
- 一会话一仓库(跨仓库需要更高层编排)。
- 无跨会话长期记忆(持久化靠 CONVENTIONS.md、
.aider.conf.yml、git history 本身)。
7. 生态对照
| Aider | Cline | Cursor | Continue | OpenHands | |
|---|---|---|---|---|---|
| 表面 | 终端 REPL | VS Code 扩展 | 闭源 IDE(VS Code fork) | VS Code + JetBrains 扩展 | Web UI + Docker 沙箱 |
| 开源 | Apache 2.0 | 是 | 否 | 是 | MIT |
| 编辑原语 | diff/udiff/whole 文本 + git commit | tool-call + 每步人审 | 内嵌 Composer 多文件 | Edit/Chat/Agent/Autocomplete | 自主 plan→edit→test→PR |
| 上下文 | tree-sitter repo-map + 选择性 /add | 按需 tool-call 读 | 全仓库索引 | RAG | agentic 读 |
| 人审 | 每轮(/undo 兜底) |
每个 tool-call | 每次 Composer apply | 每次 edit | 无 |
| Git 集成 | 原生(每编辑一 commit) | 通过终端工具 | 手动 | 手动 | 沙箱里 PR |
| BYOM | 是(100+,经 LiteLLM) | 是 | 受限 | 是 | 是 |
来源:[frontman.sh/blog/best-open-source-ai-coding-tools-2026]、[cline.bot/blog/top-9-cursor-alternatives-in-2025]、[opensourcealternatives.to]、[shakudo.io/blog/best-ai-coding-assistants]。
何时选 Aider 而非其他
- 你住在终端:tmux + vim/emacs + Aider 是经典栈,零 IDE 切换。
- 你要 git-clean 历史:per-edit commit 自动产出可审计提交链。
- 你在写 agent:
--message、--yes、配置文件 → 子进程驱动友好。 - 你关心编辑格式工程:Aider 在 udiff、architect、JSON-vs-text 上有最多公开实验数据。
- 你要确定性上下文:tree-sitter 地图可
/map检查、可复现、无向量库依赖。 - 任务已收敛:你知道 2–5 个目标文件。
反过来选别的
- Cline:要 VS Code 内每个编辑 / shell 命令的逐步确认。Aider 是事后
/undo;Cline 是事前 approve。 - Cursor:要内嵌 diff 浮层、ghost-text 自动补全、视觉化文件上下文指示。
- Continue:要跨 IDE(VS Code + JetBrains)一致体验,要 autocomplete + chat + agent 一体。
- OpenHands:要自主ticket→PR;issue 进、PR 出。Aider 没瞄准这场景。
Aider 留给 agent-coder 的研究遗产
即便你选别的前端,Aider 的公开实验是这些决定的参考:编辑格式选择(GPT-4 Turbo refactor 20%→61%)、repo-map 战胜 RAG(SWE-Bench Lite 70.3%)、architect+editor 拆分(79.7%→85%)、JSON-vs-text 劣化、lazy-coding 缓解——具体数据见前文各节。
引用源
- [aider.chat/docs/usage.html] [aider.chat/docs/usage/tips.html] [aider.chat/docs/usage/modes.html] [aider.chat/docs/usage/commands.html] [aider.chat/docs/usage/conventions.html] [aider.chat/docs/usage/lint-test.html]
- [aider.chat/docs/repomap.html] [aider.chat/docs/more/edit-formats.html] [aider.chat/docs/git.html] [aider.chat/docs/faq.html]
- [aider.chat/docs/troubleshooting/edit-errors.html] [aider.chat/docs/troubleshooting/token-limits.html]
- [aider.chat/docs/leaderboards/]
- [aider.chat/2023/12/21/unified-diffs.html] [aider.chat/2024/04/09/gpt-4-turbo.html] [aider.chat/2024/05/22/swe-bench-lite.html] [aider.chat/2024/07/01/sonnet-not-lazy.html] [aider.chat/2024/08/14/code-in-json.html] [aider.chat/2024/09/26/architect.html]
- [aider.chat/HISTORY.html]
- [github.com/Aider-AI/aider](生态对照来源见 §7)
- 确保已安装 OpenClaw(本地或 Docker 部署)
- 在对话框中输入安装命令:
/install agentsop-aider - 安装完成后,直接呼叫该 Skill 的名称或使用
/agentsop-aider触发 - 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
Agentsop Aider 是什么?
SOP for terminal-based, git-native AI pair programming with Aider (git work-tree + tree-sitter repo-map + edit-format + human-in-loop REPL). Use when editing... 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 26 次。
如何安装 Agentsop Aider?
在 OpenClaw 或 Claude Code 对话框中运行命令「/install agentsop-aider」即可一键安装,无需额外配置。
Agentsop Aider 是免费的吗?
是的,Agentsop Aider 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。
Agentsop Aider 支持哪些平台?
Agentsop Aider 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。
谁开发了 Agentsop Aider?
由 HengJun Wang(@agentsope)开发并维护,当前版本 v0.1.1。