← 返回 Skills 市场
be1human

ClawPhone Phone Control

作者 CLOUD BOY · GitHub ↗ · v1.0.0 · MIT-0
cross-platform ✓ 安全检测通过
406
总下载
1
收藏
1
当前安装
1
版本数
在 OpenClaw 中安装
/install clawphone-phone-control
功能描述
使用手机控制 MCP 完成手机界面感知与操作。适用于读取当前手机状态、打开 App、处理弹窗、点击控件、输入文本、排查手机自动化失败等场景。执行时优先读取界面状态,涉及坐标点击时必须基于当前截图临时判定,禁止把历史坐标当成通用规则。
使用说明 (SKILL.md)

\r \r

ClawPhone Phone Control\r

\r

快速流程\r

\r

  1. 先感知,再操作。\r
  2. 优先用文字/节点能力,坐标点击只在当前截图下临时使用。\r
  3. 脆弱流程必须一步一验,不要把多步盲打成“理应成功”。\r \r

感知优先级\r

\r

  1. 先用 get_screen_info 判断前台应用、分辨率、可见文字。\r
  2. 需要精确定位时,再用 capture_screen。\r
  3. 需要找标准控件时,优先 click_by_textfind_node。\r \r

操作原则\r

\r

  • 输入前先确认输入框真的已获焦。\r
  • 启动 App 后先确认前台应用真的切换成功。\r
  • 若工具返回“已点击”“已启动”“已输入”,仍要以界面复核为准。\r
  • 发送前先确认文本真的已经进入输入框。\r
  • 点击发送前先确认发送控件真实可见。\r
  • 发送后必须再次确认界面已变化,不要仅凭工具返回值认定成功。\r \r

启动 App\r

\r

  1. 可先调用 launch_app(...)。\r
  2. 立即用 get_current_appget_screen_info 确认前台应用是否真的切换。\r
  3. 若仍停留在桌面或其他 App,不要在同一路径上重复盲开。\r
  4. 先读取当前屏幕状态,再决定是否改用桌面图标点击、通知入口或其他页面内入口。\r \r

输入兜底\r

\r

  1. 先确认输入框已聚焦。\r
  2. 优先尝试 type_text(...)。\r
  3. type_text(...) 失败,或文本没有真正进入输入框,立即切到兜底链路:\r
    • set_clipboard(...)\r
    • 长按当前截图里的输入区域\r
    • 截图确认菜单\r
    • 基于当前截图临时点击 粘贴\r
  4. 粘贴后再次确认文本真的进入输入框,再继续后续操作。\r \r

坐标原则\r

\r

  • 坐标只对应“当前设备、当前页面、当前截图”。\r
  • 不要把一次成功的坐标写成固定流程。\r
  • 如果页面一变、键盘弹出、工具栏切换,之前的坐标立即失效,应重新截图。\r \r

失败排查\r

\r 按下面顺序定位失败点:\r \r

  1. 是否在正确页面。\r
  2. 是否点中了真实控件,而不是附近空白区域。\r
  3. 输入框是否真的聚焦。\r
  4. 文字是否真的进入输入框。\r
  5. 发送按钮是否真的出现且可点击。\r
  6. 操作后界面是否真的变化。\r
  7. 某条路径失败后,是否及时切换到更合适的兜底路径,而不是重复试错。\r \r

微信等脆弱场景\r

\r

  • 聊天发送属于脆弱流程,默认一步一验。\r
  • press_enter 只能作为兜底,不要把它当作“必然发送成功”的主路径。\r
  • 微信自定义弹窗通常不在无障碍树中,遇到菜单项时应截图后临时取坐标点击。\r \r

参考\r

\r

  • 需要工具说明时,读 tools-reference.md。\r
安全使用建议
This skill appears coherent and limited to controlling a phone via MCP primitives. Before installing, ensure the MCP toolset it expects actually exists and is trusted in your environment. Be aware the skill may use the device clipboard as a fallback — avoid sending highly sensitive secrets through clipboard/paste flows. Because the skill source/homepage is unknown, prefer installing only in environments where you trust the underlying MCP provider and have control over which device actions are permitted.
功能分析
Type: OpenClaw Skill Name: clawphone-phone-control Version: 1.0.0 The skill bundle provides a comprehensive set of tools and instructions for mobile device automation and interface interaction, including screen capture, text recognition, and input simulation. The instructions in SKILL.md and tools-reference.md focus on operational reliability and verification (e.g., confirming app launches and text entry) rather than malicious activities. No evidence of data exfiltration, unauthorized remote execution, or prompt injection attacks was found; the capabilities are consistent with the stated purpose of phone control.
能力评估
Purpose & Capability
Name/description say: control phone UI and perform screen-aware operations. The SKILL.md only references MCP perception and action primitives (get_screen_info, capture_screen, tap, type_text, launch_app, etc.), which are exactly what such a skill needs. No unrelated binaries, credentials, or config paths are requested.
Instruction Scope
Instructions consistently limit actions to reading the current screen and performing UI interactions on the device; they emphasize verification (one-step-one-check) and warn against reusing historical coordinates. No instructions to read host files, network‑exfiltrate data, or access unrelated system state are present.
Install Mechanism
No install spec and no code files — instruction-only. This is the lowest-risk install model and appropriate for a skill that delegates to existing MCP tooling.
Credentials
No environment variables, credentials, or external API keys are requested. The only sensitive operation is setting/using the device clipboard (documented in tools-reference), which is proportional to the described input/paste fallback.
Persistence & Privilege
always:false and user-invocable: true. The skill does not request permanent presence or to modify other skills/settings. Autonomous invocation is allowed by platform default but not a special privilege here.
如何使用
  1. 确保已安装 OpenClaw(本地或 Docker 部署)
  2. 在对话框中输入安装命令:/install clawphone-phone-control
  3. 安装完成后,直接呼叫该 Skill 的名称或使用 /clawphone-phone-control 触发
  4. 根据 Skill 的参数说明提供必要输入,即可获得结构化输出
版本历史
v1.0.0
Initial public release from App-Control project.
元数据
Slug clawphone-phone-control
版本 1.0.0
许可证 MIT-0
累计安装 1
当前安装数 1
历史版本数 1
常见问题

ClawPhone Phone Control 是什么?

使用手机控制 MCP 完成手机界面感知与操作。适用于读取当前手机状态、打开 App、处理弹窗、点击控件、输入文本、排查手机自动化失败等场景。执行时优先读取界面状态,涉及坐标点击时必须基于当前截图临时判定,禁止把历史坐标当成通用规则。 它是一个面向 Claude Code / OpenClaw 的 AI Agent Skill 插件,目前累计下载 406 次。

如何安装 ClawPhone Phone Control?

在 OpenClaw 或 Claude Code 对话框中运行命令「/install clawphone-phone-control」即可一键安装,无需额外配置。

ClawPhone Phone Control 是免费的吗?

是的,ClawPhone Phone Control 完全免费,采用 MIT-0 许可证,可自由下载、安装和使用。

ClawPhone Phone Control 支持哪些平台?

ClawPhone Phone Control 跨平台运行,可在任意部署了 OpenClaw / Claude Code 的环境中使用(cross-platform)。

谁开发了 ClawPhone Phone Control?

由 CLOUD BOY(@be1human)开发并维护,当前版本 v1.0.0。

💬 留言讨论