nekro_agent/builtin_skills/agent-browser/SKILL.md
使用此技能进行浏览器自动化操作,包括网页抓取、表单填写、UI 测试和任何 Web 交互任务。
npx skillsauth add kromiose/nekro-agent agent-browserInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
环境提示:
agent-browser及 Playwright Chromium 已在 nekro-cc-sandbox 中预装(PLAYWRIGHT_BROWSERS_PATH=/opt/playwright-browsers),可直接使用。如遇安装问题,请读取本技能目录下的install.md。
agent-browser open <url> # 打开页面
agent-browser snapshot -i # 获取交互元素快照(返回带 ref 的元素树)
agent-browser click @e1 # 通过 ref 点击元素
agent-browser fill @e2 "文本" # 填写表单
agent-browser screenshot # 截图
agent-browser close # 关闭浏览器
agent-browser snapshot # 完整可访问性树
agent-browser snapshot -i # 仅交互元素(推荐,节省 token)
agent-browser snapshot -c # 紧凑模式(移除空元素)
agent-browser snapshot -d 3 # 限制深度为 3 层
agent-browser snapshot -s "#main" # 限定 CSS 选择器范围
快照输出示例:
@e1 [heading] "Example Domain" [level=1]
@e2 [button] "Submit"
@e3 [input type="email"] placeholder="Email"
@e4 [link] "Learn more"
重要:页面导航或元素变化后,refs 会失效,必须重新执行 snapshot 获取新 refs。
agent-browser click @e1 # 点击(使用 ref)
agent-browser fill @e2 "文本" # 清空并填写(表单推荐)
agent-browser type @e3 "追加" # 追加输入
agent-browser press Enter # 按键
agent-browser hover @e4 # 悬停
agent-browser select @e5 "选项值" # 选择下拉选项
agent-browser check @e6 # 勾选复选框
agent-browser scroll down 300 # 滚动(up/down/left/right,单位 px)
agent-browser find role button click --name "Submit"
agent-browser find label "Email" fill "[email protected]"
agent-browser find placeholder "搜索..." fill "关键词"
agent-browser find text "登录" click
agent-browser get text @e1 # 获取文本内容
agent-browser get value @e2 # 获取输入框值
agent-browser get attr @e3 href # 获取属性
agent-browser get title # 获取页面标题
agent-browser get url # 获取当前 URL
agent-browser wait --text "欢迎" # 等待文本出现
agent-browser wait --load # 等待页面加载完成
agent-browser wait 2000 # 等待 2 秒
agent-browser wait --url "**/dash" # 等待 URL 匹配
agent-browser back # 后退
agent-browser reload # 刷新
agent-browser screenshot page.png # 截图
agent-browser screenshot full.png --full # 截取完整页面
agent-browser pdf report.pdf # 保存为 PDF
agent-browser eval "document.title" # 执行 JavaScript
agent-browser console # 查看控制台消息
# 不同会话完全隔离(cookie、localStorage、登录状态)
agent-browser --session user1 open site-a.com
agent-browser --session user2 open site-b.com
# 持久化登录状态
agent-browser --profile ~/.my-profile open myapp.com
-i 标志:只获取交互元素,大幅减少 token 消耗snapshot-s 限定范围:复杂页面只关注目标区域fill 而非 type:fill 先清空再输入,更适合表单find role/label 比 CSS 选择器更稳定| 错误 | 解决方案 |
|------|----------|
| "Executable doesn't exist" | 读取 install.md 安装 Playwright Chromium |
| Ref 无效 | 重新执行 agent-browser snapshot |
| 元素找不到 | 改用 find 语义定位器 |
| 页面加载超时 | 使用 agent-browser wait --load |
tools
处理基于 git 和 GitHub 的真实协作工作流。当任务涉及仓库同步、分支管理、修复 bug、提交代码、创建或更新 PR、处理 review、解决冲突、检查 GitHub 认证与权限、或需要通过 fork 与用户仓库协作时使用,强调安全、干净、可审计的协作流程。**必须在需要时使用该 Skill 并严格遵守相关规范!!!**
development
创建新的 Claude Code 技能,修改和优化已有技能。当用户想从头创建技能、将当前工作流封装为技能、优化已有技能的内容或触发描述时使用此技能。即使用户没有明确说"技能",当他们想把某个重复工作流程固定下来时也应使用。
development
Maintainer-only workflow for handling GitHub Secret Scanning alerts on OpenClaw. Use when Codex needs to triage, redact, clean up, and resolve secret leakage found in issue comments, issue bodies, PR comments, or other GitHub content.
development
Maintainer workflow for OpenClaw releases, prereleases, changelog release notes, and publish validation. Use when Codex needs to prepare or verify stable or beta release steps, align version naming, assemble release notes, check release auth requirements, or validate publish-time commands and artifacts.