openclaw-skills/agent-browser/SKILL.md
为 Agent 提供真实浏览器自动化能力,支持语义定位、表单交互、截图录屏、脚本执行与会话管理。
npx skillsauth add seaworld008/commonly-used-high-value-skills agent-browserInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
当任务需要 直接操作网页(而不是只读 API 数据)时使用本技能。Agent Browser 基于标准的 CDP (Chrome DevTools Protocol) 协议,赋予 Agent 像人类一样浏览网页、填写表单、点击按钮以及处理复杂前端交互(如 React/Vue 渲染页面、弹窗、验证码预览)的能力。
npx clawhub@latest install agent-browser
retain 机制),实现跨会话的免登录访问。Success Criteria。screenshot,既是留存证据,也方便 Agent 自我纠错。console 读取页面报错、性能指标(LCP, FID)并进行诊断。snapshot 获取辅助功能树(Accessibility Tree)。ax*(可访问性引用)和 n*(DOM 引用)理解页面层级。highlight 技能验证定位是否准确。scroll 滚动到底部,确保懒加载(Lazy Loading)的内容完整呈现。act 接口,执行 click, type, hover, drag 等动作。clearFirst: true 确保输入框内容干净。slowly: true 以模仿人类真实点击频率,降低被反爬引擎识别的风险。wait 工具,直到特定 URL 或文字出现,确保操作已生效。retain: true 标记重要的页签(Tab)。retain,等用户扫码完成后 Agent 再接管。errors 列表,识别 JS 执行崩溃。requests 网络请求,拦截并分析特定的 API 数据包(甚至包括 XHR/Fetch 的 Response)。### 任务目标
[目标描述:从 X 网站抓取前 10 个产品的价格和评论]
### 操作步骤 (Action Sequence)
1. **Navigate**: 访问 `https://example.com/products`。
2. **Wait**: 等待包含 `.product-list` 的元素加载完成。
3. **Scroll**: 滚动至页面底部触发分页。
4. **Snapshot**: 获取所有 `n` 级引用的文本内容。
5. **Console**: 注入脚本 `Array.from(document.querySelectorAll('.price')).map(e => e.innerText)`。
6. **Screenshot**: 截取整个列表区域存入 `output/products.png`。
### 预期结果
- 汇总 JSON 数据。
- 截图证据。
// 示例:打开 GitHub 并保留会话,不被自动销毁
const tab = await mcp_call({
name: 'browser_open',
arguments: {
targetUrl: "https://github.com",
profile: "chrome"
}
});
await mcp_call({
name: 'browser_retain',
arguments: {
targetId: tab.targetId,
retain: true
}
});
MEMORY.md 中的“基准截图”进行对比,识别 UI 错位或样式丢失。question 技能将截图发给用户)。timeoutMs。retain,否则在任务结束后及时 close 无效页签。incognito 模式。browser console 错误日志记录下来,它是调试的第一线索。development
飞书知识库:管理知识空间、空间成员和文档节点。创建和查询知识空间、查看和管理空间成员、管理节点层级结构、在知识库中组织文档和快捷方式。当用户需要在知识库中查找或创建文档、浏览知识空间结构、查看或管理空间成员、移动或复制节点时使用。当用户给出 doubao.com 的 /wiki/ URL/token 时,也应直接使用本 skill,不要因为域名不是飞书而回退到 WebFetch;路由依据是 URL 路径模式和 token,而不是域名。
tools
飞书画板:查询和编辑飞书云文档中的画板。支持导出画板为预览图片、导出原始节点结构、使用 DSL(转成 OpenAPI 格式)、PlantUML/Mermaid 格式更新画板内容。 当用户需要查看画板内容、导出画板图片、编辑画板,或是需要可视化表达架构、流程、组织关系、时间线、因果、对比等结构化信息时使用此 skill,无论是否提及\"画板\"。 ⚠️ 原 `lark-whiteboard-cli` skill 已合并至本 skill,若 skill 列表中同时存在 `lark-whiteboard-cli`,请忽略它,统一使用本 skill(`lark-whiteboard`),并提示用户运行 `npx skills remove lark-whiteboard-cli -g` 删除旧 skill。
testing
飞书视频会议:搜索历史会议、查询会议纪要产物(总结、待办、章节、逐字稿)、查询会议参会人快照。1. 查询已经结束的会议数量或详情时使用本技能(如历史日期|昨天|上周|今天已经开过的会议等场景),查询未开始的会议日程使用 lark-calendar 技能。2. 支持通过关键词、时间范围、组织者、参与者、会议室等筛选条件搜索会议。3. 获取或整理会议纪要、逐字稿、录制产物时使用本技能。4. 查询“谁参加过某会议”“参会人列表”等参会人快照信息用 vc meeting get --with-participants(任意时点可查,含已结束会议)。注意:**Agent 真实入会/离会、感知正在进行中会议的实时事件**请使用 lark-vc-agent 技能,本技能不覆盖写操作和会中事件流。
data-ai
飞书会议机器人入会、离会和会中事件读取。