registry/midscenejs-docs/SKILL.md
关于自动规划(Auto Planning)和即时操作(Instant Action)的区别,请参考 [API](/api.md) 文档。
npx skillsauth add hk-vk/skills midscenejs-docsInstall this skill globally with one command. Works with Claude Code, Cursor, and Windsurf.
3 of 9 scanners reported clean
Some scanners were skipped, did not run, or reported a non-clean status. Review each row below.
关于自动规划(Auto Planning)和即时操作(Instant Action)的区别,请参考 API 文档。
关于自动规划(Auto Planning)和即时操作(Instant Action)的区别,请参考 API 文档。
yadb
Scrcpy 截图模式
API constructors
Android 平台特定动作
API 参考(通用)
AndroidDevice
Android 快速开始
Android Studio
Android environment variables
API 参考(通用)
Android Agent API
https://github.com/web-infra-dev/midscene-example/blob/main/android/javascript-sdk-demo
快速开始
使用 JavaScript SDK
使用 YAML 格式的自动化脚本
PuppeteerAgent
PlaywrightAgent
AgentOverChromeBridge
Android API 参考
iOS API 参考
自定义界面 Agent
Link: outputFormat: 'single-html' | 'html-and-external-assets': 控制报告的生成格式。'single-html'(默认)将所有截图作为 base64 内嵌到单个 HTML 文件中,并把 reportFileName 作为 HTML 文件名。'html-and-external-assets' 将截图保存为独立的 PNG 文件到子目录,并把 reportFileName 作为该目录名,适用于报告文件过大的场景。注意:使用 'html-and-external-assets' 时,报告必须通过 HTTP 服务器或 CDN 地址访问,无法直接使用 file:// 协议打开。这是因为浏览器的 CORS(跨源资源共享)限制会阻止从 file 协议加载相对路径的本地图片。如需在本地测试,可在报告目录下启动简易的 HTTP 服务器。进入报告目录后运行以下命令之一:
npx servepython -m http.server 或 python3 -m http.server
然后通过 `
缓存功能
模型策略
使用图片作为提示词
使用图片作为提示词
使用图片作为提示词
通过图像提示
使用图片作为提示词
使用图片作为提示词
使用图片作为提示词
YADB
通过图像提示
使用图片作为提示词
使用图片作为提示词
使用图片作为提示词
使用图片作为提示词
使用图片作为提示词
使用图片作为提示词
使用图片作为提示词
使用图片作为提示词
Web
Android
Computer(Mac/Windows/Linux)
midscene-ios
midscene-pc
midscene-pc-docker
Midscene-Python
midscene-java
midscene-java
API 参考
API 参考(Web)
https://github.com/web-infra-dev/midscene-example/blob/main/bridge-mode-demo
Skills 文档
MCP 服务
iOS API
GLM-V 模型配置
AutoGLM 模型配置
aiAct深度思考与可扩展的 MCP SDKiOS 自动化 - 美团下单咖啡
iOS 自动化 - Twitter 自动点赞 @midscene_ai 首条推文
Android 自动化 - 懂车帝查看小米 SU7 参数
Android 自动化 - Booking 预订圣诞酒店
MCP 集成 - Midscene MCP 操作界面发布 prepatch 版本
freezePageContext
keyboardDismissStrategy
Rslib
使用图片作为提示词
reportFileName
LLMs.txt
自定义报告节点 API 文档
Android 更多配置项 API 文档
Link: BrowserBase:在 注册并获取你的 CDP URL
Link: Browserless:使用 或运行你自己的实例
Run Prebuilt WDA
Real Device Configuration
通用 API 参考
模型配置
缓存
API 参考
使用 YAML 格式自动化脚本
YAML 脚本运行器
缓存提高效率
开始使用
API 参考
使用 YAML 格式自动化脚本
Web 浏览器 - Playwright
Web 浏览器 - Puppeteer
Web 浏览器 - Chrome 插件
Web 浏览器 - 桥接模式
Android
iOS
HarmonyOS
PC 桌面
API constructors
HarmonyOS 平台特定动作
API 参考(通用)
Link: uri: string —— 可以是应用 bundle name(如 com.huawei.hmos.settings),也可以是在 appNameMapping 中注册的应用名称。如果传入 或https://` 开头的 URL,将通过浏览器打开。
HarmonyDevice
HarmonyOS 快速开始
DevEco Studio
HarmonyOS 命令行工具
API 参考(通用)
HarmonyOS Agent API
https://github.com/web-infra-dev/midscene-example/blob/main/harmony/javascript-sdk-demo
快速开始
使用 JavaScript SDK
使用 YAML 格式的自动化脚本
Android Studio
Android command-line tools
yadb
构造器
演示项目
Android (adb) Agent
iOS (WebDriverAgent) Agent
midscene-ios
DevEco Studio
HarmonyOS 命令行工具
Run Prebuilt WDA
Real Device Configuration
outputFormat: 控制报告的生成格式。'single-html'(默认)将所有截图作为 base64 内嵌到单个 HTML 文件中。'html-and-external-assets' 将截图保存为独立的 PNG 文件到子目录,适用于报告文件过大的场景。注意:使用 'html-and-external-assets' 时,报告必须通过 HTTP 服务器访问,无法直接使用 file:// 协议打开(因为浏览器的 CORS 限制会阻止从 file 协议加载相对路径的本地图片)。进入报告目录后运行以下命令之一:npx servepython -m http.server 或 python3 -m http.server然后通过 `
Link: BrowserBase:在 注册并获取你的 CDP URL
Link: Browserless:使用 或运行你自己的实例
Agent
Yaml
API 参考
Playwright Agent API
直接集成 Playwright
Link: BrowserBase:在 注册并获取你的 CDP URL
Link: Browserless:使用 或运行你自己的实例
API 参考
Puppeteer Agent API
https://github.com/web-infra-dev/midscene-example/blob/main/puppeteer-demo
与 Puppeteer 集成
JavaScript SDK
JavaScript SDK
JavaScript SDK
交互 API: 与用户界面交互。
文档
使用缓存,提高执行效率: 使用缓存能力重放脚本,提高执行效率。
iOS 自动化 - 美团下单咖啡
iOS 自动化 - Twitter 自动点赞 @midscene_ai 首条推文
Android 自动化 - 懂车帝查看小米 SU7 参数
Android 自动化 - Booking 预订东京圣诞酒店
MCP 集成 - Midscene MCP 操作界面发布 prepatch 版本
Chrome 插件
Android Playground
iOS Playground
https://midscenejs.com
https://github.com/web-infra-dev/midscene-example
https://midscenejs.com/api.html
https://github.com/web-infra-dev/midscene
Web Infra 团队微信公众号
Discord
在 X 上关注我们
飞书交流群
Rsbuild
UI-TARS
Qwen2.5-VL
scrcpy
appium-adb
appium-webdriveragent
YADB
libnut-core
Puppeteer
Playwright
API constructors
iOS 平台特定动作
API 参考(通用)
IOSDevice
iOS 快速开始
与任意界面集成
Run Prebuilt WDA
Real Device Configuration
API 参考(通用)
iOS Agent API
https://github.com/web-infra-dev/midscene-example/blob/main/ios/javascript-sdk-demo
使用 JavaScript SDK
使用 YAML 格式的自动化脚本
llms.txt
llms-full.txt
选择 AI 模型
Android adb
模型策略
iOS 快速开始
模型策略
Android 快速开始
模型策略
https://github.com/zai-org/GLM-V
https://huggingface.co/zai-org/GLM-4.6V
https://github.com/zai-org/Open-AutoGLM
https://huggingface.co/zai-org/AutoGLM-Phone-9B
Images and Vision guide
Images and Vision guide
Computer use guide
createOpenAIClient
createOpenAIClient
豆包 Seed 模型
Qwen3.X 系列
智谱 GLM-V
智谱 AutoGLM
Gemini-3-Flash
GPT-5.4
aiAct 与结构化代码,哪个才是最优解?Link
Link
API 参考(通用)
集成到 Puppeteer
API 参考(通用)
集成到 Playwright
API 参考(通用)
桥接模式
.env 配置环境变量Reference these resources when working with YAML 脚本运行器.
documentation
Dockhand documentation and resources. Use this skill when working with Dockhand or when the user mentions dockhand.
development
Element Plus - A Vue 3 based component library documentation and resources. Use this skill when working with Element Plus - A Vue 3 based component library or when the user mentions element plus - a vue 3 based component library.
documentation
Documentation for LangSmith, Fleet, and our open source packages.
testing
To get your plan id, you need to first create a plan in the **Manage Pricing** section on your whop page.