安装
- CLI 安装(推荐)
- 手动安装
- 安装
playwrightPython 包(旧系统自动降级兼容版本) - 在 Linux 上安装系统依赖
- 下载 Chromium 浏览器(Linux 服务器自动使用无头精简版)
- 自动检测国内网络并使用镜像加速
支持 Ubuntu 20.04+、Debian 10+、macOS、Windows。Ubuntu 18.04 等旧系统会自动降级安装兼容版本。
工作流程
Agent 使用浏览器的典型流程:navigate— 打开目标 URLsnapshot— 获取页面精简 DOM,交互元素自动编号(ref)click/fill/select— 通过 ref 编号操作元素snapshot— 再次快照验证操作结果
支持的操作
| 操作 | 说明 | 关键参数 |
|---|---|---|
navigate | 打开 URL | url |
snapshot | 获取页面结构化文本(主要方式) | selector(可选) |
click | 点击元素 | ref 或 selector |
fill | 填入文本 | ref 或 selector,text |
select | 下拉选择 | ref 或 selector,value |
scroll | 滚动页面 | direction(up/down/left/right) |
screenshot | 截图保存到工作区 | full_page |
wait | 等待元素或超时 | selector,timeout |
press | 按键(Enter、Tab 等) | key |
back / forward | 浏览器前进/后退 | - |
get_text | 获取元素文本内容 | selector |
evaluate | 执行 JavaScript | script |
使用场景
- 访问指定 URL 获取动态页面内容
- 填写表单、登录操作
- 操作网页元素(点击按钮、选择选项等)
- 验证部署后的网页效果
- 抓取需要 JS 渲染的动态内容
运行模式
浏览器会根据运行环境自动选择模式:| 环境 | 模式 |
|---|---|
| macOS / Windows | 有头模式(显示浏览器窗口) |
| Linux 桌面(有 DISPLAY) | 有头模式 |
| Linux 服务器(无 DISPLAY) | 无头模式(headless) |
config.json 中手动覆盖:
浏览器工具依赖较重(~300MB),如不需要可不安装。轻量的网页内容获取可使用
web_fetch 工具。