AgentKit Browser Automation
为 Playwright-MCP 服务器提供的 Agentkit
tmahesh
README
AgentKit 浏览器自动化
一个使用 AgentKit 构建的复杂浏览器自动化框架,具有用于智能 Web 导航和任务执行的多代理系统。
概述
本项目实现了一个用于浏览器自动化的多代理系统,其中不同的代理协同工作以:
- 计划和分解任务
- 导航网页
- 执行浏览器操作
- 验证结果
架构 (TODO)
该系统由四个专门的代理组成:
-
规划代理 (Planning Agent)
- 将任务分解为可执行的步骤
- 创建详细的执行计划
- 确定任务完成标准
-
导航代理 (Navigator Agent)
- 确定要采取的下一步行动
- 管理状态转换
- 处理动作执行
- 提供详细的日志记录和反馈
-
浏览器代理 (Browser Agent)
- 执行浏览器自动化操作
- 与 Web 元素交互
- 处理页面导航
- 管理浏览器状态
-
验证代理 (Validation Agent)
- 验证任务完成情况
- 验证结果
- 处理错误情况
- 提供关于成功/失败的反馈
特性
- 智能任务规划 (Intelligent Task Planning):将复杂任务分解为可管理的步骤
- 状态管理 (State Management):跟踪浏览器状态和操作结果
- 错误处理 (Error Handling):强大的错误处理和恢复机制
- 事件系统 (Event System):全面的事件日志记录和监控
- 灵活的动作系统 (Flexible Action System):用于自定义行为的可扩展动作注册表
- 验证框架 (Validation Framework):内置的任务完成验证
- 内存管理 (Memory Management):维护操作的上下文和历史记录
快速开始
前提条件
- Node.js (v14 或更高版本)
- npm 或 yarn
- OpenAI API 密钥 (用于 GPT 模型)
安装
- 克隆存储库:
git clone https://github.com/tmahesh/playwright-agent.git
cd playwright-agent
- 安装依赖项:
npm install
- 设置环境变量:
cp .env.sample .env
# 编辑 .env 文件,填入您的 OpenAI API 密钥和其他配置
- 在不同的终端运行以下命令:index.ts, playwright-mcp, inngest-cli
npx @playwright/mcp@latest --port 8931
npx tsx index.ts
npx inngest-cli@latest dev --no-discovery -u http://localhost:3000/api/inngest -v
贡献
- Fork 存储库
- 创建一个特性分支
- 提交您的更改
- 推送到该分支
- 创建一个 Pull Request
鸣谢
推荐服务器
Playwright MCP Server
一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。
Playwright MCP Server
提供一个利用模型上下文协议的服务器,以实现类人浏览器的自动化,该服务器使用 Playwright,允许控制浏览器行为,例如导航、元素交互和滚动。
@kazuph/mcp-fetch
用于获取网页内容和处理图像的模型上下文协议服务器。这使得 Claude Desktop(或任何 MCP 客户端)能够适当地获取网页内容和处理图像。
DuckDuckGo MCP Server
一个模型上下文协议 (MCP) 服务器,通过 DuckDuckGo 提供网页搜索功能,并具有内容获取和解析的附加功能。
YouTube Transcript MCP Server
这个服务器用于获取指定 YouTube 视频 URL 的字幕,从而可以与 Goose CLI 或 Goose Desktop 集成,进行字幕提取和处理。
serper-search-scrape-mcp-server
这个 Serper MCP 服务器支持搜索和网页抓取,并且支持 Serper API 引入的所有最新参数,例如位置。
The Verge News MCP Server
提供从The Verge的RSS feed获取和搜索新闻的工具,允许用户获取今日新闻、检索过去一周的随机文章,以及在最近的Verge内容中搜索特定关键词。
Tavily MCP Server
使用 Tavily 的搜索 API 提供 AI 驱动的网络搜索功能,使 LLM 能够执行复杂的网络搜索、获得问题的直接答案以及搜索最近的新闻文章。
mcp-pinterest
用于图像搜索和信息检索的 Pinterest 模型上下文协议 (MCP) 服务器

Crawlab MCP Server