AgentKit Browser Automation

AgentKit Browser Automation

为 Playwright-MCP 服务器提供的 Agentkit

tmahesh

浏览器自动化
访问服务器

README

AgentKit 浏览器自动化

一个使用 AgentKit 构建的复杂浏览器自动化框架,具有用于智能 Web 导航和任务执行的多代理系统。

概述

本项目实现了一个用于浏览器自动化的多代理系统,其中不同的代理协同工作以:

  • 计划和分解任务
  • 导航网页
  • 执行浏览器操作
  • 验证结果

架构 (TODO)

该系统由四个专门的代理组成:

  1. 规划代理 (Planning Agent)

    • 将任务分解为可执行的步骤
    • 创建详细的执行计划
    • 确定任务完成标准
  2. 导航代理 (Navigator Agent)

    • 确定要采取的下一步行动
    • 管理状态转换
    • 处理动作执行
    • 提供详细的日志记录和反馈
  3. 浏览器代理 (Browser Agent)

    • 执行浏览器自动化操作
    • 与 Web 元素交互
    • 处理页面导航
    • 管理浏览器状态
  4. 验证代理 (Validation Agent)

    • 验证任务完成情况
    • 验证结果
    • 处理错误情况
    • 提供关于成功/失败的反馈

特性

  • 智能任务规划 (Intelligent Task Planning):将复杂任务分解为可管理的步骤
  • 状态管理 (State Management):跟踪浏览器状态和操作结果
  • 错误处理 (Error Handling):强大的错误处理和恢复机制
  • 事件系统 (Event System):全面的事件日志记录和监控
  • 灵活的动作系统 (Flexible Action System):用于自定义行为的可扩展动作注册表
  • 验证框架 (Validation Framework):内置的任务完成验证
  • 内存管理 (Memory Management):维护操作的上下文和历史记录

快速开始

前提条件

  • Node.js (v14 或更高版本)
  • npm 或 yarn
  • OpenAI API 密钥 (用于 GPT 模型)

安装

  1. 克隆存储库:
git clone https://github.com/tmahesh/playwright-agent.git
cd playwright-agent
  1. 安装依赖项:
npm install
  1. 设置环境变量:
cp .env.sample .env
# 编辑 .env 文件,填入您的 OpenAI API 密钥和其他配置
  1. 在不同的终端运行以下命令:index.ts, playwright-mcp, inngest-cli
npx @playwright/mcp@latest --port 8931

npx tsx index.ts

npx inngest-cli@latest dev --no-discovery -u http://localhost:3000/api/inngest -v

贡献

  1. Fork 存储库
  2. 创建一个特性分支
  3. 提交您的更改
  4. 推送到该分支
  5. 创建一个 Pull Request

鸣谢

推荐服务器

Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Playwright MCP Server

Playwright MCP Server

提供一个利用模型上下文协议的服务器,以实现类人浏览器的自动化,该服务器使用 Playwright,允许控制浏览器行为,例如导航、元素交互和滚动。

精选
本地
TypeScript
@kazuph/mcp-fetch

@kazuph/mcp-fetch

用于获取网页内容和处理图像的模型上下文协议服务器。这使得 Claude Desktop(或任何 MCP 客户端)能够适当地获取网页内容和处理图像。

精选
本地
JavaScript
DuckDuckGo MCP Server

DuckDuckGo MCP Server

一个模型上下文协议 (MCP) 服务器,通过 DuckDuckGo 提供网页搜索功能,并具有内容获取和解析的附加功能。

精选
Python
YouTube Transcript MCP Server

YouTube Transcript MCP Server

这个服务器用于获取指定 YouTube 视频 URL 的字幕,从而可以与 Goose CLI 或 Goose Desktop 集成,进行字幕提取和处理。

精选
Python
serper-search-scrape-mcp-server

serper-search-scrape-mcp-server

这个 Serper MCP 服务器支持搜索和网页抓取,并且支持 Serper API 引入的所有最新参数,例如位置。

精选
TypeScript
The Verge News MCP Server

The Verge News MCP Server

提供从The Verge的RSS feed获取和搜索新闻的工具,允许用户获取今日新闻、检索过去一周的随机文章,以及在最近的Verge内容中搜索特定关键词。

精选
TypeScript
Tavily MCP Server

Tavily MCP Server

使用 Tavily 的搜索 API 提供 AI 驱动的网络搜索功能,使 LLM 能够执行复杂的网络搜索、获得问题的直接答案以及搜索最近的新闻文章。

精选
Python
mcp-pinterest

mcp-pinterest

用于图像搜索和信息检索的 Pinterest 模型上下文协议 (MCP) 服务器

精选
TypeScript
Crawlab MCP Server

Crawlab MCP Server

官方
Python