Browse Together MCP

Browse Together MCP

与你的 AI 共同浏览,在你编辑代码时。一个带有头部的、由 Playwright 控制的浏览器,以及配套的 MCP 服务器。

canadaduane

开发者工具
访问服务器

README

Browse Together MCP

带有 MCP 服务器的 Playwright 浏览器代理

在您的桌面上运行 Playwright 浏览器和 MCP 服务器。您可以启动一个带界面的浏览器(用于人机交互)以及一个配套的 MCP 服务器,该服务器可以通过 HTTP API 或 MCP 服务器来控制浏览器。

本项目为浏览器自动化和协同浏览提供了两个互补的服务:

  • 一个浏览器代理服务,通过 HTTP 控制一个持久的 Playwright 浏览器实例。让您可以像平常一样登录您使用的服务。
  • 一个 MCP 服务器,通过 FastMCP 框架将浏览器功能暴露给 MCP 客户端(如 Claude Desktop)。可以在您提供的已认证会话中运行,从而使您的 MCP 命令作为已认证用户拥有更强大的功能和实用性。

这两个服务都使用 Deno 和 TypeScript 构建,并且可以无缝协作。

特性

  • 多浏览器支持:可以使用 Chromium(默认)或 Firefox 运行。
  • 持久浏览器会话:单个浏览器实例在服务的整个生命周期内运行。
  • 命名标签页:使用唯一的 ID 控制单个浏览器会话中的多个页面(标签页)。
  • HTTP API:使用简单的 JSON 命令通过 HTTP 与浏览器交互。
  • MCP 集成:通过 Cline、Windsurf、Claude Desktop 或其他 MCP 客户端使用浏览器。
  • 类型安全:使用 Zod 对传入的命令进行强大的验证。
  • 使用 API 令牌保护您的浏览器代理服务 (HTTP) 端点。

注意:目前支持 Mac OS,但可以通过少量更改扩展到其他平台。

这是计算机使用/操作员服务吗?

不,目前还不是。这是一个(带界面的)Web 浏览器,其行为类似于正常的人工控制浏览器,但也允许您通过 HTTP API 或 MCP 客户端控制您的会话。虽然您可以获取屏幕截图、下载文档等,但这并不是计算机使用/操作员服务。

可以将其视为基于 MCP 的浏览器会话远程控制,用于在您编写代码时下载文档或其他任务。

核心组件

  • 浏览器服务:

    • browser.ts: 主要的浏览器代理服务实现
    • types.ts: 使用 Zod 定义命令结构和类型
  • MCP 服务器:

    • mcp.ts: 连接到浏览器服务的 FastMCP 实现

用法

开发者快速入门

  1. 安装先决条件: 安装 Playwright 的浏览器包(假设您已安装 npx):

    # 安装所有浏览器
    npx playwright install
    
    # 或安装特定浏览器
    npx playwright install chromium
    npx playwright install firefox
    

    安装 Deno:

    curl -fsSL https://deno.land/install.sh | sh
    

    有关更多详细信息,请参见 Deno 安装

  2. 启动浏览器服务:

    deno task browser
    

    这将在 http://localhost:8888(或您环境中指定的端口)上启动浏览器代理。

  3. 配置您的 MCP 客户端:

    {
        "mcpServers": {
     	   "browse-together": {
     		   "command": "deno",
     		   "args": ["run", "-A", "/Users/duane/Projects/browse-together-mcp/mcp.ts"]
          },
      }
    }
    

    您也可以直接启动 MCP 服务器进行测试:

    deno task mcp
    

浏览器选择

您可以通过设置 BROWSER_TYPE 环境变量或使用 --browser-type 标志来选择要使用的浏览器:

# 通过环境变量使用 Firefox
BROWSER_TYPE=firefox deno task browser

# 或通过 CLI 标志
deno task browser --browser-type firefox

选项 1:通过 HTTP API 交互

将 POST 请求发送到 /api/browser/:pageId,其中包含描述操作的 JSON 正文。

示例:导航到 URL

curl -X POST http://localhost:8888/api/browser/myTab \
  -H "Content-Type: application/json" \
  -d '{"action":"goto","url":"https://example.com"}'

示例:点击元素

curl -X POST http://localhost:8888/api/browser/myTab \
  -H "Content-Type: application/json" \
  -d '{"action":"click","selector":"#submit-button"}'

有关更多详细信息,请参见 002-browser.md 中的 API 参考

选项 2:与 MCP 客户端一起使用

  1. 通过编辑您的 claude_desktop_config.json 在您的 MCP 客户端(例如 Cline、Windsurf、Claude Desktop)中配置 MCP 服务器:
{
  "mcpServers": {
    "browse-together": {
      "command": "/path/to/deno", 
      "args": [
        "run",
        "--allow-read",
        "--allow-net",
        "--allow-env",
        "--allow-sys",
        "/path/to/browse-together-mcp/mcp.ts"
      ],
      "env": {
        "PORT": "8888" 
      }
    }
  }
}
  1. 在您的客户端中使用带有以下命令的 MCP 工具:
Let's browse to jsr.io together.

可用的 MCP 工具

MCP 服务器向客户端公开以下工具:

  • goto: 导航到 URL
  • click: 点击元素
  • fill: 填充表单字段
  • content: 获取页面 HTML 内容
  • fetch: 在浏览器上下文中执行 fetch 请求
  • listPages: 列出所有活动的浏览器页面
  • closePage: 关闭特定页面

文档

本项目是通过一系列描述增量规划步骤的文档进行“氛围编码”的:

其中一些步骤可能已过时或不再相关,但作为参考包含在内,并用于深入了解项目的构建方式。

另请参见 vibe-coders.org,以获取有关我们在犹他州桑迪的本地氛围编码小组的更多信息。

开发

  • 运行浏览器代理: deno task browser
  • 运行 MCP 服务器: deno task mcp
  • 格式化代码: deno fmt
  • 检查依赖项: deno check --all browser.ts mcp.ts types.ts

架构

+----------------+      +--------------+      +------------------+
|                |      |              |      |                  |
| Cline/LLM      | ---- | MCP 服务器   | ---- | 浏览器服务  |
| (MCP 客户端)   |      | (mcp.ts)     | HTTP | (browser.ts)     |
|                |      |              |      |                  |
+----------------+      +--------------+      +------------------+
                               |                       |
                          FastMCP API            Playwright API
                               |                       |
                           STDIO/SSE            Chromium 浏览器

系统工作方式如下:

  1. 浏览器服务 (browser.ts) 使用 Playwright 管理持久的 Chromium 浏览器实例
  2. MCP 服务器 (mcp.ts) 使用 FastMCP 提供标准的 MCP 接口
  3. MCP 服务器通过 HTTP 将命令转发到浏览器服务
  4. 像 Claude Desktop 这样的 MCP 客户端 可以通过简单的工具调用使用所有浏览器功能

推荐服务器

Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。

官方
精选
本地
TypeScript
MCP Package Docs Server

MCP Package Docs Server

促进大型语言模型高效访问和获取 Go、Python 和 NPM 包的结构化文档,通过多语言支持和性能优化来增强软件开发。

精选
本地
TypeScript
Claude Code MCP

Claude Code MCP

一个实现了 Claude Code 作为模型上下文协议(Model Context Protocol, MCP)服务器的方案,它可以通过标准化的 MCP 接口来使用 Claude 的软件工程能力(代码生成、编辑、审查和文件操作)。

精选
本地
JavaScript
@kazuph/mcp-taskmanager

@kazuph/mcp-taskmanager

用于任务管理的模型上下文协议服务器。它允许 Claude Desktop(或任何 MCP 客户端)在基于队列的系统中管理和执行任务。

精选
本地
JavaScript
mermaid-mcp-server

mermaid-mcp-server

一个模型上下文协议 (MCP) 服务器,用于将 Mermaid 图表转换为 PNG 图像。

精选
JavaScript
Jira-Context-MCP

Jira-Context-MCP

MCP 服务器向 AI 编码助手(如 Cursor)提供 Jira 工单信息。

精选
TypeScript
Linear MCP Server

Linear MCP Server

一个模型上下文协议(Model Context Protocol)服务器,它与 Linear 的问题跟踪系统集成,允许大型语言模型(LLM)通过自然语言交互来创建、更新、搜索和评论 Linear 问题。

精选
JavaScript
Sequential Thinking MCP Server

Sequential Thinking MCP Server

这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

精选
Python
Curri MCP Server

Curri MCP Server

通过管理文本笔记、提供笔记创建工具以及使用结构化提示生成摘要,从而实现与 Curri API 的交互。

官方
本地
JavaScript