Browser-use-claude-mcp

Browser-use-claude-mcp

一个浏览器自动化 MCP 服务器,适用于 Claude 和 Gemini 2.5 等 AI 模型,通过自然语言实现网页浏览功能。

jasondsmith72

浏览器自动化
访问服务器

README

Browser-use-claude-mcp

一个用于 AI 模型(如 Claude 和 Gemini 2.5)的浏览器自动化 MCP 服务器,通过自然语言实现网页浏览功能。

概述

本项目实现了一个模型上下文协议 (MCP) 服务器,为 AI 模型提供浏览器自动化功能。它允许 AI 助手使用自然语言命令浏览网页、与网站交互以及提取信息。

主要特性

🌐 浏览器自动化特性

  • 完整的浏览器自动化(导航、表单填写、点击等)
  • 网页搜索功能
  • 屏幕截图捕获,用于视觉理解
  • 内容提取和分析

🤖 AI 特性

  • 支持多种 AI 提供商:
    • Google Gemini 2.5(主要关注)
    • Anthropic Claude
    • OpenAI
  • 图像分析(视觉)功能
  • AI 驱动的内容分析

🔧 技术特性

  • 使用 TypeScript 编写,以实现最高的可靠性
  • 模块化架构,具有清晰的关注点分离
  • 全面的日志记录和错误处理
  • 通过环境变量轻松配置

可用工具

工具名称 描述
browse_webpage 导航到 URL 并提取其内容
search_web 执行网页搜索并返回结果
take_screenshot 捕获当前页面的屏幕截图
click_element 通过文本或选择器点击元素
fill_form 使用提供的值填写表单字段
extract_content 从网页中提取特定内容
analyze_content AI 驱动的网页内容分析

快速上手

请参阅 INSTALL.md 获取详细的安装和设置说明。

快速开始

  1. 克隆存储库

    git clone https://github.com/jasondsmith72/Browser-use-claude-mcp.git
    cd Browser-use-claude-mcp
    
  2. 安装依赖项

    npm install
    
  3. 创建一个 .env 文件(使用 .env.example 作为模板)

    cp .env.example .env
    
  4. 构建项目

    npm run build
    
  5. 启动服务器

    npm start
    

配置

可以通过 .env 文件中的环境变量配置服务器:

# 浏览器配置
CHROME_PATH=
CHROME_USER_DATA=
CHROME_DEBUGGING_PORT=9222

# AI 提供商 (GEMINI, ANTHROPIC, OPENAI)
MCP_MODEL_PROVIDER=GEMINI

# API 密钥(使用您选择的提供商的密钥)
GOOGLE_API_KEY=your_google_api_key_here
ANTHROPIC_API_KEY=your_anthropic_api_key_here
OPENAI_API_KEY=your_openai_api_key_here

与 Claude Desktop 一起使用

  1. 找到 Claude Desktop 配置文件:

    • Windows: %APPDATA%/Claude/claude_desktop_config.json
    • MacOS: ~/Library/Application Support/Claude/claude_desktop_config.json
  2. 将此 MCP 服务器添加到您的配置中:

    {
      "mcpServers": {
        "browser-use-claude-mcp": {
          "command": "node",
          "args": [
            "/path/to/Browser-use-claude-mcp/dist/index.js"
          ],
          "env": {
            "CHROME_PATH": "",
            "CHROME_USER_DATA": "",
            "MCP_MODEL_PROVIDER": "GEMINI",
            "GOOGLE_API_KEY": "your_google_api_key_here"
          }
        }
      }
    }
    
  3. 重新启动 Claude Desktop 以使更改生效。

示例

基本网页浏览

browse_webpage(url="https://example.com")

网页搜索

search_web(query="best programming languages 2025")

填写表单

fill_form(fields={
  "name": "John Doe",
  "email": "john@example.com",
  "message": "Hello world!"
}, submit=true)

AI 内容分析

analyze_content(
  url="https://en.wikipedia.org/wiki/Artificial_intelligence",
  instructions="Summarize the key developments in AI in the last decade"
)

开发

# 在开发模式下运行
npm run dev

# 运行测试
npm test

# 检查代码风格
npm run lint

许可证

MIT

鸣谢

本项目基于 browser-use 和其他 MCP 服务器实现的工作。

推荐服务器

Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Playwright MCP Server

Playwright MCP Server

提供一个利用模型上下文协议的服务器,以实现类人浏览器的自动化,该服务器使用 Playwright,允许控制浏览器行为,例如导航、元素交互和滚动。

精选
本地
TypeScript
@kazuph/mcp-fetch

@kazuph/mcp-fetch

用于获取网页内容和处理图像的模型上下文协议服务器。这使得 Claude Desktop(或任何 MCP 客户端)能够适当地获取网页内容和处理图像。

精选
本地
JavaScript
DuckDuckGo MCP Server

DuckDuckGo MCP Server

一个模型上下文协议 (MCP) 服务器,通过 DuckDuckGo 提供网页搜索功能,并具有内容获取和解析的附加功能。

精选
Python
YouTube Transcript MCP Server

YouTube Transcript MCP Server

这个服务器用于获取指定 YouTube 视频 URL 的字幕,从而可以与 Goose CLI 或 Goose Desktop 集成,进行字幕提取和处理。

精选
Python
serper-search-scrape-mcp-server

serper-search-scrape-mcp-server

这个 Serper MCP 服务器支持搜索和网页抓取,并且支持 Serper API 引入的所有最新参数,例如位置。

精选
TypeScript
The Verge News MCP Server

The Verge News MCP Server

提供从The Verge的RSS feed获取和搜索新闻的工具,允许用户获取今日新闻、检索过去一周的随机文章,以及在最近的Verge内容中搜索特定关键词。

精选
TypeScript
Tavily MCP Server

Tavily MCP Server

使用 Tavily 的搜索 API 提供 AI 驱动的网络搜索功能,使 LLM 能够执行复杂的网络搜索、获得问题的直接答案以及搜索最近的新闻文章。

精选
Python
mcp-pinterest

mcp-pinterest

用于图像搜索和信息检索的 Pinterest 模型上下文协议 (MCP) 服务器

精选
TypeScript
Crawlab MCP Server

Crawlab MCP Server

官方
Python