Browser-use-claude-mcp
一个浏览器自动化 MCP 服务器,适用于 Claude 和 Gemini 2.5 等 AI 模型,通过自然语言实现网页浏览功能。
jasondsmith72
README
Browser-use-claude-mcp
一个用于 AI 模型(如 Claude 和 Gemini 2.5)的浏览器自动化 MCP 服务器,通过自然语言实现网页浏览功能。
概述
本项目实现了一个模型上下文协议 (MCP) 服务器,为 AI 模型提供浏览器自动化功能。它允许 AI 助手使用自然语言命令浏览网页、与网站交互以及提取信息。
主要特性
🌐 浏览器自动化特性
- 完整的浏览器自动化(导航、表单填写、点击等)
- 网页搜索功能
- 屏幕截图捕获,用于视觉理解
- 内容提取和分析
🤖 AI 特性
- 支持多种 AI 提供商:
- Google Gemini 2.5(主要关注)
- Anthropic Claude
- OpenAI
- 图像分析(视觉)功能
- AI 驱动的内容分析
🔧 技术特性
- 使用 TypeScript 编写,以实现最高的可靠性
- 模块化架构,具有清晰的关注点分离
- 全面的日志记录和错误处理
- 通过环境变量轻松配置
可用工具
工具名称 | 描述 |
---|---|
browse_webpage |
导航到 URL 并提取其内容 |
search_web |
执行网页搜索并返回结果 |
take_screenshot |
捕获当前页面的屏幕截图 |
click_element |
通过文本或选择器点击元素 |
fill_form |
使用提供的值填写表单字段 |
extract_content |
从网页中提取特定内容 |
analyze_content |
AI 驱动的网页内容分析 |
快速上手
请参阅 INSTALL.md 获取详细的安装和设置说明。
快速开始
-
克隆存储库
git clone https://github.com/jasondsmith72/Browser-use-claude-mcp.git cd Browser-use-claude-mcp
-
安装依赖项
npm install
-
创建一个
.env
文件(使用.env.example
作为模板)cp .env.example .env
-
构建项目
npm run build
-
启动服务器
npm start
配置
可以通过 .env
文件中的环境变量配置服务器:
# 浏览器配置
CHROME_PATH=
CHROME_USER_DATA=
CHROME_DEBUGGING_PORT=9222
# AI 提供商 (GEMINI, ANTHROPIC, OPENAI)
MCP_MODEL_PROVIDER=GEMINI
# API 密钥(使用您选择的提供商的密钥)
GOOGLE_API_KEY=your_google_api_key_here
ANTHROPIC_API_KEY=your_anthropic_api_key_here
OPENAI_API_KEY=your_openai_api_key_here
与 Claude Desktop 一起使用
-
找到 Claude Desktop 配置文件:
- Windows:
%APPDATA%/Claude/claude_desktop_config.json
- MacOS:
~/Library/Application Support/Claude/claude_desktop_config.json
- Windows:
-
将此 MCP 服务器添加到您的配置中:
{ "mcpServers": { "browser-use-claude-mcp": { "command": "node", "args": [ "/path/to/Browser-use-claude-mcp/dist/index.js" ], "env": { "CHROME_PATH": "", "CHROME_USER_DATA": "", "MCP_MODEL_PROVIDER": "GEMINI", "GOOGLE_API_KEY": "your_google_api_key_here" } } } }
-
重新启动 Claude Desktop 以使更改生效。
示例
基本网页浏览
browse_webpage(url="https://example.com")
网页搜索
search_web(query="best programming languages 2025")
填写表单
fill_form(fields={
"name": "John Doe",
"email": "john@example.com",
"message": "Hello world!"
}, submit=true)
AI 内容分析
analyze_content(
url="https://en.wikipedia.org/wiki/Artificial_intelligence",
instructions="Summarize the key developments in AI in the last decade"
)
开发
# 在开发模式下运行
npm run dev
# 运行测试
npm test
# 检查代码风格
npm run lint
许可证
MIT
鸣谢
本项目基于 browser-use 和其他 MCP 服务器实现的工作。
推荐服务器
Playwright MCP Server
一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。
Playwright MCP Server
提供一个利用模型上下文协议的服务器,以实现类人浏览器的自动化,该服务器使用 Playwright,允许控制浏览器行为,例如导航、元素交互和滚动。
@kazuph/mcp-fetch
用于获取网页内容和处理图像的模型上下文协议服务器。这使得 Claude Desktop(或任何 MCP 客户端)能够适当地获取网页内容和处理图像。
DuckDuckGo MCP Server
一个模型上下文协议 (MCP) 服务器,通过 DuckDuckGo 提供网页搜索功能,并具有内容获取和解析的附加功能。
YouTube Transcript MCP Server
这个服务器用于获取指定 YouTube 视频 URL 的字幕,从而可以与 Goose CLI 或 Goose Desktop 集成,进行字幕提取和处理。
serper-search-scrape-mcp-server
这个 Serper MCP 服务器支持搜索和网页抓取,并且支持 Serper API 引入的所有最新参数,例如位置。
The Verge News MCP Server
提供从The Verge的RSS feed获取和搜索新闻的工具,允许用户获取今日新闻、检索过去一周的随机文章,以及在最近的Verge内容中搜索特定关键词。
Tavily MCP Server
使用 Tavily 的搜索 API 提供 AI 驱动的网络搜索功能,使 LLM 能够执行复杂的网络搜索、获得问题的直接答案以及搜索最近的新闻文章。
mcp-pinterest
用于图像搜索和信息检索的 Pinterest 模型上下文协议 (MCP) 服务器

Crawlab MCP Server