MCP Puppeteer Linux Server

MCP Puppeteer Linux Server

在 Linux 显示服务器上为 LLM 启用浏览器自动化,支持在真实浏览器中进行 Web 交互、屏幕截图和 JavaScript 执行。

Category
访问服务器

Tools

puppeteer_navigate

Navigate to a URL

puppeteer_screenshot

Take a screenshot of the current page or a specific element

puppeteer_click

Click an element on the page

puppeteer_fill

Fill out an input field

puppeteer_select

Select an element on the page with Select tag

puppeteer_hover

Hover an element on the page

puppeteer_evaluate

Execute JavaScript in the browser console

README

MCP-Puppeteer-Linux

smithery badge 一个模型上下文协议(Model Context Protocol)服务器,它使用 Puppeteer 提供浏览器自动化功能,并完全支持 Linux 显示服务器(X11 和 Wayland)。该服务器使 LLM 能够与网页交互、截取屏幕截图以及在真实的浏览器环境中执行 JavaScript。

显示服务器支持

此分支添加了对 Linux 显示服务器的自动检测和配置:

  • 自动 X11/Wayland 检测
  • 动态环境变量配置
  • 支持各种桌面环境(GNOME、KDE 等)
  • 故障恢复机制和强大的错误处理
  • XWayland 兼容性

组件

工具

  • puppeteer_navigate
    • 导航到浏览器中的任何 URL
    • 输入:url(字符串)
  • puppeteer_screenshot
    • 捕获整个页面或特定元素的屏幕截图
    • 输入:
      • name(字符串,必需):屏幕截图的名称
      • selector(字符串,可选):要截取屏幕截图的元素的 CSS 选择器
      • width(数字,可选,默认值:800):屏幕截图宽度
      • height(数字,可选,默认值:600):屏幕截图高度
  • puppeteer_click
    • 单击页面上的元素
    • 输入:selector(字符串):要单击的元素的 CSS 选择器
  • puppeteer_hover
    • 悬停在页面上的元素上
    • 输入:selector(字符串):要悬停的元素的 CSS 选择器
  • puppeteer_fill
    • 填写输入字段
    • 输入:
      • selector(字符串):输入字段的 CSS 选择器
      • value(字符串):要填充的值
  • puppeteer_select
    • 选择带有 SELECT 标签的元素
    • 输入:
      • selector(字符串):要选择的元素的 CSS 选择器
      • value(字符串):要选择的值
  • puppeteer_evaluate
    • 在浏览器控制台中执行 JavaScript
    • 输入:script(字符串):要执行的 JavaScript 代码

资源

服务器提供对两种类型资源的访问:

  1. 控制台日志 (console://logs)
    • 文本格式的浏览器控制台输出
    • 包括来自浏览器的所有控制台消息
  2. 屏幕截图 (screenshot://<name>)
    • 捕获的屏幕截图的 PNG 图像
    • 可通过捕获期间指定的屏幕截图名称访问

主要特性

  • 支持 Linux 显示服务器的浏览器自动化
  • 自动 X11/Wayland 检测和配置
  • 控制台日志监控
  • 屏幕截图功能
  • JavaScript 执行
  • 基本的 Web 交互(导航、点击、表单填写)

配置

Claude Desktop 配置

{
  "mcpServers": {
    "puppeteer": {
      "command": "npx",
      "args": ["ts-node", "/path/to/index.ts"]
    }
  }
}

安装

通过 Smithery 安装

要通过 Smithery 为 Claude Desktop 自动安装 Puppeteer Linux:

npx -y @smithery/cli install @PhialsBasement/mcp-puppeteer-linux --client claude

手动安装

  1. 克隆存储库:
git clone https://github.com/PhialsBasement/MCP-Puppeteer-Linux.git
  1. 安装依赖项:
npm install
  1. 启动服务器:
ts-node index.ts

显示服务器详细信息

服务器自动检测并配置适当的显示环境:

Wayland 支持

  • 通过 WAYLAND_DISPLAY 检测 Wayland 会话
  • 配置必要的环境变量:
    • WAYLAND_DISPLAY
    • QT_QPA_PLATFORM
    • GDK_BACKEND
    • MOZ_ENABLE_WAYLAND
    • XDG_SESSION_TYPE

X11 支持

  • 传统 X11 会话的后备方案
  • 处理 X11 特定的变量:
    • DISPLAY
    • XAUTHORITY
  • 支持各种桌面环境和窗口管理器

许可证

此 MCP 服务器在 MIT 许可证下获得许可。 这意味着您可以自由使用、修改和分发该软件,但须遵守 MIT 许可证的条款和条件。 有关更多详细信息,请参阅项目存储库中的 LICENSE 文件。

推荐服务器

Baidu Map

Baidu Map

百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。

官方
精选
JavaScript
Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。

官方
精选
本地
TypeScript
Audiense Insights MCP Server

Audiense Insights MCP Server

通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。

官方
精选
本地
TypeScript
VeyraX

VeyraX

一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。

官方
精选
本地
graphlit-mcp-server

graphlit-mcp-server

模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。

官方
精选
TypeScript
Kagi MCP Server

Kagi MCP Server

一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。

官方
精选
Python
e2b-mcp-server

e2b-mcp-server

使用 MCP 通过 e2b 运行代码。

官方
精选
Neon MCP Server

Neon MCP Server

用于与 Neon 管理 API 和数据库交互的 MCP 服务器

官方
精选
Exa MCP Server

Exa MCP Server

模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。

官方
精选