Steel Puppeteer

Steel Puppeteer

一个模型上下文协议服务器,它使用 Puppeteer 使大型语言模型 (LLM) 能够自动操作网页浏览器,从而可以在真实的浏览器环境中进行导航、屏幕截图、表单填写和 JavaScript 执行。

Category
访问服务器

README

Steel Puppeteer

一个模型上下文协议服务器,它使用 Puppeteer 和 Steel 提供浏览器自动化功能。该服务器使 LLM 能够与网页交互、截取屏幕截图以及在真实的浏览器环境中执行 JavaScript。

组件

工具

  • puppeteer_navigate

    • 在浏览器中导航到任何 URL
    • 输入:
      • url (字符串,必需): 要导航到的 URL
      • timeout (数字,可选,默认: 60000): 导航超时时间,以毫秒为单位
      • waitUntil (字符串,可选,默认: "domcontentloaded"): 何时认为导航成功。选项: "load", "domcontentloaded", "networkidle0", "networkidle2"
  • puppeteer_screenshot

    • 捕获整个页面或特定元素的屏幕截图
    • 输入:
      • name (字符串,必需): 屏幕截图的名称
      • selector (字符串,可选): 用于截图的元素的 CSS 选择器
  • puppeteer_click

    • 点击页面上的元素
    • 输入:selector (字符串,必需): 用于点击的元素的 CSS 选择器
  • puppeteer_fill

    • 填写输入字段
    • 输入:
      • selector (字符串,必需): 输入字段的 CSS 选择器
      • value (字符串,必需): 要填充的值
  • puppeteer_select

    • 选择带有 SELECT 标签的元素
    • 输入:
      • selector (字符串,必需): 要选择的元素的 CSS 选择器
      • value (字符串,必需): 要选择的值
  • puppeteer_hover

    • 悬停在页面上的元素上
    • 输入:selector (字符串,必需): 用于悬停的元素的 CSS 选择器
  • puppeteer_evaluate

    • 在浏览器控制台中执行 JavaScript
    • 输入:script (字符串,必需): 要执行的 JavaScript 代码
  • puppeteer_get_content

    • 从当前页面提取内容
    • 输入:selector (字符串,可选): 从特定元素获取内容的 CSS 选择器。如果未提供,则返回整个页面内容
  • puppeteer_scroll

    • 滚动页面以触发延迟加载
    • 输入:
      • scrollDelay (数字,可选,默认: 100): 滚动之间的延迟,以毫秒为单位
      • maxScrolls (数字,可选,默认: 50): 最大滚动次数

资源

服务器提供对两种类型资源的访问:

  1. 控制台日志 (console://logs)

    • 浏览器控制台输出,文本格式
    • 包括来自浏览器的所有控制台消息
  2. 屏幕截图 (screenshot://<name>)

    • 捕获的屏幕截图的 PNG 图像
    • 可通过捕获期间指定的屏幕截图名称访问

主要特性

  • 使用 Puppeteer 进行浏览器自动化
  • Steel 集成,用于浏览器会话管理
  • 控制台日志监控和捕获
  • 屏幕截图功能
  • JavaScript 执行
  • 基本的 Web 交互(导航、点击、表单填写)
  • 内容提取,具有 token 限制处理
  • 通过滚动支持延迟加载
  • 支持本地和远程 Steel 实例

配置

Claude Desktop 配置

要将 Steel Puppeteer 服务器与 Claude Desktop 一起使用,请将以下配置添加到您的 Claude Desktop 配置文件(通常位于 macOS 上的 ~/Library/Application Support/Claude/claude_desktop_config.json):

{
  "mcpServers": {
    "steel-puppeteer": {
      "command": "node",
      "args": ["path/to/steel-puppeteer/dist/index.js"],
      "env": {
        "STEEL_LOCAL": "true"
      }
    }
  }
}

"path/to/steel-puppeteer/dist/index.js" 替换为您系统上已编译的 JavaScript 文件的实际路径。

环境变量

可以使用以下环境变量配置 Steel Puppeteer 服务器:

  • STEEL_LOCAL (可选,默认: "false"): 设置为 "true" 以使用本地 Steel 实例,而不是云服务。
  • STEEL_API_KEY (仅当 STEEL_LOCAL 为 "false" 时才需要): 使用云服务时用于身份验证的 Steel API 密钥。
  • STEEL_URL (可选): 如果使用自定义部署,则为 Steel 实例的 URL。

服务器配置

如果您直接运行 Steel Puppeteer 服务器(而不是通过 Claude Desktop),您可以在 shell 中设置这些环境变量,或者在项目根目录中创建一个 .env 文件。这是一个用于本地使用的 .env 文件示例:

STEEL_LOCAL=true

如果您使用 Steel 云服务,您的 .env 文件将如下所示:

STEEL_API_KEY=your-steel-api-key
STEEL_LOCAL=false

运行服务器

要启动 Steel Puppeteer 服务器:

  1. 安装依赖项:

    npm install
    
  2. 构建项目:

    npm run build
    
  3. 启动服务器:

    npm start
    
  4. 打开 Claude Desktop 并开始浏览! 服务器将启动并在指定的端口(默认:3000)上监听。

故障排除

  • 如果您遇到 Puppeteer 问题,请确保您的系统上已安装必要的依赖项。有关更多信息,请参阅 Puppeteer 故障排除指南
  • 如果使用 Steel 云服务,请确保您的 Steel API 密钥有效并具有必要的权限。
  • 如果使用本地 Steel 实例,请确保它正在运行并且可以在指定的 URL(如果自定义)或默认本地地址访问。

有关更详细的配置选项和高级用法,请参阅 Steel 文档和 Puppeteer API 参考。

推荐服务器

Baidu Map

Baidu Map

百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。

官方
精选
JavaScript
Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。

官方
精选
本地
TypeScript
Audiense Insights MCP Server

Audiense Insights MCP Server

通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。

官方
精选
本地
TypeScript
VeyraX

VeyraX

一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。

官方
精选
本地
graphlit-mcp-server

graphlit-mcp-server

模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。

官方
精选
TypeScript
Kagi MCP Server

Kagi MCP Server

一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。

官方
精选
Python
e2b-mcp-server

e2b-mcp-server

使用 MCP 通过 e2b 运行代码。

官方
精选
Neon MCP Server

Neon MCP Server

用于与 Neon 管理 API 和数据库交互的 MCP 服务器

官方
精选
Exa MCP Server

Exa MCP Server

模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。

官方
精选