Scrapezy

Scrapezy
官方

MCP服务器启用与Scrapezy的集成,以从网站检索结构化数据。

浏览器自动化
搜索
JavaScript
访问服务器

Tools

extract-structured-data

Extract structured data from a website.

README

@scrapezy/mcp MCP 服务器

<a href="https://glama.ai/mcp/servers/rnktqsouvy"> <img width="380" height="200" src="https://glama.ai/mcp/servers/rnktqsouvy/badge" alt="Scrapezy MCP 服务器" /> </a>

smithery badge

一个用于 Scrapezy 的模型上下文协议服务器,使 AI 模型能够从网站提取结构化数据。

功能

工具

  • extract_structured_data - 从网站提取结构化数据
    • 需要 URL 和提示作为必需参数
    • 返回从网站提取的基于提示的结构化数据
    • 提示应清楚地描述要从网站提取的数据

安装

通过 Smithery 安装

要通过 Smithery 为 Claude Desktop 自动安装 Scrapezy MCP 服务器:

npx -y @smithery/cli install @Scrapezy/mcp --client claude

手动安装

npm install -g @scrapezy/mcp

用法

API 密钥设置

有两种方法可以提供您的 Scrapezy API 密钥:

  1. 环境变量:

    export SCRAPEZY_API_KEY=your_api_key
    npx @scrapezy/mcp
    
  2. 命令行参数:

    npx @scrapezy/mcp --api-key=your_api_key
    

要与 Claude Desktop 一起使用,请添加服务器配置:

在 MacOS 上:~/Library/Application Support/Claude/claude_desktop_config.json 在 Windows 上:%APPDATA%/Claude/claude_desktop_config.json

{
  "mcpServers": {
    "scrapezy": {
      "command": "npx @scrapezy/mcp --api-key=your_api_key"
    }
  }
}

在 Claude 中的使用示例

您可以在 Claude 中使用如下提示来使用此工具:

请从以下页面提取产品信息:https://example.com/product
提取产品名称、价格、描述和可用颜色。

Claude 将使用 MCP 服务器从网站提取请求的结构化数据。

调试

由于 MCP 服务器通过 stdio 进行通信,因此调试可能具有挑战性。 我们建议使用 MCP Inspector,它作为包脚本提供:

npm run inspector

Inspector 将提供一个 URL 以访问浏览器中的调试工具。

许可证

MIT

推荐服务器

Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Kagi MCP Server

Kagi MCP Server

一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。

官方
精选
Python
Exa MCP Server

Exa MCP Server

模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。

官方
精选
Playwright MCP Server

Playwright MCP Server

提供一个利用模型上下文协议的服务器,以实现类人浏览器的自动化,该服务器使用 Playwright,允许控制浏览器行为,例如导航、元素交互和滚动。

精选
本地
TypeScript
@kazuph/mcp-fetch

@kazuph/mcp-fetch

用于获取网页内容和处理图像的模型上下文协议服务器。这使得 Claude Desktop(或任何 MCP 客户端)能够适当地获取网页内容和处理图像。

精选
本地
JavaScript
Claude Code MCP

Claude Code MCP

一个实现了 Claude Code 作为模型上下文协议(Model Context Protocol, MCP)服务器的方案,它可以通过标准化的 MCP 接口来使用 Claude 的软件工程能力(代码生成、编辑、审查和文件操作)。

精选
本地
JavaScript
DuckDuckGo MCP Server

DuckDuckGo MCP Server

一个模型上下文协议 (MCP) 服务器,通过 DuckDuckGo 提供网页搜索功能,并具有内容获取和解析的附加功能。

精选
Python
Supabase MCP Server

Supabase MCP Server

一个模型上下文协议(MCP)服务器,它提供对 Supabase 管理 API 的编程访问。该服务器允许 AI 模型和其他客户端通过标准化的接口来管理 Supabase 项目和组织。

精选
JavaScript
YouTube Transcript MCP Server

YouTube Transcript MCP Server

这个服务器用于获取指定 YouTube 视频 URL 的字幕,从而可以与 Goose CLI 或 Goose Desktop 集成,进行字幕提取和处理。

精选
Python
serper-search-scrape-mcp-server

serper-search-scrape-mcp-server

这个 Serper MCP 服务器支持搜索和网页抓取,并且支持 Serper API 引入的所有最新参数,例如位置信息。

精选
TypeScript