UseScraper MCP Server

UseScraper MCP Server

一个基于 TypeScript 的 MCP 服务器,利用 UseScraper API 提供网页抓取功能,允许用户以各种格式从网页中提取内容。

内容获取
访问服务器

Tools

scrape

Scrape content from a webpage using UseScraper API

README

UseScraper MCP 服务器

smithery badge 这是一个基于 TypeScript 的 MCP 服务器,它使用 UseScraper API 提供网页抓取功能。它公开了一个名为 'scrape' 的工具,可以从各种格式的网页中提取内容。

<a href="https://glama.ai/mcp/servers/oqq8he02cy"><img width="380" height="200" src="https://glama.ai/mcp/servers/oqq8he02cy/badge" alt="UseScraper Server MCP server" /></a>

功能

工具

  • scrape - 从网页提取内容
    • 参数:
      • url (必需): 要抓取的网页的 URL
      • format (可选): 保存内容的格式 (text, html, markdown)。默认值: markdown
      • advanced_proxy (可选): 使用高级代理来规避机器人检测。默认值: false
      • extract_object (可选): 指定要提取的数据的对象

安装

通过 Smithery 安装

要通过 Smithery 为 Claude Desktop 自动安装 UseScraper:

npx -y @smithery/cli install usescraper-server --client claude

手动安装

  1. 克隆存储库:

    git clone https://github.com/your-repo/usescraper-server.git
    cd usescraper-server
    
  2. 安装依赖项:

    npm install
    
  3. 构建服务器:

    npm run build
    

配置

要与 Claude Desktop 一起使用,请添加服务器配置:

在 MacOS 上: ~/Library/Application Support/Claude/claude_desktop_config.json 在 Windows 上: %APPDATA%/Claude/claude_desktop_config.json

{
  "mcpServers": {
    "usescraper-server": {
      "command": "node",
      "args": ["/path/to/usescraper-server/build/index.js"],
      "env": {
        "USESCRAPER_API_KEY": "your-api-key-here"
      }
    }
  }
}

/path/to/usescraper-server 替换为服务器的实际路径,并将 your-api-key-here 替换为您的 UseScraper API 密钥。

用法

配置完成后,您可以通过 MCP 接口使用 'scrape' 工具。 用法示例:

{
  "name": "scrape",
  "arguments": {
    "url": "https://example.com",
    "format": "markdown"
  }
}

开发

对于具有自动重建功能的开发:

npm run watch

调试

由于 MCP 服务器通过 stdio 进行通信,因此调试可能具有挑战性。 我们建议使用 MCP Inspector,它作为包脚本提供:

npm run inspector

Inspector 将提供一个 URL 以访问浏览器中的调试工具。

推荐服务器

mult-fetch-mcp-server

mult-fetch-mcp-server

一个多功能的、符合 MCP 规范的网页内容抓取工具,支持多种模式(浏览器/Node)、格式(HTML/JSON/Markdown/文本)和智能代理检测,并提供双语界面(英语/中文)。

精选
本地
Knowledge Graph Memory Server

Knowledge Graph Memory Server

为 Claude 实现持久性记忆,使用本地知识图谱,允许 AI 记住用户的信息,并可在自定义位置存储,跨对话保持记忆。

精选
本地
Hyperbrowser

Hyperbrowser

欢迎来到 Hyperbrowser,人工智能的互联网。Hyperbrowser 是下一代平台,旨在增强人工智能代理的能力,并实现轻松、可扩展的浏览器自动化。它专为人工智能开发者打造,消除了本地基础设施和性能瓶颈带来的麻烦,让您能够:

精选
本地
Exa MCP Server

Exa MCP Server

一个模型上下文协议服务器,它使像 Claude 这样的人工智能助手能够以安全和受控的方式,使用 Exa AI 搜索 API 执行实时网络搜索。

精选
mcp-perplexity

mcp-perplexity

Perplexity API 的 MCP 服务器。

精选
MCP Web Research Server

MCP Web Research Server

一个模型上下文协议服务器,使 Claude 能够通过集成 Google 搜索、提取网页内容和捕获屏幕截图来进行网络研究。

精选
PubMedSearch MCP Server

PubMedSearch MCP Server

一个模型内容协议(Model Content Protocol)服务器,提供从 PubMed 数据库搜索和检索学术论文的工具。

精选
YouTube Translate MCP

YouTube Translate MCP

一个模型上下文协议服务器,可以通过文字稿、翻译、摘要和各种语言的字幕生成来访问 YouTube 视频内容。

精选
mcp-codex-keeper

mcp-codex-keeper

作为开发知识的守护者,为 AI 助手提供精心策划的最新文档和最佳实践访问权限。

精选
Perplexity Deep Research MCP

Perplexity Deep Research MCP

一个服务器,它允许 AI 助手使用 Perplexity 的 sonar-deep-research 模型进行网络搜索,并提供引用支持。

精选