Claude Web Scraper MCP

Claude Web Scraper MCP

一个简单的 MCP 服务器,集成了 eGet 网页抓取工具和 Claude for Desktop。此连接器允许 Claude 通过您本地的 eGet API 抓取网页内容,从而可以直接在对话中进行网站的搜索、总结和分析。

vishwajeetdabholkar

开发者工具
访问服务器

README

Claude Web Scraper MCP

一个简单的模型上下文协议 (MCP) 服务器,用于将桌面版 Claude 连接到本地运行的 eGet 网络爬虫。 这允许 Claude 通过您的本地 API 抓取网站内容。

前提条件

  • 桌面版 Claude
  • Python 3.7+
  • eGet 网络爬虫 (来自 https://github.com/vishwajeetdabholkar/eGet-Crawler-for-ai)

设置说明

1. 设置 eGet 网络爬虫

首先,确保您已运行 eGet 网络爬虫:

# 克隆 eGet 仓库
git clone https://github.com/vishwajeetdabholkar/eGet-Crawler-for-ai
cd eGet-Crawler-for-ai

# 根据其说明设置并运行 eGet
# (通常使用 Docker 或本地 Python 安装)

# 验证 API 是否正在运行 (默认: http://localhost:8000/api/v1/scrape)

2. 设置 MCP 服务器

# 创建项目目录
mkdir claude-scraper-mcp
cd claude-scraper-mcp

# 设置 UV 和虚拟环境
uv venv
source .venv/bin/activate  # 在 Windows 上: .venv\Scripts\activate

# 安装依赖
uv add "mcp[cli]" httpx

# 创建 MCP 服务器脚本
touch scrape_mcp_server.py

scrape_mcp_server.py 代码复制到该文件中。

3. 配置桌面版 Claude

  1. 创建或编辑 Claude 桌面配置:
# 在 macOS 上
mkdir -p ~/Library/Application\ Support/Claude/
  1. 将此配置添加到 ~/Library/Application Support/Claude/claude_desktop_config.json
{
    "mcpServers": {
        "scrape-service": {
            "command": "/absolute/path/to/claude-scraper-mcp/.venv/bin/python",
            "args": [
                "/absolute/path/to/claude-scraper-mcp/scrape_mcp_server.py"
            ]
        }
    }
}

将路径替换为您的虚拟环境和脚本的实际绝对路径。

  1. 重启桌面版 Claude

用法

设置完成后,您可以使用 Claude 通过以下命令抓取网站:

  • "抓取 https://example.com 的内容并进行总结"
  • "获取有关 https://news.ycombinator.com 网站的信息"

故障排除

如果您遇到问题:

  1. 检查 eGet 爬虫是否正在运行
  2. 验证脚本中的 API 端点是否与您的 eGet 配置匹配
  3. 确保桌面版 Claude 正在使用正确的 Python 解释器
  4. 在更改配置后重启桌面版 Claude

推荐服务器

Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。

官方
精选
本地
TypeScript
MCP Package Docs Server

MCP Package Docs Server

促进大型语言模型高效访问和获取 Go、Python 和 NPM 包的结构化文档,通过多语言支持和性能优化来增强软件开发。

精选
本地
TypeScript
Claude Code MCP

Claude Code MCP

一个实现了 Claude Code 作为模型上下文协议(Model Context Protocol, MCP)服务器的方案,它可以通过标准化的 MCP 接口来使用 Claude 的软件工程能力(代码生成、编辑、审查和文件操作)。

精选
本地
JavaScript
@kazuph/mcp-taskmanager

@kazuph/mcp-taskmanager

用于任务管理的模型上下文协议服务器。它允许 Claude Desktop(或任何 MCP 客户端)在基于队列的系统中管理和执行任务。

精选
本地
JavaScript
mermaid-mcp-server

mermaid-mcp-server

一个模型上下文协议 (MCP) 服务器,用于将 Mermaid 图表转换为 PNG 图像。

精选
JavaScript
Jira-Context-MCP

Jira-Context-MCP

MCP 服务器向 AI 编码助手(如 Cursor)提供 Jira 工单信息。

精选
TypeScript
Linear MCP Server

Linear MCP Server

一个模型上下文协议(Model Context Protocol)服务器,它与 Linear 的问题跟踪系统集成,允许大型语言模型(LLM)通过自然语言交互来创建、更新、搜索和评论 Linear 问题。

精选
JavaScript
Sequential Thinking MCP Server

Sequential Thinking MCP Server

这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

精选
Python
Curri MCP Server

Curri MCP Server

通过管理文本笔记、提供笔记创建工具以及使用结构化提示生成摘要,从而实现与 Curri API 的交互。

官方
本地
JavaScript