Fetch MCP Server

Fetch MCP Server

一个模型上下文协议服务器,提供网页内容获取功能。

tgambet

研究与数据
访问服务器

README

Fetch MCP Server

这是官方 Fetch MCP Server 的 Node.js 移植版本。请查看 与原始项目的关键差异 部分以了解更多详细信息。

描述

一个 Model Context Protocol 服务器,提供网页内容抓取功能。该服务器使 LLM 能够检索和处理网页内容,并将 HTML 转换为 markdown,以便更容易使用。

fetch 工具会截断响应,但通过使用 start_index 参数,您可以指定内容提取的起始位置。这使模型可以分块读取网页,直到找到所需的信息。

可用工具

  • fetch - 从互联网抓取 URL 并将其内容提取为 markdown。
    • url (字符串,必需): 要抓取的 URL
    • max_length (整数,可选): 要返回的最大字符数(默认值:5000)
    • start_index (整数,可选): 从此字符索引开始内容(默认值:0)
    • raw (布尔值,可选): 获取原始内容,不进行 markdown 转换(默认值:false)

可用提示

  • fetch - 抓取 URL 并将其内容提取为 markdown
    • url (字符串,必需): 要抓取的 URL

用法

mcp-fetch-node 默认在 8080 端口的 /sse 暴露一个 SSE 端点。

Node.js:

npx -y mcp-fetch-node

Docker:

docker run -it tgambet/mcp-fetch-node

自定义 - robots.txt

默认情况下,如果请求来自模型(通过工具),服务器将遵守网站的 robots.txt 文件,但如果请求是由用户发起的(通过提示),则不会。可以通过将参数 --ignore-robots-txt 添加到运行命令来禁用此行为。

自定义 - User-agent

默认情况下,根据请求是来自模型(通过工具)还是由用户发起的(通过提示),服务器将使用以下 user-agent:

# 工具调用
ModelContextProtocol/1.0 (Autonomous; +https://github.com/tgambet/mcp-fetch-node)

# 提示
ModelContextProtocol/1.0 (User-Specified; +https://github.com/tgambet/mcp-fetch-node)

可以通过将参数 --user-agent=YourUserAgent 添加到运行命令来自定义此行为,这将覆盖两者。

与原始项目的关键差异

  • 此实现是用 TypeScript 编写的,并以 Node.js 运行时为目标。 它适用于 python 不可用的情况。

  • 此实现提供 SSE 接口而不是 stdio。 它更适合作为 Web 服务部署,从而提高了灵活性。

  • 此实现不依赖 Readability.js 库进行内容提取。 它使用自定义实现,该实现更通用,更适合非新闻相关的网站。

但是,api 和工具描述与原始项目相同,因此您可以尝试使用 mcp-fetch-node 作为原始项目的直接替代品。

请将任何问题报告给 issue tracker

特性

  • 从 URL 抓取并提取相关内容
  • 尊重 robots.txt(可以禁用)
  • User-Agent 自定义
  • Markdown 转换
  • 分页

开发

pnpm install
pnpm dev
pnpm lint:fix
pnpm format
pnpm test
pnpm build
pnpm start
pnpm inspect

贡献

欢迎贡献!请随时提交 Pull Request。

许可证

MIT

TODO

  • [ ] 添加用户日志和进度
  • [ ] 添加文档和示例
  • [ ] 性能基准测试和改进
  • [ ] 提取质量的基准测试:cf https://github.com/adbar/trafilatura/blob/master/tests/comparison_small.py

推荐服务器

Crypto Price & Market Analysis MCP Server

Crypto Price & Market Analysis MCP Server

一个模型上下文协议 (MCP) 服务器,它使用 CoinCap API 提供全面的加密货币分析。该服务器通过一个易于使用的界面提供实时价格数据、市场分析和历史趋势。 (Alternative, slightly more formal and technical translation): 一个模型上下文协议 (MCP) 服务器,利用 CoinCap API 提供全面的加密货币分析服务。该服务器通过用户友好的界面,提供实时价格数据、市场分析以及历史趋势数据。

精选
TypeScript
MCP PubMed Search

MCP PubMed Search

用于搜索 PubMed 的服务器(PubMed 是一个免费的在线数据库,用户可以在其中搜索生物医学和生命科学文献)。 我是在 MCP 发布当天创建的,但当时正在度假。 我看到有人在您的数据库中发布了类似的服务器,但还是决定发布我的服务器。

精选
Python
mixpanel

mixpanel

连接到您的 Mixpanel 数据。 从 Mixpanel 分析查询事件、留存和漏斗数据。

精选
TypeScript
Sequential Thinking MCP Server

Sequential Thinking MCP Server

这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

精选
Python
Nefino MCP Server

Nefino MCP Server

为大型语言模型提供访问德国可再生能源项目新闻和信息的能力,允许按地点、主题(太阳能、风能、氢能)和日期范围进行筛选。

官方
Python
Vectorize

Vectorize

将 MCP 服务器向量化以实现高级检索、私有深度研究、Anything-to-Markdown 文件提取和文本分块。

官方
JavaScript
Mathematica Documentation MCP server

Mathematica Documentation MCP server

一个服务器,通过 FastMCP 提供对 Mathematica 文档的访问,使用户能够从 Wolfram Mathematica 检索函数文档和列出软件包符号。

本地
Python
kb-mcp-server

kb-mcp-server

一个 MCP 服务器,旨在实现便携性、本地化、简易性和便利性,以支持对 txtai “all in one” 嵌入数据库进行基于语义/图的检索。任何 tar.gz 格式的 txtai 嵌入数据库都可以被加载。

本地
Python
Research MCP Server

Research MCP Server

这个服务器用作 MCP 服务器,与 Notion 交互以检索和创建调查数据,并与 Claude Desktop Client 集成以进行和审查调查。

本地
Python
Cryo MCP Server

Cryo MCP Server

一个API服务器,实现了模型补全协议(MCP),用于Cryo区块链数据提取,允许用户通过任何兼容MCP的客户端查询以太坊区块链数据。

本地
Python