MCP Webscan Server
镜子 (jìng zi)
MCP-Mirror
README
MCP Webscan 服务器
一个用于网页内容扫描和分析的模型上下文协议 (MCP) 服务器。此服务器提供用于获取、分析和提取网页信息的工具。
功能特性
- 页面获取: 将网页转换为 Markdown 格式,便于分析
- 链接提取: 从网页中提取和分析链接
- 站点爬取: 递归地爬取网站以发现内容
- 链接检查: 识别网页上的坏链
- 模式匹配: 查找与特定模式匹配的 URL
- 站点地图生成: 为网站生成 XML 站点地图
安装
# 克隆仓库
git clone <repository-url>
cd mcp-server-webscan
# 安装依赖
npm install
# 构建项目
npm run build
使用方法
启动服务器
npm start
该服务器运行在 stdio 传输上,使其与 Claude Desktop 等 MCP 客户端兼容。
可用工具
-
fetch_page
- 获取网页并将其转换为 Markdown 格式
- 参数:
url
(必需): 要获取的页面的 URLselector
(可选): 用于定位特定内容的 CSS 选择器
-
extract_links
- 提取网页中的所有链接及其文本
- 参数:
url
(必需): 要分析的页面的 URLbaseUrl
(可选): 用于过滤链接的基础 URL
-
crawl_site
- 递归地爬取网站,直到指定的深度
- 参数:
url
(必需): 要爬取的起始 URLmaxDepth
(可选, 默认: 2): 最大爬取深度
-
check_links
- 检查页面上的坏链
- 参数:
url
(必需): 要检查链接的 URL
-
find_patterns
- 查找与特定模式匹配的 URL
- 参数:
url
(必需): 要搜索的 URLpattern
(必需): 用于匹配 URL 的正则表达式模式
-
generate_sitemap
- 生成一个简单的 XML 站点地图
- 参数:
url
(必需): 站点地图的根 URLmaxUrls
(可选, 默认: 100): 要包含的最大 URL 数量
与 Claude Desktop 一起使用的示例
- 在您的 Claude Desktop 设置中配置服务器:
{
"mcpServers": {
"webscan": {
"command": "node",
"args": ["path/to/mcp-server-webscan/dist/index.js"],
"env": {
"NODE_ENV": "development"
}
}
}
}
- 在您的对话中使用这些工具:
你能从 https://example.com 获取内容并将其转换为 Markdown 格式吗?
开发
前提条件
- Node.js >= 18
- npm
项目结构
mcp-server-webscan/
├── src/
│ └── index.ts # 主要服务器实现
├── dist/ # 编译后的 JavaScript
├── package.json
└── tsconfig.json
构建
npm run build
开发模式
npm run dev
错误处理
服务器实现了全面的错误处理:
- 无效的参数
- 网络错误
- 内容解析错误
- URL 验证
所有错误都按照 MCP 规范正确格式化。
贡献
- Fork 仓库
- 创建您的功能分支 (
git checkout -b feature/amazing-feature
) - 提交您的更改 (
git commit -m 'Add some amazing feature'
) - 推送到分支 (
git push origin feature/amazing-feature
) - 打开一个 Pull Request
许可证
MIT 许可证 - 有关详细信息,请参阅 LICENSE 文件
推荐服务器
Crypto Price & Market Analysis MCP Server
一个模型上下文协议 (MCP) 服务器,它使用 CoinCap API 提供全面的加密货币分析。该服务器通过一个易于使用的界面提供实时价格数据、市场分析和历史趋势。 (Alternative, slightly more formal and technical translation): 一个模型上下文协议 (MCP) 服务器,利用 CoinCap API 提供全面的加密货币分析服务。该服务器通过用户友好的界面,提供实时价格数据、市场分析以及历史趋势数据。
MCP PubMed Search
用于搜索 PubMed 的服务器(PubMed 是一个免费的在线数据库,用户可以在其中搜索生物医学和生命科学文献)。 我是在 MCP 发布当天创建的,但当时正在度假。 我看到有人在您的数据库中发布了类似的服务器,但还是决定发布我的服务器。
mixpanel
连接到您的 Mixpanel 数据。 从 Mixpanel 分析查询事件、留存和漏斗数据。

Sequential Thinking MCP Server
这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

Nefino MCP Server
为大型语言模型提供访问德国可再生能源项目新闻和信息的能力,允许按地点、主题(太阳能、风能、氢能)和日期范围进行筛选。
Vectorize
将 MCP 服务器向量化以实现高级检索、私有深度研究、Anything-to-Markdown 文件提取和文本分块。
Mathematica Documentation MCP server
一个服务器,通过 FastMCP 提供对 Mathematica 文档的访问,使用户能够从 Wolfram Mathematica 检索函数文档和列出软件包符号。
kb-mcp-server
一个 MCP 服务器,旨在实现便携性、本地化、简易性和便利性,以支持对 txtai “all in one” 嵌入数据库进行基于语义/图的检索。任何 tar.gz 格式的 txtai 嵌入数据库都可以被加载。
Research MCP Server
这个服务器用作 MCP 服务器,与 Notion 交互以检索和创建调查数据,并与 Claude Desktop Client 集成以进行和审查调查。

Cryo MCP Server
一个API服务器,实现了模型补全协议(MCP),用于Cryo区块链数据提取,允许用户通过任何兼容MCP的客户端查询以太坊区块链数据。