
Sitemcp
ryoppippi
README
sitemcp
抓取整个网站并将其用作 MCP 服务器
https://github.com/user-attachments/assets/ebe2d7c6-4ddc-4a37-8e1e-d80fac49d8ae
<details> <summary><bold>日语演示</bold></summary>
https://github.com/user-attachments/assets/24288140-be2a-416c-9e7c-c49be056a373
</details>
安装
一次性使用(选择以下之一):
bunx sitemcp
npx sitemcp
pnpx sitemcp
全局安装(选择以下之一):
bun i -g sitemcp
npm i -g sitemcp
pnpm i -g sitemcp
用法
sitemcp https://daisyui.com
# 或者更好的并发
sitemcp https://daisyui.com --concurrency 10
匹配特定页面
使用 -m, --match
标志来指定您想要抓取的页面:
sitemcp https://vite.dev -m "/blog/**" -m "/guide/**"
匹配模式针对目标页面的路径名进行测试,由 micromatch 提供支持,您可以查看所有支持的匹配功能。
内容选择器
我们使用 mozilla/readability 从网页中提取可读内容,但在某些页面上,它可能会返回不相关的内容,在这种情况下,您可以指定一个 CSS 选择器,以便我们知道在哪里找到可读内容:
sitemcp https://vite.dev --content-selector ".content"
如何配置 MCP 客户端
您可以从您的 MCP 客户端(例如 Claude Desktop)执行服务器。
以下是 Claude Desktop 的示例配置
{
"mcpServers": {
"daisy-ui": {
"command": "npx",
"args": [
"-y",
"sitemcp",
"https://daisyui.com",
"-m",
"/components/**",
]
}
}
}
提示
- 某些网站有很多页面。 最好在将服务器注册到 MCP 客户端之前运行
sitemcp
。 默认情况下,sitemcp
将页面缓存在~/.cache/sitemcp
中。 您可以通过--no-cache
标志禁用缓存。
许可证
MIT。
统计
<a href="https://www.star-history.com/#ryoppippi/sitemcp&Date"> <picture> <source media="(prefers-color-scheme: dark)" srcset="https://api.star-history.com/svg?repos=ryoppippi/sitemcp&type=Date&theme=dark" /> <source media="(prefers-color-scheme: light)" srcset="https://api.star-history.com/svg?repos=ryoppippi/sitemcp&type=Date" /> <img alt="Star History Chart" src="https://api.star-history.com/svg?repos=ryoppippi/sitemcp&type=Date" /> </picture> </a>
推荐服务器
Playwright MCP Server
一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。
Magic Component Platform (MCP)
一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。
MCP Package Docs Server
促进大型语言模型高效访问和获取 Go、Python 和 NPM 包的结构化文档,通过多语言支持和性能优化来增强软件开发。
Claude Code MCP
一个实现了 Claude Code 作为模型上下文协议(Model Context Protocol, MCP)服务器的方案,它可以通过标准化的 MCP 接口来使用 Claude 的软件工程能力(代码生成、编辑、审查和文件操作)。
@kazuph/mcp-taskmanager
用于任务管理的模型上下文协议服务器。它允许 Claude Desktop(或任何 MCP 客户端)在基于队列的系统中管理和执行任务。
mermaid-mcp-server
一个模型上下文协议 (MCP) 服务器,用于将 Mermaid 图表转换为 PNG 图像。
Jira-Context-MCP
MCP 服务器向 AI 编码助手(如 Cursor)提供 Jira 工单信息。

Linear MCP Server
一个模型上下文协议(Model Context Protocol)服务器,它与 Linear 的问题跟踪系统集成,允许大型语言模型(LLM)通过自然语言交互来创建、更新、搜索和评论 Linear 问题。

Sequential Thinking MCP Server
这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。
Curri MCP Server
通过管理文本笔记、提供笔记创建工具以及使用结构化提示生成摘要,从而实现与 Curri API 的交互。