📚 MCP Docs Search Server

📚 MCP Docs Search Server

这是一个轻量级的、即插即用的 MCP 服务器,它使像 Claude 或 GPT 这样的大型语言模型能够动态地搜索和检索来自流行的 AI 库(如 LangChain、LlamaIndex 和 OpenAI)的最新文档。

RohitKrish46

研究与数据
访问服务器

README

📚 MCP 文档搜索服务器

一个轻量级的 MCP 服务器,它结合了网络搜索和内容解析,从流行的 AI 库(如 LangChain、LlamaIndex 和 OpenAI)中搜索并检索相关的文档内容。

该项目允许语言模型动态地查询和获取最新的文档内容,充当 LLM 和外部文档源之间的桥梁。

模型上下文协议 (MCP)

模型上下文协议是一个开放标准,使开发人员能够在他们的数据源和 AI 驱动的工具之间建立安全的双向连接。该架构非常简单:开发人员可以通过 MCP 服务器公开他们的数据,或者构建连接到这些服务器的 AI 应用程序(MCP 客户端)。

孤立的 LLM

单独的 LLM 是有限的 —— 只有通过 MCP 等框架与工具和服务集成,才能释放它们的真正潜力。

LLM_on_its_own

  1. 没有工具的 LLM 是静态的,效用有限。

  2. 有了工具,它们变得具有交互性,但编排可能很混乱。

  3. 通过 MCP,LLM 获得了一个可扩展的、即插即用的接口,可以连接到真实世界的服务,使其在生产环境中更加实用和强大。

MCP 生态系统

MCP 服务器充当 LLM 和服务之间的翻译器/接口。

MCP(模块化能力提供者)标准化了 LLM 与外部工具/服务交互的方式 —— 从而促进了互操作性、模块化和更清晰的接口。

MCP_ecosystem

这种结构分散了责任:

  1. 工具提供商构建和维护他们自己的 MCP 服务器实现。

  2. LLM 只需要使用 MCP 协议。

MCP

目的和愿景:

  • 标准化 LLM 和外部工具之间的通信

  • 避免定制集成

  • 鼓励可扩展的服务生态系统(如插件架构)

🚀 功能

🔍 网络搜索集成 使用 Serper API 查询 Google 并检索与给定搜索查询相关的热门文档页面。

🧹 清理内容提取 使用 BeautifulSoup 解析 HTML 内容,提取干净、易于阅读的文本 —— 去除不必要的标签、广告或导航内容。

🤖 无缝 LLM 工具 公开了一个结构化的 get_docs 工具,该工具可以在 LLM 代理(例如 Claude、GPT)中使用,以实时查询特定库。

🛠️工具

get_docs(query: str, library: str)

这是 MCP 服务器提供的核心工具。 它接受:

query: 搜索词或短语。

library: langchain、llama-index 或 openai 之一。

工作流程

  1. 🔍 搜索相关的文档页面
  2. 📄 获取并解析干净的文本内容
  3. 🧠 将结果发送回 LLM 以进行进一步的推理和响应

📦 设置

  1. 克隆存储库
git clone https://github.com/your-username/mcp-docs-search.git
cd mcp-docs-search
  1. 使用 uv 创建一个虚拟环境并激活它
uv venv .venv

.\.venv\Scripts\activate
  1. 安装依赖项
uv add "mcp[cli]" httpx
uv pip install beautifulsoup4
  1. 设置您的环境变量。创建一个 .env 文件并添加您的 Serper API 密钥:
SERPER_API_KEY=your_serper_api_key

🧩 Claude Desktop 集成

要将此服务器作为工具集成到 Claude Desktop 中:

打开 Claude Desktop → 文件 > 设置 > 开发者 > 编辑配置。

更新您的 claude_desktop_config.json 以包含以下内容:

{
    "mcpServers": {
        "documnetation": {
            "command": "uv",
            "args": [
                "--directory",
                "your_reository_where_the_repo_exists",
                "run",
                "main.py"
            ]

        }
    }
}

🔁 重要提示:保存配置后重启 Claude Desktop 以加载新配置

成功集成后,您将在 Claude UI 中看到您的自定义 MCP 工具:

image

使用它来实时查询文档:

MCP_tool_working

Working_MCP

🪲 实时调试

也可以使用以下命令调试我们创建的工具。

记住要安装 NodeJs18+

npx @modelcontextprotocol/inspector uv run main.py

并按照提示连接到设置的端口。

image

🧰 支持的库/文档

LangChain

LlamaIndex

OpenAI

可以通过更新 docs_urls 字典轻松添加更多库。

🧠 未来增强

  • ✅ 增加对其他库的支持,如 HuggingFace、PyTorch、TensorFlow 等。

  • ⚡ 实施缓存以减少冗余获取并提高性能。

  • 📈 引入基于相关性或令牌质量的评分/排名机制。

  • 🧪 单元测试和更好的异常处理,以实现生产就绪。

推荐服务器

Crypto Price & Market Analysis MCP Server

Crypto Price & Market Analysis MCP Server

一个模型上下文协议 (MCP) 服务器,它使用 CoinCap API 提供全面的加密货币分析。该服务器通过一个易于使用的界面提供实时价格数据、市场分析和历史趋势。 (Alternative, slightly more formal and technical translation): 一个模型上下文协议 (MCP) 服务器,利用 CoinCap API 提供全面的加密货币分析服务。该服务器通过用户友好的界面,提供实时价格数据、市场分析以及历史趋势数据。

精选
TypeScript
MCP PubMed Search

MCP PubMed Search

用于搜索 PubMed 的服务器(PubMed 是一个免费的在线数据库,用户可以在其中搜索生物医学和生命科学文献)。 我是在 MCP 发布当天创建的,但当时正在度假。 我看到有人在您的数据库中发布了类似的服务器,但还是决定发布我的服务器。

精选
Python
mixpanel

mixpanel

连接到您的 Mixpanel 数据。 从 Mixpanel 分析查询事件、留存和漏斗数据。

精选
TypeScript
Sequential Thinking MCP Server

Sequential Thinking MCP Server

这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

精选
Python
Nefino MCP Server

Nefino MCP Server

为大型语言模型提供访问德国可再生能源项目新闻和信息的能力,允许按地点、主题(太阳能、风能、氢能)和日期范围进行筛选。

官方
Python
Vectorize

Vectorize

将 MCP 服务器向量化以实现高级检索、私有深度研究、Anything-to-Markdown 文件提取和文本分块。

官方
JavaScript
Mathematica Documentation MCP server

Mathematica Documentation MCP server

一个服务器,通过 FastMCP 提供对 Mathematica 文档的访问,使用户能够从 Wolfram Mathematica 检索函数文档和列出软件包符号。

本地
Python
kb-mcp-server

kb-mcp-server

一个 MCP 服务器,旨在实现便携性、本地化、简易性和便利性,以支持对 txtai “all in one” 嵌入数据库进行基于语义/图的检索。任何 tar.gz 格式的 txtai 嵌入数据库都可以被加载。

本地
Python
Research MCP Server

Research MCP Server

这个服务器用作 MCP 服务器,与 Notion 交互以检索和创建调查数据,并与 Claude Desktop Client 集成以进行和审查调查。

本地
Python
Cryo MCP Server

Cryo MCP Server

一个API服务器,实现了模型补全协议(MCP),用于Cryo区块链数据提取,允许用户通过任何兼容MCP的客户端查询以太坊区块链数据。

本地
Python