Knowledge Base MCP Server

Knowledge Base MCP Server

镜子 (jìng zi)

MCP-Mirror

研究与数据
访问服务器

README

知识库 MCP 服务器

此 MCP 服务器提供用于列出和检索来自不同知识库的内容的工具。

<a href="https://glama.ai/mcp/servers/n0p6v0o0a4"> <img width="380" height="200" src="https://glama.ai/mcp/servers/n0p6v0o0a4/badge" alt="Knowledge Base Server MCP server" /> </a>

设置说明

以下说明假设您的系统上已安装 Node.js 和 npm。

先决条件

  • Node.js (版本 16 或更高)
  • npm (Node 包管理器)
  1. 克隆存储库:

    git clone <repository_url>
    cd knowledge-base-mcp-server
    
  2. 安装依赖项:

    npm install
    
  3. 配置环境变量:

    • 服务器需要设置 HUGGINGFACE_API_KEY 环境变量。 这是 Hugging Face Inference API 的 API 密钥,用于为知识库内容生成嵌入。 您可以从 Hugging Face 网站 (https://huggingface.co/) 获取免费 API 密钥。
    • 服务器需要设置 KNOWLEDGE_BASES_ROOT_DIR 环境变量。 此变量指定知识库子目录所在的目录。 如果您未设置此变量,它将默认为 $HOME/knowledge_bases,其中 $HOME 是当前用户的主目录。
    • 服务器支持 FAISS_INDEX_PATH 环境变量,用于指定 FAISS 索引的路径。 如果未设置,它将默认为 $HOME/knowledge_bases/.faiss
    • 服务器支持 HUGGINGFACE_MODEL_NAME 环境变量,用于指定用于生成嵌入的 Hugging Face 模型。 如果未设置,它将默认为 sentence-transformers/all-MiniLM-L6-v2
    • 您可以在 .bashrc.zshrc 文件中设置这些环境变量,也可以直接在 MCP 设置中设置。
  4. 构建服务器:

    npm run build
    
  5. 将服务器添加到 MCP 设置:

    • 编辑位于 /home/jean/.vscode-server/data/User/globalStorage/saoudrizwan.claude-dev/settings/cline_mcp_settings.json 文件。
    • 将以下配置添加到 mcpServers 对象:
    "knowledge-base-mcp": {
      "command": "node",
      "args": [
        "/path/to/knowledge-base-mcp-server/build/index.js"
      ],
      "disabled": false,
      "autoApprove": [],
      "env": {
        "KNOWLEDGE_BASES_ROOT_DIR": "/path/to/knowledge_bases",
        "HUGGINGFACE_API_KEY": "YOUR_HUGGINGFACE_API_KEY",
      },
      "description": "从知识库中检索基于查询的相似块。"
    },
    
    • /path/to/knowledge-base-mcp-server 替换为服务器目录的实际路径。
    • /path/to/knowledge_bases 替换为知识库目录的实际路径。
  6. 创建知识库目录:

    • KNOWLEDGE_BASES_ROOT_DIR 中为每个知识库创建子目录(例如,companyit_supportonboarding)。
    • 将包含知识库内容的文本文件(例如,.txt.md)放置在这些子目录中。
  • 服务器递归读取指定知识库子目录中的所有文本文件(例如,.txt.md)。
  • 服务器跳过隐藏文件和目录(以 . 开头的文件和目录)。
  • 对于每个文件,服务器计算 SHA256 哈希值,并将其存储在隐藏的 .index 子目录中具有相同名称的文件中。 此哈希值用于确定自上次索引以来文件是否已修改。
  • 文件内容使用 langchain/text_splitter 中的 MarkdownTextSplitter 分割成块。
  • 然后将每个块的内容添加到 FAISS 索引,该索引用于相似性搜索。
  • FAISS 索引在服务器启动时自动初始化。 它检查知识库文件中的更改并相应地更新索引。

用法

服务器公开两个工具:

  • list_knowledge_bases:列出可用的知识库。
  • retrieve_knowledge:根据查询从知识库中检索相似的块。 (可选)如果指定了知识库,则仅搜索该知识库;否则,将考虑所有可用的知识库。 默认情况下,最多返回 10 个文档块,其得分低于 2 的阈值。 可以使用 threshold 参数选择性地提供不同的阈值。

您可以通过 MCP 界面使用这些工具。

retrieve_knowledge 工具使用 FAISS 索引执行语义搜索。 当服务器启动或知识库中的文件被修改时,索引会自动更新。

retrieve_knowledge 工具的输出是一个 markdown 格式的字符串,具有以下结构:

## 语义搜索结果

**结果 1:**

[最相似块的内容]

**来源:**
```json
{
  "source": "[包含该块的文件的路径]"
}
```

---

**结果 2:**

[第二个最相似块的内容]

**来源:**
```json
{
  "source": "[包含该块的文件的路径]"
}
```

> **免责声明:** 提供的结果可能并非都相关。 请交叉检查信息的关联性。

每个结果都包括最相似块的内容、源文件和相似度得分。

推荐服务器

Crypto Price & Market Analysis MCP Server

Crypto Price & Market Analysis MCP Server

一个模型上下文协议 (MCP) 服务器,它使用 CoinCap API 提供全面的加密货币分析。该服务器通过一个易于使用的界面提供实时价格数据、市场分析和历史趋势。 (Alternative, slightly more formal and technical translation): 一个模型上下文协议 (MCP) 服务器,利用 CoinCap API 提供全面的加密货币分析服务。该服务器通过用户友好的界面,提供实时价格数据、市场分析以及历史趋势数据。

精选
TypeScript
MCP PubMed Search

MCP PubMed Search

用于搜索 PubMed 的服务器(PubMed 是一个免费的在线数据库,用户可以在其中搜索生物医学和生命科学文献)。 我是在 MCP 发布当天创建的,但当时正在度假。 我看到有人在您的数据库中发布了类似的服务器,但还是决定发布我的服务器。

精选
Python
mixpanel

mixpanel

连接到您的 Mixpanel 数据。 从 Mixpanel 分析查询事件、留存和漏斗数据。

精选
TypeScript
Sequential Thinking MCP Server

Sequential Thinking MCP Server

这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

精选
Python
Nefino MCP Server

Nefino MCP Server

为大型语言模型提供访问德国可再生能源项目新闻和信息的能力,允许按地点、主题(太阳能、风能、氢能)和日期范围进行筛选。

官方
Python
Vectorize

Vectorize

将 MCP 服务器向量化以实现高级检索、私有深度研究、Anything-to-Markdown 文件提取和文本分块。

官方
JavaScript
Mathematica Documentation MCP server

Mathematica Documentation MCP server

一个服务器,通过 FastMCP 提供对 Mathematica 文档的访问,使用户能够从 Wolfram Mathematica 检索函数文档和列出软件包符号。

本地
Python
kb-mcp-server

kb-mcp-server

一个 MCP 服务器,旨在实现便携性、本地化、简易性和便利性,以支持对 txtai “all in one” 嵌入数据库进行基于语义/图的检索。任何 tar.gz 格式的 txtai 嵌入数据库都可以被加载。

本地
Python
Research MCP Server

Research MCP Server

这个服务器用作 MCP 服务器,与 Notion 交互以检索和创建调查数据,并与 Claude Desktop Client 集成以进行和审查调查。

本地
Python
Cryo MCP Server

Cryo MCP Server

一个API服务器,实现了模型补全协议(MCP),用于Cryo区块链数据提取,允许用户通过任何兼容MCP的客户端查询以太坊区块链数据。

本地
Python