MCP Pinecone Vector Database Server

MCP Pinecone Vector Database Server

zx8086

研究与数据
访问服务器

README

MCP Pinecone 向量数据库服务器

本项目实现了一个模型上下文协议 (MCP) 服务器,允许向 Pinecone 向量数据库读写向量化信息。它被设计用于处理 RAG 处理过的 PDF 数据和 Confluence 数据。

功能

  • 使用文本查询搜索相似文档
  • 向数据库添加带有自定义元数据的新向量
  • 批量处理和上传 Confluence 数据
  • 通过 ID 删除向量
  • 基本数据库统计信息(暂时禁用)

前提条件

  • Bun 运行时
  • Pinecone API 密钥
  • OpenAI API 密钥(用于生成嵌入)

安装

  1. 克隆此仓库

  2. 安装依赖项:

    bun install
    
  3. 创建一个 .env 文件,内容如下:

    PINECONE_API_KEY=your-pinecone-api-key
    OPENAI_API_KEY=your-openai-api-key
    PINECONE_HOST=your-pinecone-host
    PINECONE_INDEX_NAME=your-index-name
    DEFAULT_NAMESPACE=your-namespace
    

用法

运行 MCP 服务器

启动服务器:

bun src/index.ts

服务器将启动并通过 stdio 监听 MCP 命令。

运行示例客户端

使用示例客户端测试服务器:

bun examples/client.ts

处理 Confluence 数据

Confluence 处理脚本提供详细的日志记录和验证:

bun src/scripts/process-confluence.ts <file-path> [collection] [scope]

参数:

  • file-path: Confluence JSON 文件的路径(必需)
  • collection: 文档集合名称(默认为 "documentation")
  • scope: 文档范围(默认为 "documentation")

示例:

bun src/scripts/process-confluence.ts ./data/confluence-export.json "tech-docs" "engineering"

该脚本将:

  1. 验证输入参数
  2. 处理和向量化内容
  3. 批量上传向量
  4. 验证上传成功
  5. 提供该过程的详细日志

可用工具

服务器提供以下工具:

  1. search-vectors - 搜索相似文档,参数:

    • query: string (搜索查询文本)
    • topK: number (1-100,默认值:5)
    • filter: object (可选的过滤条件)
  2. add-vector - 添加单个文档,参数:

    • text: string (要向量化的内容)
    • metadata: object (向量元数据)
    • id: string (可选的自定义 ID)
  3. process-confluence - 处理 Confluence JSON 数据,参数:

    • filePath: string (JSON 文件的路径)
    • namespace: string (可选,默认为 "capella-document-search")
  4. delete-vectors - 删除向量,参数:

    • ids: string[] (向量 ID 列表)
    • namespace: string (可选,默认为 "capella-document-search")
  5. get-stats - 获取数据库统计信息(暂时禁用)

数据库配置

服务器需要一个 Pinecone 向量数据库。在您的 .env 文件中配置连接详细信息:

PINECONE_API_KEY=your-api-key
PINECONE_HOST=your-host
PINECONE_INDEX_NAME=your-index
DEFAULT_NAMESPACE=your-namespace

元数据模式

Confluence 文档

ID: confluence-[page-id]-[item-id]
title: [title]
pageId: [page-id]
spaceKey: [space-key]
type: [type]
content: [text-content]
author: [author-name]
source: "confluence"
collection: "documentation"
scope: "documentation"
...

贡献

  1. Fork 该仓库
  2. 创建您的功能分支:git checkout -b feature/my-new-feature
  3. 提交您的更改:git commit -am 'Add some feature'
  4. 推送到该分支:git push origin feature/my-new-feature
  5. 提交一个 pull request

许可证

MIT

推荐服务器

Crypto Price & Market Analysis MCP Server

Crypto Price & Market Analysis MCP Server

一个模型上下文协议 (MCP) 服务器,它使用 CoinCap API 提供全面的加密货币分析。该服务器通过一个易于使用的界面提供实时价格数据、市场分析和历史趋势。 (Alternative, slightly more formal and technical translation): 一个模型上下文协议 (MCP) 服务器,利用 CoinCap API 提供全面的加密货币分析服务。该服务器通过用户友好的界面,提供实时价格数据、市场分析以及历史趋势数据。

精选
TypeScript
MCP PubMed Search

MCP PubMed Search

用于搜索 PubMed 的服务器(PubMed 是一个免费的在线数据库,用户可以在其中搜索生物医学和生命科学文献)。 我是在 MCP 发布当天创建的,但当时正在度假。 我看到有人在您的数据库中发布了类似的服务器,但还是决定发布我的服务器。

精选
Python
mixpanel

mixpanel

连接到您的 Mixpanel 数据。 从 Mixpanel 分析查询事件、留存和漏斗数据。

精选
TypeScript
Sequential Thinking MCP Server

Sequential Thinking MCP Server

这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

精选
Python
Nefino MCP Server

Nefino MCP Server

为大型语言模型提供访问德国可再生能源项目新闻和信息的能力,允许按地点、主题(太阳能、风能、氢能)和日期范围进行筛选。

官方
Python
Vectorize

Vectorize

将 MCP 服务器向量化以实现高级检索、私有深度研究、Anything-to-Markdown 文件提取和文本分块。

官方
JavaScript
Mathematica Documentation MCP server

Mathematica Documentation MCP server

一个服务器,通过 FastMCP 提供对 Mathematica 文档的访问,使用户能够从 Wolfram Mathematica 检索函数文档和列出软件包符号。

本地
Python
kb-mcp-server

kb-mcp-server

一个 MCP 服务器,旨在实现便携性、本地化、简易性和便利性,以支持对 txtai “all in one” 嵌入数据库进行基于语义/图的检索。任何 tar.gz 格式的 txtai 嵌入数据库都可以被加载。

本地
Python
Research MCP Server

Research MCP Server

这个服务器用作 MCP 服务器,与 Notion 交互以检索和创建调查数据,并与 Claude Desktop Client 集成以进行和审查调查。

本地
Python
Cryo MCP Server

Cryo MCP Server

一个API服务器,实现了模型补全协议(MCP),用于Cryo区块链数据提取,允许用户通过任何兼容MCP的客户端查询以太坊区块链数据。

本地
Python