mcp-lancedb

mcp-lancedb

一个模型上下文协议(MCP)服务器,它使大型语言模型(LLM)能够通过代理式RAG和LanceDB中的混合搜索,直接与它们在磁盘上的文档进行交互。可以向LLM询问关于整个数据集或特定文档的问题。

Category
访问服务器

README

🗄️ LanceDB MCP 服务器,适用于 LLM

Node.js 18+ License: MIT

一个模型上下文协议 (MCP) 服务器,使 LLM 能够通过 LanceDB 中的 Agentic RAG 和混合搜索直接与它们在磁盘上的文档进行交互。向 LLM 询问关于整个数据集或特定文档的问题。

✨ 特性

  • 🔍 LanceDB 驱动的无服务器向量索引和文档摘要目录。
  • 📊 有效利用 LLM tokens。LLM 本身会在需要时查找它需要的内容。
  • 📈 安全性。索引存储在本地,因此在使用本地 LLM 时不会将数据传输到云端。

🚀 快速开始

要开始使用,请创建一个本地目录来存储索引,并将此配置添加到您的 Claude Desktop 配置文件中:

MacOS: ~/Library/Application\ Support/Claude/claude_desktop_config.json
Windows: %APPDATA%/Claude/claude_desktop_config.json

{
  "mcpServers": {
    "lancedb": {
      "command": "npx",
      "args": [
        "lance-mcp",
        "PATH_TO_LOCAL_INDEX_DIR"
      ]
    }
  }
}

前提条件

  • Node.js 18+
  • npx
  • MCP 客户端(例如 Claude Desktop App)
  • 已安装摘要和嵌入模型(请参阅 config.ts - 默认情况下我们使用 Ollama 模型)
    • ollama pull snowflake-arctic-embed2
    • ollama pull llama3.1:8b

演示

<img src="https://github.com/user-attachments/assets/90bfdea9-9edd-4cf6-bb04-94c9c84e4825" width="50%">

本地开发模式:

{
  "mcpServers": {
    "lancedb": {
      "command": "node",
      "args": [
        "PATH_TO_LANCE_MCP/dist/index.js",
        "PATH_TO_LOCAL_INDEX_DIR"
      ]
    }
  }
}

使用 npm run build 构建项目。

使用 npx @modelcontextprotocol/inspector dist/index.js PATH_TO_LOCAL_INDEX_DIR 运行 MCP 工具检查器。

种子数据

种子脚本在 LanceDB 中创建两个表 - 一个用于文档摘要的目录,另一个用于向量化文档的块。 要运行种子脚本,请使用以下命令:

npm run seed -- --dbpath <PATH_TO_LOCAL_INDEX_DIR> --filesdir <PATH_TO_DOCS>

您可以使用来自 docs/ 目录的示例数据。 随意调整 config.ts 文件中的默认摘要和嵌入模型。 如果您需要重新创建索引,只需使用 --overwrite 选项重新运行种子脚本。

目录

  • 文档摘要
  • 元数据

  • 向量化文档块
  • 元数据

🎯 示例提示

尝试使用 Claude 的这些提示来探索功能:

"我们目录里有哪些文档?"
"为什么美国的医疗保健系统如此糟糕?"

📝 可用工具

服务器提供以下工具来与索引进行交互:

目录工具

  • catalog_search: 在目录中搜索相关文档

块工具

  • chunks_search: 根据目录中的特定文档查找相关块
  • all_chunks_search: 从所有已知文档中查找相关块

📜 许可证

该项目根据 MIT 许可证获得许可 - 有关详细信息,请参阅 LICENSE 文件。

推荐服务器

Baidu Map

Baidu Map

百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。

官方
精选
JavaScript
Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。

官方
精选
本地
TypeScript
Audiense Insights MCP Server

Audiense Insights MCP Server

通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。

官方
精选
本地
TypeScript
VeyraX

VeyraX

一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。

官方
精选
本地
graphlit-mcp-server

graphlit-mcp-server

模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。

官方
精选
TypeScript
Kagi MCP Server

Kagi MCP Server

一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。

官方
精选
Python
e2b-mcp-server

e2b-mcp-server

使用 MCP 通过 e2b 运行代码。

官方
精选
Neon MCP Server

Neon MCP Server

用于与 Neon 管理 API 和数据库交互的 MCP 服务器

官方
精选
Exa MCP Server

Exa MCP Server

模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。

官方
精选