PDF Search for Zed

PDF Search for Zed

一个用于 Zed 的 MCP 服务器扩展,用于从 PDF 文件中检索相关片段。

freespirit

研究与数据
访问服务器

README

Zed 的 PDF 搜索

一个 Zed 的文档搜索扩展,允许你对 PDF 文档进行语义搜索,并将结果用于 Zed 的 AI 助手。

前提条件

此扩展目前需要:

  1. 一个 OpenAI API 密钥(用于生成嵌入向量)
  2. 你的系统上安装了 uv

注意: 虽然当前的设置需要 OpenAI API 密钥来生成嵌入向量,但我们计划在未来的版本中实现一个独立的替代方案。社区的反馈将有助于确定这些改进的优先级。

快速开始

  1. 克隆仓库
git clone https://github.com/freespirit/pdfsearch-zed.git
  1. 为 MCP 服务器设置 Python 环境:
cd pdfsearch-zed/pdf_rag
uv venv
uv sync
  1. 在 Zed 中安装 Dev Extension

  2. 构建搜索数据库

cd /path/to/pdfsearch-zed/pdf_rag

echo "OPENAI_API_KEY=sk-..." > src/pdf_rag/.env

# 这可能需要几分钟,具体取决于文档的大小
# 你可以提供多个文件和目录作为参数。
#  - 文件将被分块。
#  - 目录将被视为包含块的文件。
#    例如,它们不会被进一步分割。
uv run src/pdf_rag/rag.py build "file1.pdf" "dir1" "file2.md" ...
  1. 配置 Zed
"context_servers": {
    "pdfsearch-context-server": {
        "settings": {
            "extension_path": "/path/to/pdfsearch-zed"
        }
    }
}

用法

  1. 打开 Zed 的 AI 助手面板
  2. 输入 /pdfsearch,后跟你的搜索查询
  3. 该扩展将搜索 PDF 并将相关部分添加到 AI 助手的上下文中

未来改进

  • [x] 独立的向量存储
  • [ ] 独立的嵌入向量
  • [ ] 首次运行时自动构建索引
  • [ ] 可配置的结果大小
  • [x] 支持多个 PDF
  • [x] 可选:支持 PDF 以外的其他文件格式

项目结构

  • pdf_rag/: 基于 Python 的 MCP 服务器实现
  • src/: Zed 扩展代码
  • extension.tomlCargo.toml: Zed 扩展配置文件

已知限制

  • 首次使用前需要手动构建索引
  • 需要外部服务 (OpenAI)

推荐服务器

Crypto Price & Market Analysis MCP Server

Crypto Price & Market Analysis MCP Server

一个模型上下文协议 (MCP) 服务器,它使用 CoinCap API 提供全面的加密货币分析。该服务器通过一个易于使用的界面提供实时价格数据、市场分析和历史趋势。 (Alternative, slightly more formal and technical translation): 一个模型上下文协议 (MCP) 服务器,利用 CoinCap API 提供全面的加密货币分析服务。该服务器通过用户友好的界面,提供实时价格数据、市场分析以及历史趋势数据。

精选
TypeScript
MCP PubMed Search

MCP PubMed Search

用于搜索 PubMed 的服务器(PubMed 是一个免费的在线数据库,用户可以在其中搜索生物医学和生命科学文献)。 我是在 MCP 发布当天创建的,但当时正在度假。 我看到有人在您的数据库中发布了类似的服务器,但还是决定发布我的服务器。

精选
Python
mixpanel

mixpanel

连接到您的 Mixpanel 数据。 从 Mixpanel 分析查询事件、留存和漏斗数据。

精选
TypeScript
Sequential Thinking MCP Server

Sequential Thinking MCP Server

这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

精选
Python
Nefino MCP Server

Nefino MCP Server

为大型语言模型提供访问德国可再生能源项目新闻和信息的能力,允许按地点、主题(太阳能、风能、氢能)和日期范围进行筛选。

官方
Python
Vectorize

Vectorize

将 MCP 服务器向量化以实现高级检索、私有深度研究、Anything-to-Markdown 文件提取和文本分块。

官方
JavaScript
Mathematica Documentation MCP server

Mathematica Documentation MCP server

一个服务器,通过 FastMCP 提供对 Mathematica 文档的访问,使用户能够从 Wolfram Mathematica 检索函数文档和列出软件包符号。

本地
Python
kb-mcp-server

kb-mcp-server

一个 MCP 服务器,旨在实现便携性、本地化、简易性和便利性,以支持对 txtai “all in one” 嵌入数据库进行基于语义/图的检索。任何 tar.gz 格式的 txtai 嵌入数据库都可以被加载。

本地
Python
Research MCP Server

Research MCP Server

这个服务器用作 MCP 服务器,与 Notion 交互以检索和创建调查数据,并与 Claude Desktop Client 集成以进行和审查调查。

本地
Python
Cryo MCP Server

Cryo MCP Server

一个API服务器,实现了模型补全协议(MCP),用于Cryo区块链数据提取,允许用户通过任何兼容MCP的客户端查询以太坊区块链数据。

本地
Python