PDF Search for Zed
一个用于 Zed 的 MCP 服务器扩展,用于从 PDF 文件中检索相关片段。
freespirit
README
Zed 的 PDF 搜索
一个 Zed 的文档搜索扩展,允许你对 PDF 文档进行语义搜索,并将结果用于 Zed 的 AI 助手。
前提条件
此扩展目前需要:
- 一个
OpenAI
API 密钥(用于生成嵌入向量) - 你的系统上安装了
uv
注意: 虽然当前的设置需要 OpenAI API 密钥来生成嵌入向量,但我们计划在未来的版本中实现一个独立的替代方案。社区的反馈将有助于确定这些改进的优先级。
快速开始
- 克隆仓库
git clone https://github.com/freespirit/pdfsearch-zed.git
- 为 MCP 服务器设置 Python 环境:
cd pdfsearch-zed/pdf_rag
uv venv
uv sync
-
在 Zed 中安装 Dev Extension
-
构建搜索数据库
cd /path/to/pdfsearch-zed/pdf_rag
echo "OPENAI_API_KEY=sk-..." > src/pdf_rag/.env
# 这可能需要几分钟,具体取决于文档的大小
# 你可以提供多个文件和目录作为参数。
# - 文件将被分块。
# - 目录将被视为包含块的文件。
# 例如,它们不会被进一步分割。
uv run src/pdf_rag/rag.py build "file1.pdf" "dir1" "file2.md" ...
- 配置 Zed
"context_servers": {
"pdfsearch-context-server": {
"settings": {
"extension_path": "/path/to/pdfsearch-zed"
}
}
}
用法
- 打开 Zed 的 AI 助手面板
- 输入
/pdfsearch
,后跟你的搜索查询 - 该扩展将搜索 PDF 并将相关部分添加到 AI 助手的上下文中
未来改进
- [x] 独立的向量存储
- [ ] 独立的嵌入向量
- [ ] 首次运行时自动构建索引
- [ ] 可配置的结果大小
- [x] 支持多个 PDF
- [x] 可选:支持 PDF 以外的其他文件格式
项目结构
pdf_rag/
: 基于 Python 的 MCP 服务器实现src/
: Zed 扩展代码extension.toml
和Cargo.toml
: Zed 扩展配置文件
已知限制
- 首次使用前需要手动构建索引
- 需要外部服务 (OpenAI)
推荐服务器
Crypto Price & Market Analysis MCP Server
一个模型上下文协议 (MCP) 服务器,它使用 CoinCap API 提供全面的加密货币分析。该服务器通过一个易于使用的界面提供实时价格数据、市场分析和历史趋势。 (Alternative, slightly more formal and technical translation): 一个模型上下文协议 (MCP) 服务器,利用 CoinCap API 提供全面的加密货币分析服务。该服务器通过用户友好的界面,提供实时价格数据、市场分析以及历史趋势数据。
MCP PubMed Search
用于搜索 PubMed 的服务器(PubMed 是一个免费的在线数据库,用户可以在其中搜索生物医学和生命科学文献)。 我是在 MCP 发布当天创建的,但当时正在度假。 我看到有人在您的数据库中发布了类似的服务器,但还是决定发布我的服务器。
mixpanel
连接到您的 Mixpanel 数据。 从 Mixpanel 分析查询事件、留存和漏斗数据。

Sequential Thinking MCP Server
这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

Nefino MCP Server
为大型语言模型提供访问德国可再生能源项目新闻和信息的能力,允许按地点、主题(太阳能、风能、氢能)和日期范围进行筛选。
Vectorize
将 MCP 服务器向量化以实现高级检索、私有深度研究、Anything-to-Markdown 文件提取和文本分块。
Mathematica Documentation MCP server
一个服务器,通过 FastMCP 提供对 Mathematica 文档的访问,使用户能够从 Wolfram Mathematica 检索函数文档和列出软件包符号。
kb-mcp-server
一个 MCP 服务器,旨在实现便携性、本地化、简易性和便利性,以支持对 txtai “all in one” 嵌入数据库进行基于语义/图的检索。任何 tar.gz 格式的 txtai 嵌入数据库都可以被加载。
Research MCP Server
这个服务器用作 MCP 服务器,与 Notion 交互以检索和创建调查数据,并与 Claude Desktop Client 集成以进行和审查调查。

Cryo MCP Server
一个API服务器,实现了模型补全协议(MCP),用于Cryo区块链数据提取,允许用户通过任何兼容MCP的客户端查询以太坊区块链数据。