Qdrant DevContainer for File Embeddings
questmapping
README
Qdrant 文件嵌入开发容器
本项目提供了一个开发容器设置,用于运行带有文件嵌入的 Qdrant。它包含了使用向量相似度搜索来索引和搜索文本文档所需的一切。
前提条件
- 启动开发容器前,必须运行 Docker Desktop
- 带有 Remote - Containers 扩展的 VS Code
- 互联网连接(用于下载依赖项)
快速开始
- 确保 Docker Desktop 在您的系统上运行
- 在 VS Code 中打开此文件夹
- 点击右下角的绿色 "Reopen in Container" 按钮
- 或者按
F1
并输入 "Dev Containers: Reopen in Container"
- 或者按
项目结构
qdrant_server_devcontainer/ ├── .devcontainer/ │ ├── devcontainer.json │ └── Dockerfile ├── requirements.txt ├── ingest.py └── data/ # 将您的文本文件放在这里
用法
- 将您的文本文件放在
data/
目录中 - 容器将自动启动 Qdrant
- 容器构建完成后,您应该可以通过
http://localhost:6333
访问 Qdrant - 从容器内手动运行导入脚本:
python ingest.py
特性
- 在后台运行的 Qdrant 向量数据库
- 使用 sentence-transformers 自动进行文件索引
- 包含所有必要依赖项的 Python 环境
- 预装 VS Code Python 扩展
技术细节
- Qdrant 在动态分配的端口上运行(检查容器构建后的输出面板)
- 使用
all-MiniLM-L6-v2
进行文本嵌入 - 创建一个名为 "local-docs" 的集合,使用余弦相似度
- 支持数据目录中的文本文件 (.txt)、Markdown 文件 (.md) 和 PDF 文件 (.pdf)
故障排除
-
如果容器无法启动:
- 确保 Docker Desktop 正在运行
- 检查没有其他进程正在使用动态分配的端口
- 验证所有依赖项是否已正确安装
-
如果文件未被索引:
- 检查文件是否在
data/
目录中 - 验证文件扩展名是否受支持(目前为 .txt、.md、.pdf)
- 确保容器可以读取文件
- 检查文件是否在
许可证
MIT 许可证
TODO
- 高效处理大型 PDF 文件,
- 使用并行处理提取每页的文本,
- 嵌入并推送每个准备好的块,
- 如果 torch.cuda.is_available(),是否支持 GPU 嵌入?
- 增加对 epub 文件的支持
推荐服务器
Playwright MCP Server
一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。
Magic Component Platform (MCP)
一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。
MCP Package Docs Server
促进大型语言模型高效访问和获取 Go、Python 和 NPM 包的结构化文档,通过多语言支持和性能优化来增强软件开发。
Claude Code MCP
一个实现了 Claude Code 作为模型上下文协议(Model Context Protocol, MCP)服务器的方案,它可以通过标准化的 MCP 接口来使用 Claude 的软件工程能力(代码生成、编辑、审查和文件操作)。
@kazuph/mcp-taskmanager
用于任务管理的模型上下文协议服务器。它允许 Claude Desktop(或任何 MCP 客户端)在基于队列的系统中管理和执行任务。
mermaid-mcp-server
一个模型上下文协议 (MCP) 服务器,用于将 Mermaid 图表转换为 PNG 图像。
Jira-Context-MCP
MCP 服务器向 AI 编码助手(如 Cursor)提供 Jira 工单信息。

Linear MCP Server
一个模型上下文协议(Model Context Protocol)服务器,它与 Linear 的问题跟踪系统集成,允许大型语言模型(LLM)通过自然语言交互来创建、更新、搜索和评论 Linear 问题。

Sequential Thinking MCP Server
这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。
Curri MCP Server
通过管理文本笔记、提供笔记创建工具以及使用结构化提示生成摘要,从而实现与 Curri API 的交互。