VectorCode

VectorCode

一个代码仓库索引工具,可以增强你的大型语言模型(LLM)体验。

Davidyz

开发者工具
访问服务器

README

VectorCode

codecov Test and Coverage pypi

VectorCode 是一个代码仓库索引工具。它通过索引并提供关于您正在处理的代码仓库的信息,帮助您为您的代码 LLM 编写更好的提示词。这个仓库也包含了相应的 neovim 插件,因为这是我用来编写这个工具的。

[!NOTE] 这个项目目前处于 beta 质量,只实现了非常基本的检索和嵌入功能。还有很大的改进空间,欢迎任何帮助。

[!NOTE] Chromadb,这个项目背后的向量数据库后端,支持多种嵌入引擎。我使用 SentenceTransformer 开发了这个工具,但是如果您在使用不同的嵌入函数时遇到任何问题,请提出 issue(或者更好的是,提交一个 pull request :D)。

<!-- mtoc-start -->

<!-- mtoc-end -->

为什么选择 VectorCode?

LLM 通常对闭源项目、不太知名的项目以及尚未发布的前沿开发成果的理解非常有限。它们在这些项目上的能力非常有限。以我的小型玩具数独求解项目为例:当我编写了前几行代码并希望 LLM 填写我在 solver_candidates 中实现的求解器列表时,如果没有项目上下文,补全结果只是随机猜测,可能是另一个数独项目的一部分: 但是,通过 VectorCode 提供的 RAG 上下文,我的补全 LLM 能够提供我实际实现的补全结果: 这使得补全结果更加可用。一个类似的策略continue 中实现,这是一个流行的 AI 补全和聊天插件,可在 VSCode 和 JetBrain 产品上使用。

文档

[!NOTE] main 分支上的文档反映了最新提交的代码(如果我忘记更新文档,请见谅,但这是我的目标)。要查看您正在使用的版本的文档,您可以查看相应的标签

  • 有关命令行工具的设置和使用,请参阅 CLI 文档
  • 对于 neovim 用户,在您阅读完 CLI 文档后,请参阅 neovim 插件文档 以获取更多说明。

如果您想为这个项目做出贡献,请查看 贡献指南,其中包含有关您应该遵循的一些基本准则以及您可能会发现有用的提示的信息。

TODOs

  • [x] 按 ~文件路径~ 排除路径查询;
  • [x] 分块支持;
    • [x] 添加文件元数据;
    • [x] 分块大小配置;
    • [x] 更智能的分块(基于语义/语法),使用 py-tree-sittertree-sitter-language-pack 实现;
    • [x] 可配置的查询结果文档选择。
  • [x] ~带有缓存的 NeoVim Lua API,用于跳过未索引项目的检索~ 返回空数组代替;
  • [x] 用于异步缓存的作业池;
  • [x] 持久客户端
  • [-] 适当的 远程 Chromadb 支持(带有身份验证等);
  • [x] 尊重 .gitignore
  • [x] 实现某种项目根目录锚点(例如 .git 或自定义的 .vectorcode.json),以增强自动项目根目录检测。已实现项目级别的 .vectorcode/.git 作为根锚点
  • [ ] 能够查看和删除集合中的文件(目前您只能 drop 并再次 vectorise);
  • [x] 联合搜索(某种程度上,使用 codecompanion.nvim/MCP)。

致谢

推荐服务器

Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。

官方
精选
本地
TypeScript
MCP Package Docs Server

MCP Package Docs Server

促进大型语言模型高效访问和获取 Go、Python 和 NPM 包的结构化文档,通过多语言支持和性能优化来增强软件开发。

精选
本地
TypeScript
Claude Code MCP

Claude Code MCP

一个实现了 Claude Code 作为模型上下文协议(Model Context Protocol, MCP)服务器的方案,它可以通过标准化的 MCP 接口来使用 Claude 的软件工程能力(代码生成、编辑、审查和文件操作)。

精选
本地
JavaScript
@kazuph/mcp-taskmanager

@kazuph/mcp-taskmanager

用于任务管理的模型上下文协议服务器。它允许 Claude Desktop(或任何 MCP 客户端)在基于队列的系统中管理和执行任务。

精选
本地
JavaScript
mermaid-mcp-server

mermaid-mcp-server

一个模型上下文协议 (MCP) 服务器,用于将 Mermaid 图表转换为 PNG 图像。

精选
JavaScript
Jira-Context-MCP

Jira-Context-MCP

MCP 服务器向 AI 编码助手(如 Cursor)提供 Jira 工单信息。

精选
TypeScript
Linear MCP Server

Linear MCP Server

一个模型上下文协议(Model Context Protocol)服务器,它与 Linear 的问题跟踪系统集成,允许大型语言模型(LLM)通过自然语言交互来创建、更新、搜索和评论 Linear 问题。

精选
JavaScript
Sequential Thinking MCP Server

Sequential Thinking MCP Server

这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

精选
Python
Curri MCP Server

Curri MCP Server

通过管理文本笔记、提供笔记创建工具以及使用结构化提示生成摘要,从而实现与 Curri API 的交互。

官方
本地
JavaScript