TxtAi Memory Vector Server
使用 TxtAI 实现的用于语义搜索和内存管理的模型上下文协议 (MCP) 服务器。 该服务器提供了一个强大的 API,用于存储、检索和管理具有语义搜索功能的基于文本的记忆。 你也可以使用 Claude 和 Cline AI。
README
TxtAI Assistant MCP
一个模型上下文协议 (MCP) 服务器实现,用于使用 txtai 进行语义搜索和内存管理。该服务器提供了一个强大的 API,用于存储、检索和管理具有语义搜索功能的基于文本的记忆。
关于 txtai
本项目构建于 txtai 之上,这是一个由 NeuML 创建的卓越的开源 AI 驱动的搜索引擎。txtai 提供:
- 🔍 一体化语义搜索解决方案
- 🧠 基于 Transformer 的神经搜索
- 💡 零样本文本分类
- 🔄 文本提取和嵌入
- 🌐 多语言支持
- 🚀 高性能和可扩展性
我们通过将其与模型上下文协议 (MCP) 集成来扩展 txtai 的功能,使 Claude 和 Cline 等 AI 助手能够利用其强大的语义搜索功能。特别感谢 txtai 团队创建了如此强大而灵活的工具。
特性
- 🔍 跨存储记忆的语义搜索
- 💾 使用基于文件的后端的持久存储
- 🏷️ 基于标签的记忆组织和检索
- 📊 记忆统计和健康监控
- 🔄 自动数据持久化
- 📝 综合日志记录
- 🔒 可配置的 CORS 设置
- 🤖 与 Claude 和 Cline AI 集成
前提条件
- Python 3.8 或更高版本
- pip (Python 包安装程序)
- virtualenv (推荐)
安装
- 克隆此存储库:
git clone https://github.com/yourusername/txtai-assistant-mcp.git
cd txtai-assistant-mcp
- 运行启动脚本:
./scripts/start.sh
该脚本将:
- 创建一个虚拟环境
- 安装所需的依赖项
- 设置必要的目录
- 从模板创建配置文件
- 启动服务器
配置
可以使用 .env 文件中的环境变量配置服务器。模板位于 .env.template:
# Server Configuration
HOST=0.0.0.0
PORT=8000
# CORS Configuration
CORS_ORIGINS=*
# Logging Configuration
LOG_LEVEL=DEBUG
# Memory Configuration
MAX_MEMORIES=0
与 Claude 和 Cline AI 集成
此 TxtAI Assistant 可以用作 Claude 和 Cline AI 的 MCP 服务器,以通过语义记忆和搜索功能增强它们的能力。
Claude 的配置
要将此服务器与 Claude 一起使用,请将其添加到 Claude 的 MCP 配置文件中(通常位于 macOS 上的 ~/Library/Application Support/Claude/claude_desktop_config.json):
{
"mcpServers": {
"txtai-assistant": {
"command": "path/to/txtai-assistant-mcp/scripts/start.sh",
"env": {}
}
}
}
Cline 的配置
要与 Cline 一起使用,请将服务器配置添加到 Cline 的 MCP 设置文件(通常位于 ~/Library/Application Support/Code/User/globalStorage/saoudrizwan.claude-dev/settings/cline_mcp_settings.json):
{
"mcpServers": {
"txtai-assistant": {
"command": "path/to/txtai-assistant-mcp/scripts/start.sh",
"env": {}
}
}
}
可用的 MCP 工具
配置完成后,以下工具可供 Claude 和 Cline 使用:
store_memory: 存储具有元数据和标签的新记忆内容
{
"content": "Memory content to store",
"metadata": {
"source": "conversation",
"timestamp": "2023-01-01T00:00:00Z"
},
"tags": ["important", "context"],
"type": "conversation"
}
retrieve_memory: 根据语义搜索检索记忆
{
"query": "search query",
"n_results": 5
}
search_by_tag: 按标签搜索记忆
{
"tags": ["important", "context"]
}
delete_memory: 按内容哈希删除特定记忆
{
"content_hash": "hash_value"
}
get_stats: 获取数据库统计信息
{}
check_health: 检查数据库和嵌入模型的健康状况
{}
使用示例
在 Claude 或 Cline 中,您可以通过 MCP 协议使用这些工具:
# Store a memory
<use_mcp_tool>
<server_name>txtai-assistant</server_name>
<tool_name>store_memory</tool_name>
<arguments>
{
"content": "Important information to remember",
"tags": ["important"]
}
</arguments>
</use_mcp_tool>
# Retrieve memories
<use_mcp_tool>
<server_name>txtai-assistant</server_name>
<tool_name>retrieve_memory</tool_name>
<arguments>
{
"query": "what was the important information?",
"n_results": 5
}
</arguments>
</use_mcp_tool>
AI 将自动使用这些工具来维护上下文并在对话期间检索相关信息。
API 端点
存储记忆
POST /store
存储具有可选元数据和标签的新记忆。
请求体:
{
"content": "Memory content to store",
"metadata": {
"source": "example",
"timestamp": "2023-01-01T00:00:00Z"
},
"tags": ["example", "memory"],
"type": "general"
}
搜索记忆
POST /search
使用语义搜索搜索记忆。
请求体:
{
"query": "search query",
"n_results": 5,
"similarity_threshold": 0.7
}
按标签搜索
POST /search_tags
按标签搜索记忆。
请求体:
{
"tags": ["example", "memory"]
}
删除记忆
DELETE /memory/{content_hash}
按其内容哈希删除特定记忆。
获取统计信息
GET /stats
获取系统统计信息,包括记忆计数和标签分布。
健康检查
GET /health
检查服务器的健康状态。
目录结构
txtai-assistant-mcp/
├── server/
│ ├── main.py # 主要服务器实现
│ └── requirements.txt # Python 依赖项
├── scripts/
│ └── start.sh # 服务器启动脚本
├── data/ # 数据存储目录
├── logs/ # 日志文件目录
├── .env.template # 环境配置模板
└── README.md # 此文件
数据存储
记忆和标签存储在 data 目录中的 JSON 文件中:
memories.json: 包含所有存储的记忆tags.json: 包含标签索引
日志记录
日志存储在 logs 目录中。默认日志文件为 server.log。
开发
要为此项目做出贡献:
- Fork 存储库
- 创建一个功能分支
- 进行更改
- 提交 Pull Request
错误处理
服务器实现了全面的错误处理:
- 无效请求返回适当的 HTTP 状态代码
- 错误会记录堆栈跟踪
- 用户友好的错误消息在响应中返回
安全注意事项
- CORS 设置可通过环境变量配置
- 文件路径经过清理以防止目录遍历
- 在所有端点上执行输入验证
许可证
该项目根据 MIT 许可证获得许可 - 有关详细信息,请参阅 LICENSE 文件。
贡献
欢迎贡献!请随时提交 Pull Request。
支持
如果您遇到任何问题或有疑问,请在 GitHub 存储库上提交 issue。
推荐服务器
Baidu Map
百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。
Playwright MCP Server
一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。
Magic Component Platform (MCP)
一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。
Audiense Insights MCP Server
通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。
VeyraX
一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。
graphlit-mcp-server
模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。
Kagi MCP Server
一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。
e2b-mcp-server
使用 MCP 通过 e2b 运行代码。
Neon MCP Server
用于与 Neon 管理 API 和数据库交互的 MCP 服务器
Exa MCP Server
模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。