FastGPT Knowledge Base MCP
Intelligent knowledge base management tool that enables searching, browsing, and analyzing documents across multiple datasets with smart document analysis capabilities.
README
🧠 智能知识库管理MCP工具 v2.0
基于FastMCP构建的新一代智能知识库管理工具,支持目录树查看、内容搜索和智能文档分析功能。
✨ 新功能亮点
🧠 智能文档分析 (推荐)
一键完成:搜索 → 全文 → 答案
- 🔍 自动搜索多数据集定位相关文档
- 📄 获取文档完整内容(非片段)
- 🎯 基于全文内容智能分析
- ✨ 生成综合性答案
🏗️ 全新架构设计
- 📁 统一API客户端封装所有接口调用
- 🔧 分层架构设计(配置、模型、服务、工具层)
- 🎯 新的detail接口获取准确文件名
- 🛡️ 类型安全的Pydantic模型
- 📊 统一的日志系统
🚀 快速开始
启动MCP SSE服务器
# 指定parentId并启动服务器
python main.py --parent-id=1567e6250b82f952efaba4ebba47e229
# 或使用环境变量
PARENT_ID=1567e6250b82f952efaba4ebba47e229 python main.py
# 自定义端口和主机
MCP_SERVER_HOST=127.0.0.1 MCP_SERVER_PORT=9000 python main.py --parent-id=你的ID
MCP客户端配置
{
"mcpServers": {
"knowledge-base": {
"type": "sse",
"url": "http://localhost:8000/sse?parentId=1567e6250b82f952efaba4ebba47e229"
}
}
}
注意:
- 服务器使用SSE协议,在
/sse端点提供服务 - parentId通过URL参数传递
- 支持通过环境变量
MCP_SERVER_HOST和MCP_SERVER_PORT配置服务器地址
🛠️ 可用工具
🧠 smart_document_analysis ⭐ 推荐
智能文档分析 - 一键完成全流程
实现完整的智能文档分析工作流:搜索定位 → 获取全文 → 生成答案
参数:
question(必需): 要分析的问题dataset_ids(必需): 要搜索的数据集ID列表max_docs(可选): 最大分析文档数量,默认5max_search_results(可选): 每个数据集的最大搜索结果数,默认20
示例:
{
"question": "**科技的主要产品有哪些?",
"dataset_ids": ["数据集ID1", "数据集ID2"],
"max_docs": 5,
"max_search_results": 20
}
📁 get_dataset_tree
获取知识库目录树
浏览知识库结构,查看可用数据集
参数:
search_value(可选): 过滤关键词deep(可选): 目录深度,默认4
🔍 search_dataset
单数据集精确搜索
在指定数据集中搜索相关内容片段
参数:
dataset_id(必需): 数据集IDtext(必需): 搜索关键词limit(可选): 结果数量,默认10
📄 view_collection_content
查看文档完整内容
获取搜索到的文档的完整内容
参数:
collection_id(必需): 文档IDpage_size(可选): 每页数据块数量,默认50
🔍 multi_dataset_search
多数据集快速搜索
在多个数据集中同时搜索
参数:
dataset_ids(必需): 数据集ID列表query(必需): 搜索关键词limit_per_dataset(可选): 每个数据集的结果限制,默认5
🤖 intelligent_search_and_answer
传统智能搜索问答
基于关键词的传统智能问答(推荐使用smart_document_analysis)
📋 generate_search_plan
生成搜索计划
分析问题并生成搜索策略
🔧 环境变量配置
复制配置文件:
cp config.env.example .env
主要配置项:
PARENT_ID: 父级目录IDKNOWLEDGE_BASE_URL: API基础URL,默认http://10.21.8.6:13000KNOWLEDGE_BASE_TOKEN: 认证tokenMCP_SERVER_HOST: 服务器主机,默认0.0.0.0MCP_SERVER_PORT: 服务器端口,默认8000
🚀 项目重构
新架构特点
- ✅ 统一API客户端: 所有HTTP请求都通过统一的客户端处理
- ✅ 分层架构: 配置、模型、服务层清晰分离
- ✅ 新detail接口: 使用新的collection detail接口获取准确文件名
- ✅ 类型安全: 使用Pydantic模型确保数据类型正确
- ✅ 配置集中管理: 所有配置项统一管理
- ✅ 向后兼容: 保持与现有功能的完全兼容
使用重构后的版本
# 启动重构后的MCP服务器
python main_new.py --parent-id=your-parent-id
# 查看架构演示
python examples/new_architecture_demo.py
详细架构说明请参考 ARCHITECTURE.md
📖 使用示例
# 基本启动
python main.py --parent-id=你的ID
# 自定义端口启动
MCP_SERVER_PORT=9000 python main.py --parent-id=你的ID
# 使用环境变量
PARENT_ID=你的ID MCP_SERVER_HOST=127.0.0.1 python main.py
🎯 Claude Desktop 配置示例
{
"mcpServers": {
"knowledge-base": {
"type": "sse",
"url": "http://localhost:8000/sse?parentId=1567e6250b82f952efaba4ebba47e229"
}
}
}
推荐服务器
Baidu Map
百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。
Playwright MCP Server
一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。
Magic Component Platform (MCP)
一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。
Audiense Insights MCP Server
通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。
VeyraX
一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。
graphlit-mcp-server
模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。
Kagi MCP Server
一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。
e2b-mcp-server
使用 MCP 通过 e2b 运行代码。
Neon MCP Server
用于与 Neon 管理 API 和数据库交互的 MCP 服务器
Exa MCP Server
模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。