PubTator MCP Server
BioMCP-Hub
README
PubTator MCP 服务器
🔍 一个基于 PubTator3 的生物医学文献注释和关系挖掘服务器,通过 MCP 接口提供便捷访问。
PubTator MCP 服务器通过模型上下文协议 (MCP) 为 AI 助手提供对 PubTator3 生物医学文献注释系统的访问。它允许 AI 模型以编程方式搜索科学文献、获取注释信息并分析实体关系。
🤝 贡献 • 📝 报告问题
✨ 核心功能
- 🔎 文献注释导出:支持导出多种格式的 PubTator 注释结果 ✅
- 🚀 实体 ID 查找:通过自由文本查询生物学概念的标准标识符 ✅
- 📊 关系挖掘:发现实体之间的生物医学关系 ✅
- 📄 文献搜索:支持通过关键词和实体 ID 检索文献 ✅
- 🧠 批量处理:支持批量导出搜索结果中的注释信息 ✅
🚀 快速开始
要求
- Python 3.10+
- FastMCP 库
安装
通过 Smithery
使用 Smithery 自动安装 PubTator 服务器:
Claude
npx -y @smithery/cli@latest install @JackKuo666/pubtator-mcp-server --client claude --config "{}"
Cursor
粘贴到 Settings → Cursor Settings → MCP → Add new server:
- Mac/Linux
npx -y @smithery/cli@latest run @JackKuo666/pubtator-mcp-server --client cursor --config "{}"
Windsurf
npx -y @smithery/cli@latest install @JackKuo666/pubtator-mcp-server --client windsurf --config "{}"
CLine
npx -y @smithery/cli@latest install @JackKuo666/pubtator-mcp-server --client cline --config "{}"
手动安装
-
克隆仓库:
git clone https://github.com/JackKuo666/PubTator-MCP-Server.git cd PubTator-MCP-Server
-
安装依赖:
pip install -r requirements.txt
📊 使用
直接运行服务器
启动 MCP 服务器:
python pubtator_server.py
该服务器现在支持 stdio 和 TCP 传输。 默认情况下,它使用 TCP 传输。 您可以配置以下环境变量:
MCP_TRANSPORT
:设置为 "tcp" 以进行 TCP 传输,或设置为 "stdio" 以进行 stdio 传输(默认为 "tcp")MCP_HOST
:要绑定的主机(默认为 "0.0.0.0")MCP_PORT
:要监听的端口(默认为 8080)
使用自定义设置启动服务器的示例:
MCP_TRANSPORT=tcp MCP_HOST=127.0.0.1 MCP_PORT=8888 python pubtator_server.py
该服务器实现了延迟初始化和适当的错误处理。 它将优雅地处理关闭信号(SIGINT 和 SIGTERM),并记录启动或运行期间发生的任何错误。
使用 Docker
我们提供了一个 Dockerfile 以方便部署。 要使用 Docker 容器:
-
构建 Docker 镜像:
docker build -t pubtator-mcp-server .
-
运行 Docker 容器:
docker run -p 8080:8080 pubtator-mcp-server
这将在 Docker 容器内启动 PubTator MCP 服务器,并将其暴露在 8080 端口上。
故障排除
如果您在启动服务器时遇到任何问题:
- 检查控制台输出中的错误消息。
- 确保已安装所有必需的依赖项(请参阅“要求”部分)。
- 验证环境变量是否已正确设置。
- 如果服务器无法启动,请尝试以更高的详细程度运行它:
python -v pubtator_server.py
这将提供更详细的日志记录信息,以帮助识别任何问题的来源。
使用 Docker 时,您可以使用以下命令检查日志:
docker logs <container_id>
配置
Claude Desktop 配置
添加到 claude_desktop_config.json
:
(Mac OS)
{
"mcpServers": {
"pubtator": {
"command": "python",
"args": ["-m", "pubtator-mcp-server"]
}
}
}
(Windows)
{
"mcpServers": {
"pubtator": {
"command": "C:\\Users\\YOUR\\PATH\\miniconda3\\envs\\mcp_server\\python.exe",
"args": [
"D:\\code\\YOUR\\PATH\\PubTator-MCP-Server\\pubtator_server.py"
],
"env": {},
"disabled": false,
"autoApprove": []
}
}
}
CLine 配置
{
"mcpServers": {
"pubtator": {
"command": "bash",
"args": [
"-c",
"source /home/YOUR/PATH/mcp-server-pubtator/.venv/bin/activate && python /home/YOUR/PATH/pubtator_server.py"
],
"env": {
"MCP_TRANSPORT": "stdio"
},
"disabled": false,
"autoApprove": []
}
}
}
要使用 TCP 传输,请按如下方式修改配置:
{
"mcpServers": {
"pubtator": {
"command": "bash",
"args": [
"-c",
"source /home/YOUR/PATH/mcp-server-pubtator/.venv/bin/activate && python /home/YOUR/PATH/pubtator_server.py"
],
"env": {
"MCP_TRANSPORT": "tcp",
"MCP_HOST": "127.0.0.1",
"MCP_PORT": "8888"
},
"disabled": false,
"autoApprove": []
}
}
}
🛠 API 功能
PubTator MCP 服务器提供以下核心功能:
1. 导出出版物 (export_publications)
导出指定 PMID 文献的 PubTator 注释结果:
result = await export_publications(
ids=["32133824", "34170578"],
id_type="pmid",
format="biocjson", # 支持:pubtator, biocxml, biocjson
full_text=False # 是否包含全文
)
2. 实体 ID 查找 (find_entity_id)
通过自由文本查询生物学概念的标准标识符:
result = await find_entity_id(
query="COVID-19",
concept="disease", # 可选:gene, disease, chemical, species, mutation
limit=5 # 可选:限制结果数量
)
3. 关系查询 (find_related_entities)
查找与指定实体相关的其他实体:
result = await find_related_entities(
entity_id="@DISEASE_COVID_19",
relation_type="treat", # 可选:treat, cause, interact 等
target_entity_type="chemical", # 可选:gene, disease, chemical
max_results=5 # 可选:限制结果数量
)
4. 文献搜索 (search_pubtator)
搜索 PubTator 数据库:
results = await search_pubtator(
query="COVID-19",
max_pages=1 # 可选:要检索的最大页数
)
5. 批量导出 (batch_export_from_search)
搜索并批量导出文献注释:
results = await batch_export_from_search(
query="COVID-19",
format="biocjson",
max_pages=1,
full_text=False,
batch_size=5
)
注意:实际的函数调用可能因您的实现而异。 这些示例基于我们最近的测试,可能需要进行调整以匹配您的确切 API。
⚠️ 使用限制
- API 请求速率限制:每秒最多 3 个请求
- 批量导出时,使用合理的 batch_size 以避免请求超时
- 对于关系查询,实体 ID 必须以 "@" 开头,例如 "@DISEASE_COVID-19"
📄 许可证
本项目采用 MIT 许可证。
⚠️ 免责声明
此工具仅用于研究目的。 请遵守 PubTator 的服务条款并负责任地使用此工具。
推荐服务器
Crypto Price & Market Analysis MCP Server
一个模型上下文协议 (MCP) 服务器,它使用 CoinCap API 提供全面的加密货币分析。该服务器通过一个易于使用的界面提供实时价格数据、市场分析和历史趋势。 (Alternative, slightly more formal and technical translation): 一个模型上下文协议 (MCP) 服务器,利用 CoinCap API 提供全面的加密货币分析服务。该服务器通过用户友好的界面,提供实时价格数据、市场分析以及历史趋势数据。
MCP PubMed Search
用于搜索 PubMed 的服务器(PubMed 是一个免费的在线数据库,用户可以在其中搜索生物医学和生命科学文献)。 我是在 MCP 发布当天创建的,但当时正在度假。 我看到有人在您的数据库中发布了类似的服务器,但还是决定发布我的服务器。
mixpanel
连接到您的 Mixpanel 数据。 从 Mixpanel 分析查询事件、留存和漏斗数据。

Sequential Thinking MCP Server
这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

Nefino MCP Server
为大型语言模型提供访问德国可再生能源项目新闻和信息的能力,允许按地点、主题(太阳能、风能、氢能)和日期范围进行筛选。
Vectorize
将 MCP 服务器向量化以实现高级检索、私有深度研究、Anything-to-Markdown 文件提取和文本分块。
Mathematica Documentation MCP server
一个服务器,通过 FastMCP 提供对 Mathematica 文档的访问,使用户能够从 Wolfram Mathematica 检索函数文档和列出软件包符号。
kb-mcp-server
一个 MCP 服务器,旨在实现便携性、本地化、简易性和便利性,以支持对 txtai “all in one” 嵌入数据库进行基于语义/图的检索。任何 tar.gz 格式的 txtai 嵌入数据库都可以被加载。
Research MCP Server
这个服务器用作 MCP 服务器,与 Notion 交互以检索和创建调查数据,并与 Claude Desktop Client 集成以进行和审查调查。

Cryo MCP Server
一个API服务器,实现了模型补全协议(MCP),用于Cryo区块链数据提取,允许用户通过任何兼容MCP的客户端查询以太坊区块链数据。