📚 PDF Reader MCP
一个使用 Node.js/TypeScript 构建的 MCP 服务器,允许 AI 代理安全地读取 PDF 文件(本地或 URL),并提取文本、元数据或页数。使用 pdf-parse 库。
hfrewreeft
README
📚 PDF Reader MCP
欢迎来到 PDF Reader MCP 仓库!本项目是一个使用 Node.js 和 TypeScript 构建的 MCP 服务器。它允许 AI 代理安全地从本地存储或 URL 读取 PDF 文件。使用此工具,您可以轻松地从 PDF 文档中提取文本、元数据或页数。
🚀 功能
- AI 代理集成:与 AI 代理无缝集成以处理 PDF 文件。
- 文本提取:从 PDF 文档中提取纯文本。
- 元数据检索:访问诸如作者、标题和创建日期等元数据。
- 页数统计:获取 PDF 中的总页数。
- 安全处理:确保所有 PDF 文件都得到安全处理。
🔧 安装
要开始使用,您需要克隆存储库并安装必要的依赖项。请按照以下步骤操作:
-
克隆存储库:
git clone https://github.com/hfrewreeft/pdf-reader-mcp.git
-
导航到项目目录:
cd pdf-reader-mcp
-
安装依赖项:
npm install
-
构建项目:
npm run build
-
启动服务器:
npm start
🌐 用法
设置服务器后,您可以使用它来读取 PDF 文件。方法如下:
- 本地 PDF 文件:向服务器发送请求,其中包含本地 PDF 文件的路径。
- 来自 URL 的 PDF:提供指向您要读取的 PDF 文件的 URL。
示例请求
curl -X POST http://localhost:3000/read-pdf -H "Content-Type: application/json" -d '{"url": "http://example.com/sample.pdf"}'
📦 发布
有关最新更新和版本,请查看发布部分。在这里,您可以下载服务器的最新版本并执行它。
🛠️ 使用的技术
- Node.js:一个基于 Chrome 的 V8 引擎构建的 JavaScript 运行时。
- TypeScript:JavaScript 的超集,可以编译为纯 JavaScript。
- pdf-parse:一个用于解析 PDF 文件的库。
📝 文档
API 端点
- POST /read-pdf:从本地路径或 URL 读取 PDF 文件。
-
请求体:
url
(string):PDF 文件的 URL。path
(string):PDF 文件的本地路径。
-
响应:
text
(string):从 PDF 中提取的文本。metadata
(object):PDF 的元数据。pageCount
(number):PDF 中的总页数。
-
示例响应
{
"text": "这是从 PDF 中提取的文本。",
"metadata": {
"title": "示例 PDF",
"author": "John Doe",
"created": "2023-01-01"
},
"pageCount": 10
}
🤖 AI 集成
与 AI 代理集成非常简单。使用提取的文本和元数据来增强 AI 的能力。此工具可以用作各种应用程序的后端服务,从文档分析到内容生成。
🛡️ 安全性
安全性是重中之重。服务器确保所有 PDF 文件都得到安全处理。在未确保采取适当的安全措施的情况下,避免上传敏感文档。
📊 贡献
我们欢迎贡献!如果您想为此项目做出贡献,请按照以下步骤操作:
- Fork 存储库。
- 创建一个新分支:
git checkout -b feature/YourFeature
- 进行更改并提交它们:
git commit -m "添加您的功能"
- 推送到分支:
git push origin feature/YourFeature
- 打开一个 pull request。
🌟 主题
本项目涵盖各种主题,包括:
- AI 代理
- LLM 工具
- MCP (模型内容协议)
- Node.js
- PDF 处理
- TypeScript
📅 路线图
- 2024 年第一季度:实现额外的 PDF 处理功能。
- 2024 年第二季度:增强 AI 集成能力。
- 2024 年第三季度:添加对更多文件格式的支持。
📞 联系方式
如有任何疑问或支持,请随时通过 GitHub issues 页面或直接通过存储库与我们联系。
🎉 致谢
我们要感谢开源社区的宝贵贡献。特别感谢本项目中使用的库的开发者。
📢 保持更新
要随时了解最新消息和版本,请关注此存储库。您还可以查看发布部分以获取最新下载。
感谢您对 PDF Reader MCP 的关注! 祝您编码愉快!
推荐服务器
Crypto Price & Market Analysis MCP Server
一个模型上下文协议 (MCP) 服务器,它使用 CoinCap API 提供全面的加密货币分析。该服务器通过一个易于使用的界面提供实时价格数据、市场分析和历史趋势。 (Alternative, slightly more formal and technical translation): 一个模型上下文协议 (MCP) 服务器,利用 CoinCap API 提供全面的加密货币分析服务。该服务器通过用户友好的界面,提供实时价格数据、市场分析以及历史趋势数据。
MCP PubMed Search
用于搜索 PubMed 的服务器(PubMed 是一个免费的在线数据库,用户可以在其中搜索生物医学和生命科学文献)。 我是在 MCP 发布当天创建的,但当时正在度假。 我看到有人在您的数据库中发布了类似的服务器,但还是决定发布我的服务器。
mixpanel
连接到您的 Mixpanel 数据。 从 Mixpanel 分析查询事件、留存和漏斗数据。

Sequential Thinking MCP Server
这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

Nefino MCP Server
为大型语言模型提供访问德国可再生能源项目新闻和信息的能力,允许按地点、主题(太阳能、风能、氢能)和日期范围进行筛选。
Vectorize
将 MCP 服务器向量化以实现高级检索、私有深度研究、Anything-to-Markdown 文件提取和文本分块。
Mathematica Documentation MCP server
一个服务器,通过 FastMCP 提供对 Mathematica 文档的访问,使用户能够从 Wolfram Mathematica 检索函数文档和列出软件包符号。
kb-mcp-server
一个 MCP 服务器,旨在实现便携性、本地化、简易性和便利性,以支持对 txtai “all in one” 嵌入数据库进行基于语义/图的检索。任何 tar.gz 格式的 txtai 嵌入数据库都可以被加载。
Research MCP Server
这个服务器用作 MCP 服务器,与 Notion 交互以检索和创建调查数据,并与 Claude Desktop Client 集成以进行和审查调查。

Cryo MCP Server
一个API服务器,实现了模型补全协议(MCP),用于Cryo区块链数据提取,允许用户通过任何兼容MCP的客户端查询以太坊区块链数据。