mcp-pdf2md

mcp-pdf2md

PDF 转 Markdown 转换工具

Category
访问服务器

README

MCP-PDF2MD

smithery badge English | 中文

MCP-PDF2MD 服务

一个基于 MCP 的高性能 PDF 到 Markdown 转换服务,由 MinerU API 提供支持,支持本地文件和 URL 链接的批量处理,并提供结构化输出。

主要特性

  • 格式转换:将 PDF 文件转换为结构化的 Markdown 格式。
  • 多源支持:处理本地 PDF 文件和 URL 链接。
  • 智能处理:自动选择最佳处理方法。
  • 批量处理:支持多文件批量转换,高效处理大量 PDF 文件。
  • MCP 集成:与 Claude Desktop 等 LLM 客户端无缝集成。
  • 结构保留:保持原始文档结构,包括标题、段落、列表等。
  • 智能布局:以人类可读的顺序输出文本,适用于单列、多列和复杂布局。
  • 公式转换:自动识别并将文档中的公式转换为 LaTeX 格式。
  • 表格提取:自动识别并将文档中的表格转换为结构化格式。
  • 清理优化:删除页眉、页脚、脚注、页码等,以确保语义连贯性。
  • 高质量提取:从 PDF 文档中高质量提取文本、图像和布局信息。

系统要求

  • 软件:Python 3.10+

快速开始

  1. 克隆存储库并进入目录:

    git clone https://github.com/FutureUnreal/mcp-pdf2md.git
    cd mcp-pdf2md
    
  2. 创建虚拟环境并安装依赖项:

    Linux/macOS:

    uv venv
    source .venv/bin/activate
    uv pip install -e .
    

    Windows:

    uv venv
    .venv\Scripts\activate
    uv pip install -e .
    
  3. 配置环境变量:

    在项目根目录中创建一个 .env 文件,并设置以下环境变量:

    MINERU_API_BASE=https://mineru.net/api/v4/extract/task
    MINERU_BATCH_API=https://mineru.net/api/v4/extract/task/batch
    MINERU_BATCH_RESULTS_API=https://mineru.net/api/v4/extract-results/batch
    MINERU_API_KEY=your_api_key_here
    
  4. 启动服务:

    uv run pdf2md
    

命令行参数

该服务器支持以下命令行参数:

Claude Desktop 配置

在 Claude Desktop 中添加以下配置:

Windows:

{
    "mcpServers": {
        "pdf2md": {
            "command": "uv",
            "args": [
                "--directory",
                "C:\\path\\to\\mcp-pdf2md",
                "run",
                "pdf2md",
                "--output-dir",
                "C:\\path\\to\\output"
            ],
            "env": {
                "MINERU_API_KEY": "your_api_key_here"
            }
        }
    }
}

Linux/macOS:

{
    "mcpServers": {
        "pdf2md": {
            "command": "uv",
            "args": [
                "--directory",
                "/path/to/mcp-pdf2md",
                "run",
                "pdf2md",
                "--output-dir",
                "/path/to/output"
            ],
            "env": {
                "MINERU_API_KEY": "your_api_key_here"
            }
        }
    }
}

关于 API 密钥配置的说明: 您可以通过两种方式设置 API 密钥:

  1. 在项目目录中的 .env 文件中(推荐用于开发)
  2. 在 Claude Desktop 配置中,如上所示(推荐用于常规使用)

如果您在两个地方都设置了 API 密钥,则 Claude Desktop 配置中的密钥将优先。

MCP 工具

该服务器提供以下 MCP 工具:

  • convert_pdf_url: 将 PDF URL 转换为 Markdown
  • convert_pdf_file: 将本地 PDF 文件转换为 Markdown

获取 MinerU API 密钥

本项目依赖 MinerU API 进行 PDF 内容提取。要获取 API 密钥:

  1. 访问 MinerU 官方网站 并注册一个帐户
  2. 登录后,在 此链接 申请 API 测试资格
  3. 您的申请获得批准后,您可以访问 API 管理 页面
  4. 按照提供的说明生成您的 API 密钥
  5. 复制生成的 API 密钥
  6. 使用此字符串作为 MINERU_API_KEY 的值

请注意,MinerU API 的访问目前处于测试阶段,需要 MinerU 团队的批准。审批过程可能需要一些时间,请提前计划。

演示

输入 PDF

输入 PDF

输出 Markdown

输出 Markdown

许可证

MIT 许可证 - 有关详细信息,请参见 LICENSE 文件。

鸣谢

本项目基于 MinerU 的 API。

推荐服务器

Baidu Map

Baidu Map

百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。

官方
精选
JavaScript
Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。

官方
精选
本地
TypeScript
Audiense Insights MCP Server

Audiense Insights MCP Server

通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。

官方
精选
本地
TypeScript
VeyraX

VeyraX

一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。

官方
精选
本地
graphlit-mcp-server

graphlit-mcp-server

模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。

官方
精选
TypeScript
Kagi MCP Server

Kagi MCP Server

一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。

官方
精选
Python
e2b-mcp-server

e2b-mcp-server

使用 MCP 通过 e2b 运行代码。

官方
精选
Neon MCP Server

Neon MCP Server

用于与 Neon 管理 API 和数据库交互的 MCP 服务器

官方
精选
Exa MCP Server

Exa MCP Server

模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。

官方
精选