Simple Document Processing MCP Server

Simple Document Processing MCP Server

提供全面的文档处理功能,包括读取、转换和操作各种文档格式,并具备先进的文本和 HTML 处理能力。

数字笔记管理
内容获取
访问服务器

Tools

document_reader

Read content from non-image document-files at specified paths, supporting various file formats: .pdf, .docx, .txt, .html, .csv

pdf_merger

Merge multiple PDF files into one

pdf_splitter

Split a PDF file into multiple files

docx_to_pdf

Convert DOCX files to PDF format

docx_to_html

Convert DOCX to HTML while preserving formatting

html_cleaner

Clean HTML by removing unnecessary tags and attributes

html_to_text

Convert HTML to plain text while preserving structure

html_to_markdown

Convert HTML to Markdown format

html_extract_resources

Extract all resources (images, videos, links) from HTML

html_formatter

Format and beautify HTML code

text_diff

Compare two text files and show differences

text_splitter

Split text file by specified delimiter or line count

text_formatter

Format text with proper indentation and line spacing

text_encoding_converter

Convert text between different encodings

excel_read

Read Excel file and convert to JSON format while preserving structure

format_convert

Convert between different document formats (Markdown, HTML, XML, JSON)

README

简易文档处理 MCP 服务器

smithery badge

一个强大的模型上下文协议 (MCP) 服务器,提供全面的文档处理能力。

<a href="https://glama.ai/mcp/servers/pb9df6lnel"><img width="380" height="200" src="https://glama.ai/mcp/servers/pb9df6lnel/badge" alt="Simple Document Processing Server MCP server" /></a>

功能

文档读取器

  • 读取 DOCX、PDF、TXT、HTML、CSV

文档转换

  • DOCX 到 HTML/PDF 转换
  • HTML 到 TXT/Markdown 转换
  • PDF 操作(合并、拆分)

文本处理

  • 多编码传输支持 (UTF-8, Big5, GBK)
  • 文本格式化和清理
  • 文本比较和差异生成
  • 按行或分隔符拆分文本

HTML 处理

  • HTML 清理和格式化
  • 资源提取(图像、链接、视频)
  • 结构保留转换

安装

通过 Smithery 安装

要通过 Smithery 为 Claude Desktop 自动安装文档处理服务器:

npx -y @smithery/cli install @cablate/mcp-doc-forge --client claude

手动安装

npm install -g @cablate/mcp-doc-forge

用法

Cli

mcp-doc-forge

使用 Dive Desktop

  1. 在 Dive Desktop 中点击 "+ Add MCP Server"
  2. 复制并粘贴此配置:
{
  "mcpServers": {
    "searxng": {
      "command": "npx",
      "args": [
        "-y",
        "@cablate/mcp-doc-forge"
      ],
      "enabled": true
    }
  }
}
  1. 点击 "Save" 以安装 MCP 服务器

许可证

MIT

贡献

欢迎社区参与和贡献! 以下是贡献的方式:

  • ⭐️ 如果您觉得它有帮助,请为该项目点亮星星
  • 🐛 提交问题:报告问题或提供建议
  • 🔧 创建拉取请求:提交代码改进

联系方式

如果您有任何问题或建议,请随时联系:

  • 📧 电子邮件:reahtuoo310109@gmail.com
  • 📧 GitHub:CabLate
  • 🤝 合作:欢迎讨论项目合作
  • 📚 技术指导:真诚欢迎提出建议和指导

推荐服务器

mult-fetch-mcp-server

mult-fetch-mcp-server

一个多功能的、符合 MCP 规范的网页内容抓取工具,支持多种模式(浏览器/Node)、格式(HTML/JSON/Markdown/文本)和智能代理检测,并提供双语界面(英语/中文)。

精选
本地
Knowledge Graph Memory Server

Knowledge Graph Memory Server

为 Claude 实现持久性记忆,使用本地知识图谱,允许 AI 记住用户的信息,并可在自定义位置存储,跨对话保持记忆。

精选
本地
Hyperbrowser

Hyperbrowser

欢迎来到 Hyperbrowser,人工智能的互联网。Hyperbrowser 是下一代平台,旨在增强人工智能代理的能力,并实现轻松、可扩展的浏览器自动化。它专为人工智能开发者打造,消除了本地基础设施和性能瓶颈带来的麻烦,让您能够:

精选
本地
Exa MCP Server

Exa MCP Server

一个模型上下文协议服务器,它使像 Claude 这样的人工智能助手能够以安全和受控的方式,使用 Exa AI 搜索 API 执行实时网络搜索。

精选
MCP Web Research Server

MCP Web Research Server

一个模型上下文协议服务器,使 Claude 能够通过集成 Google 搜索、提取网页内容和捕获屏幕截图来进行网络研究。

精选
mcp-perplexity

mcp-perplexity

Perplexity API 的 MCP 服务器。

精选
YouTube Translate MCP

YouTube Translate MCP

一个模型上下文协议服务器,可以通过文字稿、翻译、摘要和各种语言的字幕生成来访问 YouTube 视频内容。

精选
PubMedSearch MCP Server

PubMedSearch MCP Server

一个模型内容协议(Model Content Protocol)服务器,提供从 PubMed 数据库搜索和检索学术论文的工具。

精选
mcp-codex-keeper

mcp-codex-keeper

作为开发知识的守护者,为 AI 助手提供精心策划的最新文档和最佳实践访问权限。

精选
Perplexity Deep Research MCP

Perplexity Deep Research MCP

一个服务器,它允许 AI 助手使用 Perplexity 的 sonar-deep-research 模型进行网络搜索,并提供引用支持。

精选