Simple Document Processing MCP Server

Simple Document Processing MCP Server

提供全面的文档处理功能,包括读取、转换和操作各种文档格式,并具备先进的文本和 HTML 处理能力。

数字笔记管理
内容获取
访问服务器

Tools

document_reader

Read content from non-image document-files at specified paths, supporting various file formats: .pdf, .docx, .txt, .html, .csv

pdf_merger

Merge multiple PDF files into one

pdf_splitter

Split a PDF file into multiple files

docx_to_pdf

Convert DOCX files to PDF format

docx_to_html

Convert DOCX to HTML while preserving formatting

html_cleaner

Clean HTML by removing unnecessary tags and attributes

html_to_text

Convert HTML to plain text while preserving structure

html_to_markdown

Convert HTML to Markdown format

html_extract_resources

Extract all resources (images, videos, links) from HTML

html_formatter

Format and beautify HTML code

text_diff

Compare two text files and show differences

text_splitter

Split text file by specified delimiter or line count

text_formatter

Format text with proper indentation and line spacing

text_encoding_converter

Convert text between different encodings

excel_read

Read Excel file and convert to JSON format while preserving structure

format_convert

Convert between different document formats (Markdown, HTML, XML, JSON)

README

简易文档处理 MCP 服务器

smithery badge

一个强大的模型上下文协议 (MCP) 服务器,提供全面的文档处理能力。

<a href="https://glama.ai/mcp/servers/pb9df6lnel"><img width="380" height="200" src="https://glama.ai/mcp/servers/pb9df6lnel/badge" alt="Simple Document Processing Server MCP server" /></a>

功能

文档读取器

  • 读取 DOCX、PDF、TXT、HTML、CSV

文档转换

  • DOCX 到 HTML/PDF 转换
  • HTML 到 TXT/Markdown 转换
  • PDF 操作(合并、拆分)

文本处理

  • 多编码传输支持 (UTF-8, Big5, GBK)
  • 文本格式化和清理
  • 文本比较和差异生成
  • 按行或分隔符拆分文本

HTML 处理

  • HTML 清理和格式化
  • 资源提取(图像、链接、视频)
  • 结构保留转换

安装

通过 Smithery 安装

要通过 Smithery 为 Claude Desktop 自动安装文档处理服务器:

npx -y @smithery/cli install @cablate/mcp-doc-forge --client claude

手动安装

npm install -g @cablate/mcp-doc-forge

用法

Cli

mcp-doc-forge

使用 Dive Desktop

  1. 在 Dive Desktop 中点击 "+ Add MCP Server"
  2. 复制并粘贴此配置:
{
  "mcpServers": {
    "searxng": {
      "command": "npx",
      "args": [
        "-y",
        "@cablate/mcp-doc-forge"
      ],
      "enabled": true
    }
  }
}
  1. 点击 "Save" 以安装 MCP 服务器

许可证

MIT

贡献

欢迎社区参与和贡献! 以下是贡献的方式:

  • ⭐️ 如果您觉得它有帮助,请为该项目点亮星星
  • 🐛 提交问题:报告问题或提供建议
  • 🔧 创建拉取请求:提交代码改进

联系方式

如果您有任何问题或建议,请随时联系:

  • 📧 电子邮件:reahtuoo310109@gmail.com
  • 📧 GitHub:CabLate
  • 🤝 合作:欢迎讨论项目合作
  • 📚 技术指导:真诚欢迎提出建议和指导

推荐服务器

mult-fetch-mcp-server

mult-fetch-mcp-server

一个多功能的、符合 MCP 规范的网页内容抓取工具,支持多种模式(浏览器/Node)、格式(HTML/JSON/Markdown/文本)和智能代理检测,并提供双语界面(英语/中文)。

精选
本地
Knowledge Graph Memory Server

Knowledge Graph Memory Server

为 Claude 实现持久性记忆,使用本地知识图谱,允许 AI 记住用户的信息,并可在自定义位置存储,跨对话保持记忆。

精选
本地
Hyperbrowser

Hyperbrowser

欢迎来到 Hyperbrowser,人工智能的互联网。Hyperbrowser 是下一代平台,旨在增强人工智能代理的能力,并实现轻松、可扩展的浏览器自动化。它专为人工智能开发者打造,消除了本地基础设施和性能瓶颈带来的麻烦,让您能够:

精选
本地
Exa MCP Server

Exa MCP Server

一个模型上下文协议服务器,它使像 Claude 这样的人工智能助手能够以安全和受控的方式,使用 Exa AI 搜索 API 执行实时网络搜索。

精选
mcp-perplexity

mcp-perplexity

Perplexity API 的 MCP 服务器。

精选
MCP Web Research Server

MCP Web Research Server

一个模型上下文协议服务器,使 Claude 能够通过集成 Google 搜索、提取网页内容和捕获屏幕截图来进行网络研究。

精选
PubMedSearch MCP Server

PubMedSearch MCP Server

一个模型内容协议(Model Content Protocol)服务器,提供从 PubMed 数据库搜索和检索学术论文的工具。

精选
YouTube Translate MCP

YouTube Translate MCP

一个模型上下文协议服务器,可以通过文字稿、翻译、摘要和各种语言的字幕生成来访问 YouTube 视频内容。

精选
mcp-codex-keeper

mcp-codex-keeper

作为开发知识的守护者,为 AI 助手提供精心策划的最新文档和最佳实践访问权限。

精选
Perplexity Deep Research MCP

Perplexity Deep Research MCP

一个服务器,它允许 AI 助手使用 Perplexity 的 sonar-deep-research 模型进行网络搜索,并提供引用支持。

精选