Simple Document Processing MCP Server
提供全面的文档处理功能,包括读取、转换和操作各种文档格式,并具备先进的文本和 HTML 处理能力。
Tools
document_reader
Read content from non-image document-files at specified paths, supporting various file formats: .pdf, .docx, .txt, .html, .csv
pdf_merger
Merge multiple PDF files into one
pdf_splitter
Split a PDF file into multiple files
docx_to_pdf
Convert DOCX files to PDF format
docx_to_html
Convert DOCX to HTML while preserving formatting
html_cleaner
Clean HTML by removing unnecessary tags and attributes
html_to_text
Convert HTML to plain text while preserving structure
html_to_markdown
Convert HTML to Markdown format
html_extract_resources
Extract all resources (images, videos, links) from HTML
html_formatter
Format and beautify HTML code
text_diff
Compare two text files and show differences
text_splitter
Split text file by specified delimiter or line count
text_formatter
Format text with proper indentation and line spacing
text_encoding_converter
Convert text between different encodings
excel_read
Read Excel file and convert to JSON format while preserving structure
format_convert
Convert between different document formats (Markdown, HTML, XML, JSON)
README
简易文档处理 MCP 服务器
一个强大的模型上下文协议 (MCP) 服务器,提供全面的文档处理能力。
<a href="https://glama.ai/mcp/servers/pb9df6lnel"><img width="380" height="200" src="https://glama.ai/mcp/servers/pb9df6lnel/badge" alt="Simple Document Processing Server MCP server" /></a>
功能
文档读取器
- 读取 DOCX、PDF、TXT、HTML、CSV
文档转换
- DOCX 到 HTML/PDF 转换
- HTML 到 TXT/Markdown 转换
- PDF 操作(合并、拆分)
文本处理
- 多编码传输支持 (UTF-8, Big5, GBK)
- 文本格式化和清理
- 文本比较和差异生成
- 按行或分隔符拆分文本
HTML 处理
- HTML 清理和格式化
- 资源提取(图像、链接、视频)
- 结构保留转换
安装
通过 Smithery 安装
要通过 Smithery 为 Claude Desktop 自动安装文档处理服务器:
npx -y @smithery/cli install @cablate/mcp-doc-forge --client claude
手动安装
npm install -g @cablate/mcp-doc-forge
用法
Cli
mcp-doc-forge
使用 Dive Desktop
- 在 Dive Desktop 中点击 "+ Add MCP Server"
- 复制并粘贴此配置:
{
"mcpServers": {
"searxng": {
"command": "npx",
"args": [
"-y",
"@cablate/mcp-doc-forge"
],
"enabled": true
}
}
}
- 点击 "Save" 以安装 MCP 服务器
许可证
MIT
贡献
欢迎社区参与和贡献! 以下是贡献的方式:
- ⭐️ 如果您觉得它有帮助,请为该项目点亮星星
- 🐛 提交问题:报告问题或提供建议
- 🔧 创建拉取请求:提交代码改进
联系方式
如果您有任何问题或建议,请随时联系:
- 📧 电子邮件:reahtuoo310109@gmail.com
- 📧 GitHub:CabLate
- 🤝 合作:欢迎讨论项目合作
- 📚 技术指导:真诚欢迎提出建议和指导
推荐服务器
mult-fetch-mcp-server
一个多功能的、符合 MCP 规范的网页内容抓取工具,支持多种模式(浏览器/Node)、格式(HTML/JSON/Markdown/文本)和智能代理检测,并提供双语界面(英语/中文)。
Knowledge Graph Memory Server
为 Claude 实现持久性记忆,使用本地知识图谱,允许 AI 记住用户的信息,并可在自定义位置存储,跨对话保持记忆。
Hyperbrowser
欢迎来到 Hyperbrowser,人工智能的互联网。Hyperbrowser 是下一代平台,旨在增强人工智能代理的能力,并实现轻松、可扩展的浏览器自动化。它专为人工智能开发者打造,消除了本地基础设施和性能瓶颈带来的麻烦,让您能够:
Exa MCP Server
一个模型上下文协议服务器,它使像 Claude 这样的人工智能助手能够以安全和受控的方式,使用 Exa AI 搜索 API 执行实时网络搜索。
mcp-perplexity
Perplexity API 的 MCP 服务器。
MCP Web Research Server
一个模型上下文协议服务器,使 Claude 能够通过集成 Google 搜索、提取网页内容和捕获屏幕截图来进行网络研究。
PubMedSearch MCP Server
一个模型内容协议(Model Content Protocol)服务器,提供从 PubMed 数据库搜索和检索学术论文的工具。
YouTube Translate MCP
一个模型上下文协议服务器,可以通过文字稿、翻译、摘要和各种语言的字幕生成来访问 YouTube 视频内容。
mcp-codex-keeper
作为开发知识的守护者,为 AI 助手提供精心策划的最新文档和最佳实践访问权限。
Perplexity Deep Research MCP
一个服务器,它允许 AI 助手使用 Perplexity 的 sonar-deep-research 模型进行网络搜索,并提供引用支持。