
mcp-mistral-ocr
使用 Mistral OCR API (付费) 可以对本地或 URL 中的 OCR 图像或 PDF 进行处理。 (Yǐ shǐyòng Mistral OCR API (fùfèi) kěyǐ duì běndì huò URL zhōng de OCR túxiàng huò PDF jìnxíng chǔlǐ.)
README
MCP Mistral OCR
一个使用 Mistral AI 的 OCR API 提供 OCR 功能的 MCP 服务器。此服务器可以处理本地文件和 URL,支持图像和 PDF。
功能
- 使用 Mistral 的 OCR 处理本地文件(图像和 PDF)
- 处理来自 URL 的文件,需要明确的文件类型指定
- 支持多种文件格式(JPG、PNG、PDF 等)
- 结果保存为带有时间戳的 JSON 文件
- Docker 容器化
- UV 包管理
环境变量
MISTRAL_API_KEY
: 您的 Mistral AI API 密钥OCR_DIR
: 用于本地文件处理的目录路径。在容器内部,此路径始终映射到/data/ocr
安装
使用 Docker
- 构建 Docker 镜像:
docker build -t mcp-mistral-ocr .
- 运行容器:
docker run -e MISTRAL_API_KEY=your_api_key -e OCR_DIR=/data/ocr -v /path/to/local/files:/data/ocr mcp-mistral-ocr
本地开发
- 安装 UV 包管理器:
pip install uv
- 创建并激活虚拟环境:
uv venv
source .venv/bin/activate # 在 Unix 上
# 或
.venv\Scripts\activate # 在 Windows 上
- 安装依赖:
uv pip install .
Claude Desktop 配置
将此配置添加到您的 claude_desktop_config.json:
{
"mcpServers": {
"mistral-ocr": {
"command": "docker",
"args": [
"run",
"-i",
"--rm",
"-e",
"MISTRAL_API_KEY",
"-e",
"OCR_DIR",
"-v",
"C:/path/to/your/files:/data/ocr",
"mcp-mistral-ocr:latest"
],
"env": {
"MISTRAL_API_KEY": "<YOUR_MISTRAL_API_KEY>",
"OCR_DIR": "C:/path/to/your/files"
}
}
}
}
可用工具
1. process_local_file
处理来自配置的 OCR_DIR 目录的文件。
{
"name": "process_local_file",
"arguments": {
"filename": "document.pdf"
}
}
2. process_url_file
处理来自 URL 的文件。需要明确的文件类型指定。
{
"name": "process_url_file",
"arguments": {
"url": "https://example.com/document",
"file_type": "image" // 或 "pdf"
}
}
输出
OCR 结果以 JSON 格式保存在 OCR_DIR
内部的 output
目录中。每个结果文件使用以下格式命名:
- 对于本地文件:
{原始文件名}_{时间戳}.json
- 对于 URL:
{url 文件名}_{时间戳}.json
或url_document_{时间戳}.json
如果在 URL 中找不到文件名
时间戳格式为 YYYYMMDD_HHMMSS
。
支持的文件类型
- 图像:JPG、JPEG、PNG、GIF、WebP
- 文档:PDF 以及 Mistral OCR 支持的其他文档格式
限制
- 最大文件大小:50MB(由 Mistral API 强制执行)
- 最大文档页数:1000(由 Mistral API 强制执行)
推荐服务器

Baidu Map
百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。
Playwright MCP Server
一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。
Magic Component Platform (MCP)
一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。
Audiense Insights MCP Server
通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。

VeyraX
一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。
graphlit-mcp-server
模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。
Kagi MCP Server
一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。

e2b-mcp-server
使用 MCP 通过 e2b 运行代码。
Neon MCP Server
用于与 Neon 管理 API 和数据库交互的 MCP 服务器
Exa MCP Server
模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。