🖼️ MCP Screenshot Server
一个轻量级的、与 MCP 兼容的 Python 服务器,用于通过 REST API 捕获 Windows 屏幕截图。支持全屏、基于区域或特定窗口的捕获。非常适合 AI 代理集成和自动化工作流程。
margusmartsepp
README
🖼️ MCP 截图服务器
一个轻量级的、兼容 MCP 的截图微服务,使用 FastAPI 构建,专为 Windows 设计。 它允许 AI 代理和自动化工具通过简单的 HTTP 调用来捕获全屏、基于区域或特定窗口的截图。
🔧 功能
- 📸 捕获全屏截图
- 🪟 通过标题捕获特定窗口
- 🔲 捕获自定义区域
[x, y, width, height]
- 🧠 兼容 MCP 的 REST API
- 🖼️ 以 PNG 或 base64 格式返回图像
- 🚀 使用 FastAPI 构建,为生产环境或 LLM 使用做好准备
🧠 使用场景
- 使用 模型上下文协议 (MCP) 与 LLM 集成
- QA 测试自动化流水线
- 监控和远程捕获工具
- 代理的视觉日志/调试工具
📦 安装
git clone https://github.com/yourusername/mcp-screenshot-server.git
cd mcp-screenshot-server
python -m venv .venv
source .venv/bin/activate # 或 .venv\Scripts\activate 在 Windows 上
pip install -r requirements.txt
uvicorn main:app --reload
🔌 API 使用
POST /screenshot
请求 JSON body:
{
"region": [0, 0, 1280, 720], // 可选
"window_title": "Untitled - Notepad", // 可选
"base64": true // 可选 (默认: false)
}
响应 (base64 模式):
{
"status": "ok",
"mode": "region",
"image_format": "base64",
"image": "<base64-encoded-image>"
}
🛠️ 技术栈
- Python 3.11+
- FastAPI
mss
或pyautogui
用于截图pillow
用于图像处理pygetwindow
用于窗口匹配 (可选)
📄 许可证
MIT 许可证。 随意使用、fork 和集成 — 商业或个人用途均可。 有关详细信息,请参阅 LICENSE。
📬 贡献
欢迎提交 Pull Request 和 Issue! 欢迎提交 PR 以添加功能或提高跨平台兼容性(例如,Mac/Linux 支持)。
🙋 常见问题解答
-
它可以在 Linux/macOS 上运行吗? 目前还不行。此版本专注于 Windows,但欢迎您扩展它。
-
它是否通过 MCP 认证? 本项目旨在尽可能遵循 MCP 规范,以最大限度地与 LLM 代理兼容。
🧠 灵感来源
- Anthropic 的 模型上下文协议
- 由 LLM 和 Python 驱动的真实世界自动化用例
推荐服务器
Playwright MCP Server
一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。
Magic Component Platform (MCP)
一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。
MCP Package Docs Server
促进大型语言模型高效访问和获取 Go、Python 和 NPM 包的结构化文档,通过多语言支持和性能优化来增强软件开发。
Claude Code MCP
一个实现了 Claude Code 作为模型上下文协议(Model Context Protocol, MCP)服务器的方案,它可以通过标准化的 MCP 接口来使用 Claude 的软件工程能力(代码生成、编辑、审查和文件操作)。
@kazuph/mcp-taskmanager
用于任务管理的模型上下文协议服务器。它允许 Claude Desktop(或任何 MCP 客户端)在基于队列的系统中管理和执行任务。
mermaid-mcp-server
一个模型上下文协议 (MCP) 服务器,用于将 Mermaid 图表转换为 PNG 图像。
Jira-Context-MCP
MCP 服务器向 AI 编码助手(如 Cursor)提供 Jira 工单信息。

Linear MCP Server
一个模型上下文协议(Model Context Protocol)服务器,它与 Linear 的问题跟踪系统集成,允许大型语言模型(LLM)通过自然语言交互来创建、更新、搜索和评论 Linear 问题。

Sequential Thinking MCP Server
这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。
Curri MCP Server
通过管理文本笔记、提供笔记创建工具以及使用结构化提示生成摘要,从而实现与 Curri API 的交互。