🖼️ MCP Screenshot Server

🖼️ MCP Screenshot Server

一个轻量级的、与 MCP 兼容的 Python 服务器,用于通过 REST API 捕获 Windows 屏幕截图。支持全屏、基于区域或特定窗口的捕获。非常适合 AI 代理集成和自动化工作流程。

margusmartsepp

开发者工具
访问服务器

README

🖼️ MCP 截图服务器

一个轻量级的、兼容 MCP 的截图微服务,使用 FastAPI 构建,专为 Windows 设计。 它允许 AI 代理和自动化工具通过简单的 HTTP 调用来捕获全屏、基于区域或特定窗口的截图。

MCP 兼容 License: MIT Python


🔧 功能

  • 📸 捕获全屏截图
  • 🪟 通过标题捕获特定窗口
  • 🔲 捕获自定义区域 [x, y, width, height]
  • 🧠 兼容 MCP 的 REST API
  • 🖼️ 以 PNG 或 base64 格式返回图像
  • 🚀 使用 FastAPI 构建,为生产环境或 LLM 使用做好准备

🧠 使用场景

  • 使用 模型上下文协议 (MCP) 与 LLM 集成
  • QA 测试自动化流水线
  • 监控和远程捕获工具
  • 代理的视觉日志/调试工具

📦 安装

git clone https://github.com/yourusername/mcp-screenshot-server.git
cd mcp-screenshot-server
python -m venv .venv
source .venv/bin/activate   # 或 .venv\Scripts\activate 在 Windows 上
pip install -r requirements.txt
uvicorn main:app --reload

🔌 API 使用

POST /screenshot

请求 JSON body:

{
  "region": [0, 0, 1280, 720],        // 可选
  "window_title": "Untitled - Notepad", // 可选
  "base64": true                      // 可选 (默认: false)
}

响应 (base64 模式):

{
  "status": "ok",
  "mode": "region",
  "image_format": "base64",
  "image": "<base64-encoded-image>"
}

🛠️ 技术栈

  • Python 3.11+
  • FastAPI
  • msspyautogui 用于截图
  • pillow 用于图像处理
  • pygetwindow 用于窗口匹配 (可选)

📄 许可证

MIT 许可证。 随意使用、fork 和集成 — 商业或个人用途均可。 有关详细信息,请参阅 LICENSE


📬 贡献

欢迎提交 Pull Request 和 Issue! 欢迎提交 PR 以添加功能或提高跨平台兼容性(例如,Mac/Linux 支持)。


🙋 常见问题解答

  • 它可以在 Linux/macOS 上运行吗? 目前还不行。此版本专注于 Windows,但欢迎您扩展它。

  • 它是否通过 MCP 认证? 本项目旨在尽可能遵循 MCP 规范,以最大限度地与 LLM 代理兼容。


🧠 灵感来源


推荐服务器

Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。

官方
精选
本地
TypeScript
MCP Package Docs Server

MCP Package Docs Server

促进大型语言模型高效访问和获取 Go、Python 和 NPM 包的结构化文档,通过多语言支持和性能优化来增强软件开发。

精选
本地
TypeScript
Claude Code MCP

Claude Code MCP

一个实现了 Claude Code 作为模型上下文协议(Model Context Protocol, MCP)服务器的方案,它可以通过标准化的 MCP 接口来使用 Claude 的软件工程能力(代码生成、编辑、审查和文件操作)。

精选
本地
JavaScript
@kazuph/mcp-taskmanager

@kazuph/mcp-taskmanager

用于任务管理的模型上下文协议服务器。它允许 Claude Desktop(或任何 MCP 客户端)在基于队列的系统中管理和执行任务。

精选
本地
JavaScript
mermaid-mcp-server

mermaid-mcp-server

一个模型上下文协议 (MCP) 服务器,用于将 Mermaid 图表转换为 PNG 图像。

精选
JavaScript
Jira-Context-MCP

Jira-Context-MCP

MCP 服务器向 AI 编码助手(如 Cursor)提供 Jira 工单信息。

精选
TypeScript
Linear MCP Server

Linear MCP Server

一个模型上下文协议(Model Context Protocol)服务器,它与 Linear 的问题跟踪系统集成,允许大型语言模型(LLM)通过自然语言交互来创建、更新、搜索和评论 Linear 问题。

精选
JavaScript
Sequential Thinking MCP Server

Sequential Thinking MCP Server

这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

精选
Python
Curri MCP Server

Curri MCP Server

通过管理文本笔记、提供笔记创建工具以及使用结构化提示生成摘要,从而实现与 Curri API 的交互。

官方
本地
JavaScript