nutjs-windows-control
一个使用 nut.js 和模型上下文协议 (MCP) 构建的 Windows 控制服务器,提供对 Windows 系统操作的程序化控制,包括鼠标、键盘、窗口管理和屏幕截图功能。
README
MCPControl
用于模型上下文协议的Windows控制服务器,提供对系统操作的程序化控制,包括鼠标、键盘、窗口管理和屏幕捕获功能。
我几个月前开发了这个项目作为一项实验,想看看Claude是否可以玩一些视频游戏。在看到它工作后,我印象深刻,但把它放在一边了。最近,它受到了社区的关注,促使我恢复了开发。虽然目前处于预发布状态,但我正在积极努力实现一个稳定版本。如果您遇到任何问题,请通过问题跟踪器提交。
注意: 此项目目前仅支持Windows。
⚠️ 重要免责声明
此软件是实验性的,并且可能存在危险
使用此软件,您承认并接受以下内容:
- 通过此工具让AI模型直接控制您的计算机本质上是危险的
- 此软件可以控制您的鼠标、键盘和其他系统功能,这可能会导致意想不到的后果
- 您完全自行承担使用此软件的风险
- 本项目的创建者和贡献者对因使用此软件而可能造成的任何损害、数据丢失或其他后果不承担任何责任
- 此工具应仅在具有适当安全措施的受控环境中使用
使用风险自负
功能
-
窗口管理
- 列出所有窗口
- 获取活动窗口信息
- 获取窗口标题
- 获取窗口大小和位置
- 聚焦窗口
- 调整窗口大小
- 重新定位窗口
-
鼠标控制
- 鼠标移动
- 点击操作
- 滚动功能
- 拖动操作
- 光标位置跟踪
-
键盘控制
- 文本输入
- 组合键
- 按键/释放操作
- 按住键功能
-
屏幕操作
- 屏幕捕获
- 屏幕大小检索
- 活动窗口检测
-
剪贴板集成
- 获取剪贴板内容
- 设置剪贴板内容
- 清空剪贴板
- 检查剪贴板状态
用法
只需配置您的Claude MCP设置以使用MCPControl,如MCP服务器配置部分所示。无需安装!
从源代码构建
如果您有兴趣贡献或从源代码构建,请参阅CONTRIBUTING.md以获取详细说明。
开发要求
要构建此项目进行开发,您需要:
- Windows操作系统(keysender依赖项需要)
- Node.js 18或更高版本(使用包含构建工具的官方Windows安装程序安装)
- npm包管理器
- 本地构建工具:
- node-gyp:
npm install -g node-gyp
- cmake-js:
npm install -g cmake-js
- node-gyp:
keysender依赖项依赖于Windows特定的本地模块,这些模块需要这些构建工具。
MCP服务器配置
要使用此项目,您需要必要的构建工具:
- 使用官方Windows安装程序安装Node.js,其中包含必要的构建工具
- 安装其他必需的工具:
npm install -g node-gyp
npm install -g cmake-js
然后,将以下配置添加到您的MCP设置:
{
"mcpServers": {
"MCPControl": {
"command": "npx",
"args": [
"--no-cache",
"-y",
"mcp-control"
]
}
}
}
配置MCP设置后,重新启动您的客户端以在菜单中查看MCPControl服务。
项目结构
/src
/handlers
- 请求处理程序和工具管理/tools
- 核心功能实现/types
- TypeScript类型定义index.ts
- 主应用程序入口点
依赖项
- @modelcontextprotocol/sdk - 用于协议实现的MCP SDK
- keysender - 仅Windows UI自动化库
- clipboardy - 剪贴板处理
- sharp - 图像处理
- uuid - UUID生成
测试
该项目目前包括核心功能的单元测试。以下测试领域计划用于未来的开发:
- 跨模块功能的集成测试
- 性能测试
- 错误处理验证
已知限制
- 目前不支持窗口最小化/恢复操作
- 多个屏幕功能可能无法按预期工作,具体取决于设置
- get_screenshot实用程序不适用于VS Code Extension Cline。请参阅GitHub issue #1865
- 某些操作可能需要提升的权限,具体取决于目标应用程序
- 仅支持Windows
贡献
许可证
此项目根据MIT许可证获得许可 - 有关详细信息,请参阅LICENSE文件。
参考
推荐服务器

e2b-mcp-server
使用 MCP 通过 e2b 运行代码。
AIO-MCP Server
🚀 集成了 AI 搜索、RAG 和多服务(GitLab/Jira/Confluence/YouTube)的一体化 MCP 服务器,旨在增强 AI 驱动的开发工作流程。来自 Folk。
https://github.com/Streen9/react-mcp
react-mcp 与 Claude Desktop 集成,能够根据用户提示创建和修改 React 应用程序。

any-chat-completions-mcp
将 Claude 与任何 OpenAI SDK 兼容的聊天完成 API 集成 - OpenAI、Perplexity、Groq、xAI、PyroPrompts 等。
Exa MCP Server
一个模型上下文协议服务器,它使像 Claude 这样的人工智能助手能够以安全和受控的方式,使用 Exa AI 搜索 API 执行实时网络搜索。
MySQL MCP Server
允许人工智能助手通过受控界面列出表格、读取数据和执行 SQL 查询,从而使数据库探索和分析更安全、更有条理。
browser-use MCP server
一个由人工智能驱动的浏览器自动化服务器,它实现了模型上下文协议,从而能够使用自然语言控制网页浏览器,以执行诸如导航、表单填写和视觉交互等任务。
mcp-codex-keeper
作为开发知识的守护者,为 AI 助手提供精心策划的最新文档和最佳实践访问权限。

OpenRouter MCP Server
提供与 OpenRouter.ai 的集成,允许通过统一的界面访问各种 AI 模型。
Supabase MCP Server
通过提供数据库管理、SQL查询执行和Supabase管理API访问工具,并内置安全控制,使Cursor和Windsurf能够安全地与Supabase数据库交互。