nutjs-windows-control

nutjs-windows-control

一个使用 nut.js 和模型上下文协议 (MCP) 构建的 Windows 控制服务器,提供对 Windows 系统操作的程序化控制,包括鼠标、键盘、窗口管理和屏幕截图功能。

远程shell执行
访问服务器

README

MCPControl

用于模型上下文协议的Windows控制服务器,提供对系统操作的程序化控制,包括鼠标、键盘、窗口管理和屏幕捕获功能。

我几个月前开发了这个项目作为一项实验,想看看Claude是否可以玩一些视频游戏。在看到它工作后,我印象深刻,但把它放在一边了。最近,它受到了社区的关注,促使我恢复了开发。虽然目前处于预发布状态,但我正在积极努力实现一个稳定版本。如果您遇到任何问题,请通过问题跟踪器提交。

注意: 此项目目前仅支持Windows。

⚠️ 重要免责声明

此软件是实验性的,并且可能存在危险

使用此软件,您承认并接受以下内容:

  • 通过此工具让AI模型直接控制您的计算机本质上是危险的
  • 此软件可以控制您的鼠标、键盘和其他系统功能,这可能会导致意想不到的后果
  • 您完全自行承担使用此软件的风险
  • 本项目的创建者和贡献者对因使用此软件而可能造成的任何损害、数据丢失或其他后果不承担任何责任
  • 此工具应仅在具有适当安全措施的受控环境中使用

使用风险自负

功能

  • 窗口管理

    • 列出所有窗口
    • 获取活动窗口信息
    • 获取窗口标题
    • 获取窗口大小和位置
    • 聚焦窗口
    • 调整窗口大小
    • 重新定位窗口
  • 鼠标控制

    • 鼠标移动
    • 点击操作
    • 滚动功能
    • 拖动操作
    • 光标位置跟踪
  • 键盘控制

    • 文本输入
    • 组合键
    • 按键/释放操作
    • 按住键功能
  • 屏幕操作

    • 屏幕捕获
    • 屏幕大小检索
    • 活动窗口检测
  • 剪贴板集成

    • 获取剪贴板内容
    • 设置剪贴板内容
    • 清空剪贴板
    • 检查剪贴板状态

用法

只需配置您的Claude MCP设置以使用MCPControl,如MCP服务器配置部分所示。无需安装!

从源代码构建

如果您有兴趣贡献或从源代码构建,请参阅CONTRIBUTING.md以获取详细说明。

开发要求

要构建此项目进行开发,您需要:

  1. Windows操作系统(keysender依赖项需要)
  2. Node.js 18或更高版本(使用包含构建工具的官方Windows安装程序安装)
  3. npm包管理器
  4. 本地构建工具:
    • node-gyp: npm install -g node-gyp
    • cmake-js: npm install -g cmake-js

keysender依赖项依赖于Windows特定的本地模块,这些模块需要这些构建工具。

MCP服务器配置

要使用此项目,您需要必要的构建工具:

  1. 使用官方Windows安装程序安装Node.js,其中包含必要的构建工具
  2. 安装其他必需的工具:
npm install -g node-gyp
npm install -g cmake-js

然后,将以下配置添加到您的MCP设置:

{
  "mcpServers": {
    "MCPControl": {
      "command": "npx",
      "args": [
        "--no-cache",
        "-y",
        "mcp-control"
      ]
    }
  }
}

配置MCP设置后,重新启动您的客户端以在菜单中查看MCPControl服务。

项目结构

  • /src
    • /handlers - 请求处理程序和工具管理
    • /tools - 核心功能实现
    • /types - TypeScript类型定义
    • index.ts - 主应用程序入口点

依赖项

测试

该项目目前包括核心功能的单元测试。以下测试领域计划用于未来的开发:

  • 跨模块功能的集成测试
  • 性能测试
  • 错误处理验证

已知限制

  • 目前不支持窗口最小化/恢复操作
  • 多个屏幕功能可能无法按预期工作,具体取决于设置
  • get_screenshot实用程序不适用于VS Code Extension Cline。请参阅GitHub issue #1865
  • 某些操作可能需要提升的权限,具体取决于目标应用程序
  • 仅支持Windows

贡献

请参阅CONTRIBUTING.md

许可证

此项目根据MIT许可证获得许可 - 有关详细信息,请参阅LICENSE文件。

参考

推荐服务器

e2b-mcp-server

e2b-mcp-server

使用 MCP 通过 e2b 运行代码。

官方
精选
AIO-MCP Server

AIO-MCP Server

🚀 集成了 AI 搜索、RAG 和多服务(GitLab/Jira/Confluence/YouTube)的一体化 MCP 服务器,旨在增强 AI 驱动的开发工作流程。来自 Folk。

精选
本地
https://github.com/Streen9/react-mcp

https://github.com/Streen9/react-mcp

react-mcp 与 Claude Desktop 集成,能够根据用户提示创建和修改 React 应用程序。

精选
本地
any-chat-completions-mcp

any-chat-completions-mcp

将 Claude 与任何 OpenAI SDK 兼容的聊天完成 API 集成 - OpenAI、Perplexity、Groq、xAI、PyroPrompts 等。

精选
Exa MCP Server

Exa MCP Server

一个模型上下文协议服务器,它使像 Claude 这样的人工智能助手能够以安全和受控的方式,使用 Exa AI 搜索 API 执行实时网络搜索。

精选
MySQL MCP Server

MySQL MCP Server

允许人工智能助手通过受控界面列出表格、读取数据和执行 SQL 查询,从而使数据库探索和分析更安全、更有条理。

精选
browser-use MCP server

browser-use MCP server

一个由人工智能驱动的浏览器自动化服务器,它实现了模型上下文协议,从而能够使用自然语言控制网页浏览器,以执行诸如导航、表单填写和视觉交互等任务。

精选
mcp-codex-keeper

mcp-codex-keeper

作为开发知识的守护者,为 AI 助手提供精心策划的最新文档和最佳实践访问权限。

精选
OpenRouter MCP Server

OpenRouter MCP Server

提供与 OpenRouter.ai 的集成,允许通过统一的界面访问各种 AI 模型。

精选
Supabase MCP Server

Supabase MCP Server

通过提供数据库管理、SQL查询执行和Supabase管理API访问工具,并内置安全控制,使Cursor和Windsurf能够安全地与Supabase数据库交互。

精选