AI Vision MCP Server

AI Vision MCP Server

镜子 (jìng zi)

MCP-Mirror

研究与数据
访问服务器

README

AI Vision MCP 服务器

一个模型上下文协议 (MCP) 服务器,为 Claude 和其他兼容 MCP 的 AI 助手提供 AI 驱动的视觉分析能力。

功能

  • 截图 URL: 通过提供 URL 捕获任何网站的屏幕截图
  • 视觉分析: 分析屏幕截图中的 UI 元素、布局和内容
  • 文件操作: 以行级精度读取和修改文件
  • 报告生成: 创建全面的 UI/UX 分析报告
  • 调试会话: 在多个分析步骤中保持上下文

安装

# 克隆仓库
git clone https://github.com/samihalawa/mcp-server-ai-vision.git
cd mcp-server-ai-vision

# 安装依赖
npm install

# 构建服务器
npm run build

使用

启动服务器

npm start

配置

将服务器添加到您的 MCP 配置中:

{
  "servers": {
    "ai-vision": {
      "command": "/path/to/node",
      "args": ["/path/to/mcp-server-ai-vision/build/index.js"],
      "enabled": true,
      "port": 3005,
      "environment": {
        "NODE_PATH": "/path/to/node_modules",
        "PATH": "/usr/local/bin:/usr/bin:/bin",
        "GEMINI_API_KEY": "your-gemini-api-key"
      }
    }
  }
}

可用工具

screenshot_url

使用 Web 浏览器拍摄 URL 的屏幕截图。

参数:

  • url (字符串,必需): 要捕获屏幕截图的 URL (例如,http://localhost:4999, https://google.com)
  • fullPage (布尔值,可选): 是否捕获完整页面或仅捕获视口。默认值:false
  • waitForSelector (字符串,可选): 在拍摄屏幕截图之前要等待的 CSS 选择器
  • waitTime (数字,可选): 拍摄屏幕截图前等待的时间(以毫秒为单位)。默认值:1000

analyze_screen

使用 AI 视觉分析屏幕截图。

参数:无(使用最新的屏幕截图)

read_file

从指定行号之间的文件中读取内容。

参数:

  • path (字符串): 文件路径
  • startLine (数字): 起始行号(从 1 开始)
  • endLine (数字): 结束行号(从 1 开始)

modify_file

修改指定行号之间的文件内容。

参数:

  • path (字符串): 文件路径
  • startLine (数字): 要替换的起始行号(从 1 开始)
  • endLine (数字): 要替换的结束行号(从 1 开始)
  • content (字符串): 用于替换指定行的新内容

generate_report

生成全面的 UI/UX 分析报告。

参数:

  • testUrl (字符串): 被测应用程序的 URL
  • appName (字符串,可选): 被分析应用程序的名称
  • date (字符串,可选): 分析日期 (YYYY-MM-DD)
  • observations (对象): 观察结果,结构化为组件、数据状态、交互等。

示例工作流程

  1. 拍摄网站的屏幕截图:

    screenshot_url(url: "https://example.com")
    
  2. 分析屏幕截图:

    analyze_screen()
    
  3. 根据分析生成报告:

    generate_report(testUrl: "https://example.com", observations: {...})
    

要求

  • Node.js 14+
  • 用于浏览器自动化的 Playwright
  • 用于 AI 视觉分析的 Gemini API 密钥

许可证

MIT

推荐服务器

Crypto Price & Market Analysis MCP Server

Crypto Price & Market Analysis MCP Server

一个模型上下文协议 (MCP) 服务器,它使用 CoinCap API 提供全面的加密货币分析。该服务器通过一个易于使用的界面提供实时价格数据、市场分析和历史趋势。 (Alternative, slightly more formal and technical translation): 一个模型上下文协议 (MCP) 服务器,利用 CoinCap API 提供全面的加密货币分析服务。该服务器通过用户友好的界面,提供实时价格数据、市场分析以及历史趋势数据。

精选
TypeScript
MCP PubMed Search

MCP PubMed Search

用于搜索 PubMed 的服务器(PubMed 是一个免费的在线数据库,用户可以在其中搜索生物医学和生命科学文献)。 我是在 MCP 发布当天创建的,但当时正在度假。 我看到有人在您的数据库中发布了类似的服务器,但还是决定发布我的服务器。

精选
Python
mixpanel

mixpanel

连接到您的 Mixpanel 数据。 从 Mixpanel 分析查询事件、留存和漏斗数据。

精选
TypeScript
Sequential Thinking MCP Server

Sequential Thinking MCP Server

这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

精选
Python
Nefino MCP Server

Nefino MCP Server

为大型语言模型提供访问德国可再生能源项目新闻和信息的能力,允许按地点、主题(太阳能、风能、氢能)和日期范围进行筛选。

官方
Python
Vectorize

Vectorize

将 MCP 服务器向量化以实现高级检索、私有深度研究、Anything-to-Markdown 文件提取和文本分块。

官方
JavaScript
Mathematica Documentation MCP server

Mathematica Documentation MCP server

一个服务器,通过 FastMCP 提供对 Mathematica 文档的访问,使用户能够从 Wolfram Mathematica 检索函数文档和列出软件包符号。

本地
Python
kb-mcp-server

kb-mcp-server

一个 MCP 服务器,旨在实现便携性、本地化、简易性和便利性,以支持对 txtai “all in one” 嵌入数据库进行基于语义/图的检索。任何 tar.gz 格式的 txtai 嵌入数据库都可以被加载。

本地
Python
Research MCP Server

Research MCP Server

这个服务器用作 MCP 服务器,与 Notion 交互以检索和创建调查数据,并与 Claude Desktop Client 集成以进行和审查调查。

本地
Python
Cryo MCP Server

Cryo MCP Server

一个API服务器,实现了模型补全协议(MCP),用于Cryo区块链数据提取,允许用户通过任何兼容MCP的客户端查询以太坊区块链数据。

本地
Python