Youtube Vision MCP

Youtube Vision MCP

利用 Google Gemini Vision API 与 YouTube 视频交互的 MCP(模型上下文协议)服务器。它允许用户获取 YouTube 视频的描述、摘要、问题解答以及提取关键时刻。

Category
访问服务器

Tools

summarize_youtube_video

Generates a summary of a given YouTube video URL using Gemini Vision API.

ask_about_youtube_video

Answers a question about the video or provides a general description if no question is asked.

extract_key_moments

Extracts key moments (timestamps and descriptions) from a given YouTube video.

list_supported_models

Lists available Gemini models that support the 'generateContent' method.

README

YouTube Vision MCP 服务器 (youtube-vision)

NPM version License: MIT smithery badge

<a href="https://glama.ai/mcp/servers/@minbang930/Youtube-Vision-MCP"> <img width="380" height="200" src="https://glama.ai/mcp/servers/@minbang930/Youtube-Vision-MCP/badge" alt="Youtube Vision MCP" /> </a>

MCP (模型上下文协议) 服务器,利用 Google Gemini Vision API 与 YouTube 视频进行交互。它允许用户获取 YouTube 视频的描述、摘要、问题解答以及提取关键时刻。

特性

  • 使用 Gemini Vision API 分析 YouTube 视频。
  • 提供多种工具用于不同的交互:
    • 通用描述或问答 (ask_about_youtube_video)
    • 摘要 (summarize_youtube_video)
    • 关键时刻提取 (extract_key_moments)
  • 列出支持 generateContent 的可用 Gemini 模型。
  • 可通过环境变量配置 Gemini 模型。
  • 通过 stdio(标准输入/输出)进行通信。

前提条件

在使用此服务器之前,请确保您已具备以下条件:

  • Node.js: 推荐版本 18 或更高版本。您可以从 nodejs.org 下载。
  • Google Gemini API 密钥:Google AI Studio 或 Google Cloud Console 获取您的 API 密钥。

安装与使用

有两种主要方式使用此服务器:

通过 Smithery 安装

要通过 Smithery 为 Claude Desktop 自动安装 youtube-vision-mcp:

npx -y @smithery/cli install @minbang930/youtube-vision-mcp --client claude

选项 1:使用 npx (推荐用于快速使用)

运行此服务器最简单的方法是使用 npx,它会下载并运行该软件包,而无需永久安装。

您可以在 MCP 客户端的设置文件(Claude、VSCode 等)中进行配置:

{
  "mcpServers": {
    "youtube-vision": {
      "command": "npx",
      "args": [
        "-y",
        "youtube-vision"
      ],
      "env": {
        "GEMINI_API_KEY": "YOUR_GEMINI_API_KEY",
        "GEMINI_MODEL_NAME": "gemini-2.0-flash"
      }
    }
  }
}

"YOUR_GEMINI_API_KEY" 替换为您实际的 Google Gemini API 密钥。

选项 2:手动安装(从源代码)

如果您想修改代码或直接从源代码运行它:

  1. 克隆存储库:

    git clone https://github.com/minbang930/Youtube-Vision-MCP.git
    cd youtube-vision
    
  2. 安装依赖项:

    npm install
    
  3. 构建项目:

    npm run build
    
  4. 配置并运行: 然后,您可以直接使用 node dist/index.js 运行编译后的代码(确保 GEMINI_API_KEY 设置为环境变量),或者配置您的 MCP 客户端以使用 node 命令和 dist/index.js 的绝对路径运行它,并通过 env 设置传递 API 密钥,如 npx 示例所示。

配置

服务器使用以下环境变量:

  • GEMINI_API_KEY (必需): 您的 Google Gemini API 密钥。
  • GEMINI_MODEL_NAME (可选): 要使用的特定 Gemini 模型(例如,gemini-1.5-flash)。默认为 gemini-2.0-flash重要提示: 对于生产或商业用途,请确保选择未标记为“Experimental”或“Preview”的模型版本。

环境变量应在 MCP 客户端的设置文件(例如,mcp_settings.json)的 env 部分中设置。

可用工具

1. ask_about_youtube_video

回答有关视频的问题,如果未提出问题,则提供一般描述。

  • 输入:
    • youtube_url (字符串,必需): YouTube 视频的 URL。
    • question (字符串,可选): 要询问的关于视频的特定问题。如果省略,则生成一般描述。
  • 输出: 包含答案或描述的文本。

2. summarize_youtube_video

生成给定 YouTube 视频的摘要。

  • 输入:
    • youtube_url (字符串,必需): YouTube 视频的 URL。
    • summary_length (字符串,可选): 期望的摘要长度('short'、'medium'、'long')。默认为 'medium'。
  • 输出: 包含视频摘要的文本。

3. extract_key_moments

从给定的 YouTube 视频中提取关键时刻(时间戳和描述)。

  • 输入:
    • youtube_url (字符串,必需): YouTube 视频的 URL。
    • number_of_moments (整数,可选): 要提取的关键时刻的数量。默认为 3。
  • 输出: 描述带有时间戳的关键时刻的文本。

4. list_supported_models

列出支持 generateContent 方法的可用 Gemini 模型(通过 REST API 获取)。

  • 输入:
  • 输出: 列出支持的模型名称的文本。

重要提示

  • 生产模型选择: 在将此服务器用于生产或商业目的时,请确保选择的 GEMINI_MODEL_NAME 是适合生产使用的稳定版本。根据 Gemini API 服务条款,标记为“Experimental”或“Preview”的模型不允许用于生产部署。
  • API 服务条款: 此服务器的使用依赖于 Google Gemini API。用户有责任审查并遵守 Google APIs 服务条款Gemini API 附加服务条款。请注意,Gemini API 的免费和付费层的数据使用策略可能有所不同。使用免费层时,请勿提交敏感或机密信息。
  • 内容责任: 不保证通过 Gemini API 生成的内容的准确性和适当性。在依赖或发布生成的内容之前,请谨慎使用。

许可证

本项目根据 MIT 许可证获得许可。有关详细信息,请参见 LICENSE 文件。

推荐服务器

Baidu Map

Baidu Map

百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。

官方
精选
JavaScript
Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。

官方
精选
本地
TypeScript
Audiense Insights MCP Server

Audiense Insights MCP Server

通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。

官方
精选
本地
TypeScript
VeyraX

VeyraX

一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。

官方
精选
本地
graphlit-mcp-server

graphlit-mcp-server

模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。

官方
精选
TypeScript
Kagi MCP Server

Kagi MCP Server

一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。

官方
精选
Python
e2b-mcp-server

e2b-mcp-server

使用 MCP 通过 e2b 运行代码。

官方
精选
Neon MCP Server

Neon MCP Server

用于与 Neon 管理 API 和数据库交互的 MCP 服务器

官方
精选
Exa MCP Server

Exa MCP Server

模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。

官方
精选