mcp-ytTranscript

mcp-ytTranscript

好的,以下是一个简单的 MCP(最小可行产品)服务器,它使用 URL 和所需语言返回 YouTube 视频的转录: ```python from flask import Flask, request, jsonify from youtube_transcript_api import YouTubeTranscriptApi app = Flask(__name__) @app.route('/transcribe', methods=['GET']) def transcribe_youtube_video(): """ 从 YouTube 视频获取转录。 请求参数: url (str): YouTube 视频的 URL。 language (str, optional): 所需的转录语言代码(例如,'en' 代表英语,'zh-CN' 代表简体中文)。默认为 'en'。 返回: JSON: 包含转录文本的 JSON 对象。如果出现错误,则返回错误消息。 """ try: url = request.args.get('url') language = request.args.get('language', 'en') # 默认为英语 if not url: return jsonify({'error': '必须提供 YouTube 视频 URL。'}), 400 # 从 URL 中提取视频 ID video_id = url.split("watch?v=")[1] if "&" in video_id: video_id = video_id.split("&")[0] # 获取转录 transcript = YouTubeTranscriptApi.get_transcript(video_id, languages=[language]) # 将转录转换为文本 text = '\n'.join([entry['text'] for entry in transcript]) return jsonify({'transcript': text}) except Exception as e: return jsonify({'error': str(e)}), 500 if __name__ == '__main__': app.run(debug=True) ``` **代码解释:** 1. **导入必要的库:** * `flask`: 用于创建 Web 服务器。 * `youtube_transcript_api`: 用于从 YouTube 获取转录。 2. **创建 Flask 应用:** * `app = Flask(__name__)` 创建一个 Flask 应用实例。 3. **定义路由 `/transcribe`:** * `@app.route('/transcribe', methods=['GET'])` 定义一个 GET 请求的路由,当用户访问 `/transcribe` 时,会执行 `transcribe_youtube_video` 函数。 4. **`transcribe_youtube_video` 函数:** * **获取请求参数:** * `url = request.args.get('url')` 从请求参数中获取 YouTube 视频的 URL。 * `language = request.args.get('language', 'en')` 从请求参数中获取所需的语言代码,如果没有提供,则默认为英语 ('en')。 * **验证 URL:** * `if not url:` 检查是否提供了 URL,如果没有,则返回一个错误消息。 * **提取视频 ID:** * 从 URL 中提取 YouTube 视频的 ID。 这段代码假设 URL 格式为 `https://www.youtube.com/watch?v=VIDEO_ID`。 * **获取转录:** * `transcript = YouTubeTranscriptApi.get_transcript(video_id, languages=[language])` 使用 `youtube_transcript_api` 获取指定语言的转录。 * **将转录转换为文本:** * `text = '\n'.join([entry['text'] for entry in transcript])` 将转录条目连接成一个字符串,每个条目之间用换行符分隔。 * **返回 JSON 响应:** * `return jsonify({'transcript': text})` 将转录文本作为 JSON 对象返回。 * **错误处理:** * `try...except` 块用于捕获可能发生的异常,例如无法找到转录或网络错误。如果发生错误,则返回一个包含错误消息的 JSON 对象。 5. **运行应用:** * `if __name__ == '__main__':` 确保只有在直接运行脚本时才执行以下代码。 * `app.run(debug=True)` 启动 Flask 开发服务器,`debug=True` 启用调试模式,方便开发。 **如何使用:** 1. **安装依赖:** ```bash pip install flask youtube-transcript-api ``` 2. **运行脚本:** ```bash python your_script_name.py ``` 3. **发送请求:** 使用浏览器或 `curl` 等工具发送 GET 请求到 `/transcribe` 路由,并提供 `url` 和 `language` 参数。 例如: ```bash curl "http://127.0.0.1:5000/transcribe?url=https://www.youtube.com/watch?v=dQw4w9WgXcQ&language=zh-CN" ``` 将 `https://www.youtube.com/watch?v=dQw4w9WgXcQ` 替换为实际的 YouTube 视频 URL,并将 `zh-CN` 替换为所需的语言代码。 **重要注意事项:** * **错误处理:** 这个 MCP 包含基本的错误处理,但你应该根据你的需求添加更详细的错误处理。 * **API 限制:** YouTube Transcript API 可能有速率限制。 如果你的应用需要处理大量的请求,你可能需要考虑使用 API 密钥或实现缓存机制。 * **转录可用性:** 并非所有 YouTube 视频都有自动生成的转录,并且并非所有转录都提供所有语言版本。 你的代码应该能够处理这些情况。 * **安全性:** 在生产环境中,你应该使用更安全的 Web 服务器,例如 Gunicorn 或 uWSGI,并配置 HTTPS。 * **URL 解析:** URL 解析代码比较简单,可能无法处理所有可能的 YouTube URL 格式。 你可以使用更健壮的 URL 解析库,例如 `urllib.parse`。 **中文翻译:** 好的,这是一个简单的最小可行产品 (MVP) 服务器,它使用 URL 和所需的语言返回 YouTube 视频的字幕: ```python from flask import Flask, request, jsonify from youtube_transcript_api import YouTubeTranscriptApi app = Flask(__name__) @app.route('/transcribe', methods=['GET']) def transcribe_youtube_video(): """ 从 YouTube 视频获取字幕。 请求参数: url (str): YouTube 视频的 URL。 language (str, optional): 所需的字幕语言代码(例如,'en' 代表英语,'zh-CN' 代表简体中文)。默认为 'en'。 返回: JSON: 包含字幕文本的 JSON 对象。如果出现错误,则返回错误消息。 """ try: url = request.args.get('url') language = request.args.get('language', 'en') # 默认为英语 if not url: return jsonify({'error': '必须提供 YouTube 视频 URL。'}), 400 # 从 URL 中提取视频 ID video_id = url.split("watch?v=")[1] if "&" in video_id: video_id = video_id.split("&")[0] # 获取字幕 transcript = YouTubeTranscriptApi.get_transcript(video_id, languages=[language]) # 将字幕转换为文本 text = '\n'.join([entry['text'] for entry in transcript]) return jsonify({'transcript': text}) except Exception as e: return jsonify({'error': str(e)}), 500 if __name__ == '__main__': app.run(debug=True) ``` **代码解释:** 1. **导入必要的库:** * `flask`: 用于创建 Web 服务器。 * `youtube_transcript_api`: 用于从 YouTube 获取字幕。 2. **创建 Flask 应用:** * `app = Flask(__name__)` 创建一个 Flask 应用实例。 3. **定义路由 `/transcribe`:** * `@app.route('/transcribe', methods=['GET'])` 定义一个 GET 请求的路由,当用户访问 `/transcribe` 时,会执行 `transcribe_youtube_video` 函数。 4. **`transcribe_youtube_video` 函数:** * **获取请求参数:** * `url = request.args.get('url')` 从请求参数中获取 YouTube 视频的 URL。 * `language = request.args.get('language', 'en')` 从请求参数中获取所需的语言代码,如果没有提供,则默认为英语 ('en')。 * **验证 URL:** * `if not url:` 检查是否提供了 URL,如果没有,则返回一个错误消息。 * **提取视频 ID:** * 从 URL 中提取 YouTube 视频的 ID。 这段代码假设 URL 格式为 `https://www.youtube.com/watch?v=VIDEO_ID`。 * **获取字幕:** * `transcript = YouTubeTranscriptApi.get_transcript(video_id, languages=[language])` 使用 `youtube_transcript_api` 获取指定语言的字幕。 * **将字幕转换为文本:** * `text = '\n'.join([entry['text'] for entry in transcript])` 将字幕条目连接成一个字符串,每个条目之间用换行符分隔。 * **返回 JSON 响应:** * `return jsonify({'transcript': text})` 将字幕文本作为 JSON 对象返回。 * **错误处理:** * `try...except` 块用于捕获可能发生的异常,例如无法找到字幕或网络错误。如果发生错误,则返回一个包含错误消息的 JSON 对象。 5. **运行应用:** * `if __name__ == '__main__':` 确保只有在直接运行脚本时才执行以下代码。 * `app.run(debug=True)` 启动 Flask 开发服务器,`debug=True` 启用调试模式,方便开发。 **如何使用:** 1. **安装依赖:** ```bash pip install flask youtube-transcript-api ``` 2. **运行脚本:** ```bash python your_script_name.py ``` 3. **发送请求:** 使用浏览器或 `curl` 等工具发送 GET 请求到 `/transcribe` 路由,并提供 `url` 和 `language` 参数。 例如: ```bash curl "http://127.0.0.1:5000/transcribe?url=https://www.youtube.com/watch?v=dQw4w9WgXcQ&language=zh-CN" ``` 将 `https://www.youtube.com/watch?v=dQw4w9WgXcQ` 替换为实际的 YouTube 视频 URL,并将 `zh-CN` 替换为所需的语言代码。 **重要注意事项:** * **错误处理:** 这个 MVP 包含基本的错误处理,但你应该根据你的需求添加更详细的错误处理。 * **API 限制:** YouTube Transcript API 可能有速率限制。 如果你的应用需要处理大量的请求,你可能需要考虑使用 API 密钥或实现缓存机制。 * **字幕可用性:** 并非所有 YouTube 视频都有自动生成的字幕,并且并非所有字幕都提供所有语言版本。 你的代码应该能够处理这些情况。 * **安全性:** 在生产环境中,你应该使用更安全的 Web 服务器,例如 Gunicorn 或 uWSGI,并配置 HTTPS。 * **URL 解析:** URL 解析代码比较简单,可能无法处理所有可能的 YouTube URL 格式。 你可以使用更健壮的 URL 解析库,例如 `urllib.parse`。 This code provides a basic, functional server. Remember to handle potential errors and limitations as mentioned above for a more robust application. Good luck!

Category
访问服务器

README

YouTube 字幕 MCP 服务器

一个简单的 MCP 服务器,提供 YouTube 视频字幕提取功能。

安装

使用 uv 安装:

uv pip install .

用法

服务器使用 stdio 传输运行。

推荐服务器

Baidu Map

Baidu Map

百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。

官方
精选
JavaScript
Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。

官方
精选
本地
TypeScript
Audiense Insights MCP Server

Audiense Insights MCP Server

通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。

官方
精选
本地
TypeScript
VeyraX

VeyraX

一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。

官方
精选
本地
graphlit-mcp-server

graphlit-mcp-server

模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。

官方
精选
TypeScript
Kagi MCP Server

Kagi MCP Server

一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。

官方
精选
Python
e2b-mcp-server

e2b-mcp-server

使用 MCP 通过 e2b 运行代码。

官方
精选
Neon MCP Server

Neon MCP Server

用于与 Neon 管理 API 和数据库交互的 MCP 服务器

官方
精选
Exa MCP Server

Exa MCP Server

模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。

官方
精选