mcp-youtube-transcript
一个模型上下文协议服务器,可以从 YouTube 视频中检索文本记录。该服务器通过一个简单的界面直接访问视频的文本记录和字幕,使其成为内容分析和处理的理想选择。
Tools
get_transcripts
Extract and process transcripts from a YouTube video
README
MCP YouTube 文本转录服务器
一个模型上下文协议 (Model Context Protocol) 服务器,用于从 YouTube 视频中检索文本转录。该服务器通过一个简单的接口提供对视频文本转录的直接访问,使其成为内容分析和处理的理想选择。
<a href="https://glama.ai/mcp/servers/@sinco-lab/mcp-youtube-transcript"> <img width="380" height="200" src="https://glama.ai/mcp/servers/@sinco-lab/mcp-youtube-transcript/badge" alt="mcp-youtube-transcript" /> </a>
目录
特性
✨ 主要功能:
- 从 YouTube 视频中提取文本转录
- 支持多种语言
- 使用连续或段落模式格式化文本
- 检索视频标题和元数据
- 自动段落分割
- 文本规范化和 HTML 实体解码
- 强大的错误处理
- 时间戳和重叠检测
开始使用
前提条件
- Node.js 18 或更高版本
安装
我们提供两种安装方法:
选项 1:手动配置(推荐用于生产环境)
-
创建或编辑 Claude Desktop 配置文件:
- macOS:
~/Library/Application Support/Claude/claude_desktop_config.json - Windows:
%APPDATA%\Claude\claude_desktop_config.json
- macOS:
-
添加以下配置:
{
"mcpServers": {
"youtube-transcript": {
"command": "npx",
"args": [
"-y",
"@sinco-lab/mcp-youtube-transcript"
]
}
}
}
macOS 快速设置脚本:
# 如果目录不存在则创建目录
mkdir -p ~/Library/Application\ Support/Claude
# 创建或更新配置文件
cat > ~/Library/Application\ Support/Claude/claude_desktop_config.json << 'EOL'
{
"mcpServers": {
"youtube-transcript": {
"command": "npx",
"args": [
"-y",
"@sinco-lab/mcp-youtube-transcript"
]
}
}
}
EOL
选项 2:通过 Smithery(仅用于开发)
npx -y @smithery/cli install @sinco-lab/mcp-youtube-transcript --client claude
⚠️ 注意:不建议在生产环境中使用此方法,因为它依赖于 Smithery 的代理服务。
使用方法
基本配置
要与 Claude Desktop / Cursor / cline 一起使用,请确保您的配置匹配:
{
"mcpServers": {
"youtube-transcript": {
"command": "npx",
"args": ["-y", "@sinco-lab/mcp-youtube-transcript"]
}
}
}
测试
使用 Claude App
- 安装后重启 Claude app
- 使用一个简单的命令进行测试:
https://www.youtube.com/watch?v=AJpK3YTTKZ4 总结这个视频
示例输出:

使用 MCP Inspector
# 克隆并设置
git clone https://github.com/sinco-lab/mcp-youtube-transcript.git
cd mcp-youtube-transcript
npm install
npm run build
# 启动 inspector
npx @modelcontextprotocol/inspector node "dist/index.js"
# 访问 http://localhost:5173 并尝试以下命令:
# 1. 列出工具: clink `List Tools`
# 2. 使用以下参数测试 get_transcripts:
# url: "https://www.youtube.com/watch?v=AJpK3YTTKZ4"
# lang: "en" (可选)
# enableParagraphs: false (可选)
问题排查和维护
检查 Claude 日志
要监控 Claude 的日志,您可以使用以下命令:
tail -n 20 -f ~/Library/Logs/Claude/mcp*.log
这将显示日志文件的最后 20 行,并继续显示添加的新条目。
注意:Claude app 会自动为 MCP 服务器日志文件添加
mcp-server-前缀。例如,我们的服务器日志将被写入mcp-server-youtube-transcript.log。
清理 npx 缓存
如果您遇到与 npx 缓存相关的问题,您可以手动清理它,使用:
rm -rf ~/.npm/_npx
这将删除缓存的包,并允许您重新开始。
API 参考
get_transcripts
从 YouTube 视频中获取文本转录。
参数:
url(字符串, 必需): YouTube 视频 URL 或 IDlang(字符串, 可选): 语言代码 (默认: "en")enableParagraphs(布尔值, 可选): 启用段落模式 (默认: false)
响应格式:
{
"content": [{
"type": "text",
"text": "视频标题和文本转录内容",
"metadata": {
"videoId": "video_id",
"title": "video_title",
"language": "transcript_language",
"timestamp": "processing_time",
"charCount": "character_count",
"transcriptCount": "number_of_transcripts",
"totalDuration": "total_duration",
"paragraphsEnabled": "paragraph_mode_status"
}
}]
}
开发
项目结构
├── src/
│ ├── index.ts # 服务器入口点
│ ├── youtube.ts # YouTube 文本转录获取逻辑
├── dist/ # 编译后的输出
└── package.json
关键组件
YouTubeTranscriptFetcher: 核心文本转录获取功能YouTubeUtils: 文本处理和实用程序
特性和功能
-
错误处理:
- 无效的 URL/ID
- 不可用的文本转录
- 语言可用性
- 网络错误
- 速率限制
-
文本处理:
- HTML 实体解码
- 标点符号规范化
- 空格规范化
- 智能段落检测
贡献
我们欢迎贡献!请随时提交 issue 和 pull request。
许可证
该项目根据 MIT 许可证获得许可 - 有关详细信息,请参阅 LICENSE 文件。
相关项目
推荐服务器
Baidu Map
百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。
Playwright MCP Server
一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。
Magic Component Platform (MCP)
一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。
Audiense Insights MCP Server
通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。
VeyraX
一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。
graphlit-mcp-server
模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。
Kagi MCP Server
一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。
e2b-mcp-server
使用 MCP 通过 e2b 运行代码。
Neon MCP Server
用于与 Neon 管理 API 和数据库交互的 MCP 服务器
Exa MCP Server
模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。