MCP Video Download URL Parser

MCP Video Download URL Parser

Enables downloading watermark-free videos from platforms like Douyin, TikTok, and Bilibili by automatically extracting video titles and download links using browser simulation to bypass anti-scraping measures.

Category
访问服务器

README

MCP Video Download URL Parser

这是一个基于MCP的视频下载工具,支持从抖音、TikTok等平台下载无水印视频。

功能特点

  • 支持从抖音、TikTok、哔哩哔哩等平台下载无水印视频
  • 使用Playwright模拟浏览器环境,绕过网站的防爬措施
  • 自动提取视频标题和下载链接
  • 支持自定义下载路径
  • 支持作为MCP服务运行

安装依赖

# 安装Python依赖
uv pip install -r requirements.txt

# 安装Playwright浏览器
playwright install

使用方法

作为MCP服务运行

uv run --index-url https://mirrors.aliyun.com/pypi/simple/ main.py

然后可以通过MCP调用download_video函数:

# MCP调用示例
result = await mcp_video_url_parser_download_video(url="https://v.douyin.com/your_video_id/", output_path="D:\\视频")

直接使用测试脚本

# 使用默认测试URL
uv run direct_test.py

# 指定视频URL
uv run direct_test.py "https://v.douyin.com/your_video_id/"

技术实现

本工具使用了两种方式来提取视频URL:

  1. Playwright模拟浏览器(主要方法):

    • 完全模拟真实浏览器环境
    • 自动访问snapany.com网站
    • 输入视频链接并点击提取按钮
    • 监听API响应或直接从页面提取视频元素
    • 绕过网站的防爬措施,如请求头验证、Cookie验证等
  2. API直接请求(备用方法):

    • 直接向snapany.com的API发送请求
    • 添加必要的请求头和参数
    • 处理多种可能的响应格式

防爬措施解决方案

snapany.com网站有严格的防爬措施,包括:

  1. 请求头验证:需要特定的请求头,如g-timestamp和g-footer
  2. Cookie验证:需要有效的会话Cookie
  3. 浏览器指纹:检查浏览器环境、Canvas指纹等
  4. 动态签名生成:可能基于多种因素动态生成签名

我们通过使用Playwright完全模拟浏览器环境,成功绕过了这些防爬措施。Playwright提供了真实的浏览器环境,包括JavaScript执行、Cookie管理和请求拦截等功能,使我们能够像真实用户一样与网站交互。

注意事项

  • 本工具仅用于学习和研究目的
  • 请遵守相关平台的使用条款和版权规定
  • 不要过于频繁地使用,以避免对目标网站造成压力

安装和执行

通过Smithery安装

要通过Smithery为Claude Desktop自动安装MCP Video Download URL Parser:

npx -y @smithery/cli install @tansunyj/mcp_video_download_url_parser --client claude

手动安装

  1. 克隆仓库:git clone https://github.com/tansunyj/mcp_video_download_url_parser.git
  2. 进入目录:cd mcp_video_download_url_parser
  3. 安装依赖:pip install -r requirements.txt
  4. 启动MCP服务器:python main.py

配置Claude Desktop或Cursor

  1. 添加以下配置:
{
    "mcpServers": {
        "video-url-parser": {
            "command": "python",
            "args": [
                "/path/to/mcp_video_download_url_parser/main.py"
            ],
            "env": {}
        }
    }
}

在魔塔社区(Cursor)部署配置

要在魔塔社区上部署此MCP服务,请按照以下步骤操作:

  1. 上传项目:将项目上传到魔塔社区平台

  2. 配置服务:在魔塔社区控制台中,找到"MCP服务配置"部分,添加以下配置信息:

{
  "name": "video-url-parser",
  "description": "视频下载解析工具",
  "version": "1.0.0",
  "main": "main.py",
  "requirements": ["playwright", "asyncio", "aiohttp", "beautifulsoup4"],
  "environmentVariables": {
    "DOWNLOAD_PATH": "./downloads"
  }
}
  1. 开启服务:在魔塔社区控制台中,找到已添加的服务,点击"开启服务"按钮

  2. 服务调用:在魔塔社区中,可以通过以下方式调用该服务:

# 调用示例
result = await mcp_video_url_parser_download_video(
    url="https://v.douyin.com/your_video_id/", 
    output_path="指定保存路径"
)
  1. 常见问题排查
    • 确保所有依赖项都已正确安装
    • 检查环境变量是否正确配置
    • 若出现网络问题,请确认服务器能够访问视频平台网站
    • 若服务无法启动,检查日志获取详细错误信息

使用示例

配置完成后,可以使用如下提示:

  • "下载这个视频:[video_url]"
  • "将这个视频保存到D:/videos目录:[video_url]"

环境变量

  • DOWNLOAD_PATH:保存下载视频的路径(默认:./downloads)

开发

要参与开发:

git clone https://github.com/tansunyj/mcp_video_download_url_parser.git
cd mcp_video_download_url_parser
python -m pytest tests/

安全性

此MCP服务器在您的本地机器上运行。虽然它不执行任意代码,但在解析来自不受信任来源的URL时请小心。

致谢

本项目使用SnapAny.com的API进行视频解析和下载。

许可证

MIT许可证


GitHub repo

推荐服务器

Baidu Map

Baidu Map

百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。

官方
精选
JavaScript
Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。

官方
精选
本地
TypeScript
Audiense Insights MCP Server

Audiense Insights MCP Server

通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。

官方
精选
本地
TypeScript
VeyraX

VeyraX

一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。

官方
精选
本地
graphlit-mcp-server

graphlit-mcp-server

模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。

官方
精选
TypeScript
Kagi MCP Server

Kagi MCP Server

一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。

官方
精选
Python
e2b-mcp-server

e2b-mcp-server

使用 MCP 通过 e2b 运行代码。

官方
精选
Neon MCP Server

Neon MCP Server

用于与 Neon 管理 API 和数据库交互的 MCP 服务器

官方
精选
Exa MCP Server

Exa MCP Server

模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。

官方
精选