GPT-SoVITS MCP Server

GPT-SoVITS MCP Server

Enables text-to-speech synthesis and voice cloning through GPT-SoVITS API integration. Supports multiple languages (Chinese, English, Japanese, Korean, Cantonese), dynamic model switching, and reference audio-based voice quality replication.

Category
访问服务器

README

GPT-SoVITS MCP Server

このプロジェクトは、GPT-SoVITSのAPIサーバーをModel Context Protocol (MCP) ツールとして利用できるようにするMCPサーバーです。FastAPI-MCPを使用してSwagger仕様から自動的にMCPツール定義を生成します。

機能

  • Text-to-Speech合成: テキストから音声を生成
  • 音声クローニング: 参照音声を使用した声質の複製
  • マルチ言語対応: 中国語、英語、日本語、韓国語、粤語をサポート
  • モデル管理: GPT/SoVITSモデルの動的切り替え
  • ストリーミング対応: リアルタイム音声配信
  • MCP統合: AI エージェントとの統合

必要な環境

  • Python 3.11以上(Windows/macOS/Linux対応)
  • GPT-SoVITS API サーバー(ポート9880で実行中)

インストール

Windows

  1. Python のインストール:

    • Python公式サイトからPython 3.11以上をダウンロード
    • インストール時に「Add Python to PATH」をチェック
  2. 依存関係をインストール:

    python -m pip install -r requirements.txt
    
  3. GPT-SoVITS API サーバーを起動:

    cd GPT-SoVITS
    python api.py
    

macOS/Linux

  1. 依存関係をインストール:

    python3.11 -m pip install -r requirements.txt
    # または
    pip install -r requirements.txt
    
  2. GPT-SoVITS API サーバーを起動:

    cd GPT-SoVITS
    python3.11 api.py
    # または
    python api.py
    

使用方法

簡単起動(推奨)

Windows

start_server.bat

macOS/Linux

./start_server.sh

手動起動

Windows

python fastapi_mcp_server.py

macOS/Linux

python3.11 fastapi_mcp_server.py

オプション

  • --host: バインドするホスト (デフォルト: 0.0.0.0)
  • --port: バインドするポート (デフォルト: 8000)
  • --gpt-sovits-url: GPT-SoVITS APIのURL (デフォルト: http://localhost:9880)
  • --reload: 自動リロードを有効化

環境変数

  • SOVITS_VOICES_PATH: 音声ファイルのベースパス
  • HOST: サーバーのホスト
  • PORT: サーバーのポート

エンドポイント

サーバー起動後、以下のエンドポイントが利用可能になります:

  • API ドキュメント: http://localhost:8000/docs
  • MCP エンドポイント: http://localhost:8000/mcp
  • ヘルスチェック: http://localhost:8000/health

利用可能なMCPツール

  1. text_to_speech (/tts)

    • テキストから音声を合成
    • 参照音声による音声クローニング対応
    • 複数の音声フォーマット対応 (wav, ogg, aac)
  2. set_model (/set_model)

    • GPT/SoVITSモデルの重みを設定
    • 動的なモデル切り替え
  3. set_reference (/set_reference)

    • デフォルトの参照音声とプロンプトテキストを設定
    • 音声クローニングの基準となる声質を設定
  4. control_server (/control)

    • サーバーの制御(再起動/シャットダウン)

API 使用例

テキストから音声合成

curl -X POST "http://localhost:8000/tts" \
     -H "Content-Type: application/json" \
     -d '{
       "text": "こんにちは、世界",
       "text_lang": "ja",
       "refer_wav_path": "path/to/reference.wav",
       "prompt_text": "参照音声のテキスト"
     }'

モデルの設定

curl -X POST "http://localhost:8000/set_model" \
     -H "Content-Type: application/json" \
     -d '{
       "gpt_model_path": "path/to/gpt.ckpt",
       "sovits_model_path": "path/to/sovits.pth"
     }'

MCP統合

このサーバーは Model Context Protocol (MCP) に対応しており、Claude等のAIエージェントから直接音声合成機能を利用できます。

Claude Desktopでの設定

設定ファイルの場所

  • Windows: %APPDATA%\Claude\claude_desktop_config.json
  • macOS: ~/Library/Application Support/Claude/claude_desktop_config.json

Windows用設定

{
  "mcpServers": {
    "gpt-sovits": {
      "command": "python",
      "args": ["C:\\path\\to\\sovits_mcp\\fastapi_mcp_server.py"],
      "env": {
        "HOST": "127.0.0.1",
        "PORT": "8000",
        "SOVITS_VOICES_PATH": "C:\\voices\\characters"
      }
    }
  }
}

macOS/Linux用設定

{
  "mcpServers": {
    "gpt-sovits": {
      "command": "python3.11",
      "args": ["/path/to/sovits_mcp/fastapi_mcp_server.py"],
      "env": {
        "HOST": "127.0.0.1",
        "PORT": "8000",
        "SOVITS_VOICES_PATH": "/voices/characters"
      }
    }
  }
}

SSE (Server-Sent Events) を使用する場合

FastAPI-MCPは自動的に /mcp エンドポイントでSSE接続を提供します。SSEプロキシを使用する場合:

{
  "mcpServers": {
    "gpt-sovits-sse": {
      "command": "npx",
      "args": ["-y", "@modelcontextprotocol/server-fetch", "http://127.0.0.1:8000/mcp"],
      "env": {}
    }
  }
}

設定ファイルの場所

プロジェクトには複数の設定例が含まれています:

Windows用

  • claude_desktop_config_windows.json - Claude Desktop用の設定
  • mcp_windows.json - 基本的なMCP設定
  • mcp_sse_windows.json - SSE プロキシを使用した設定
  • start_server.bat - Windows用起動スクリプト

macOS/Linux用

  • claude_desktop_config.json - Claude Desktop用の設定
  • mcp.json - 基本的なMCP設定
  • mcp_sse.json - SSE プロキシを使用した設定
  • start_server.sh - macOS/Linux用起動スクリプト

トラブルシューティング

Windows固有の問題

Python が見つからない

python --version
  • エラーが出る場合は、Python がPATHに追加されていない
  • Python インストール時に「Add Python to PATH」をチェックする
  • または py コマンドを使用する

音声ファイルパスのエラー

  • Windowsではバックスラッシュ(\)を使用
  • または環境変数 SOVITS_VOICES_PATH を設定
set SOVITS_VOICES_PATH=C:\voices\characters

共通の問題

GPT-SoVITS APIサーバーに接続できない

  • GPT-SoVITS APIサーバーが起動していることを確認
  • ポート9880が使用可能であることを確認
  • ファイアウォールの設定を確認

依存関係のエラー

  • Python 3.11以上を使用していることを確認
  • pip install -r requirements.txt で依存関係をインストール

音声ファイルが見つからない

  • SOVITS_VOICES_PATH 環境変数を正しく設定
  • 音声ファイルが指定されたパスに存在することを確認
  • デフォルトでは voices/characters/ フォルダを使用

ライセンス

このプロジェクトはMITライセンスの下で公開されています。

推荐服务器

Baidu Map

Baidu Map

百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。

官方
精选
JavaScript
Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。

官方
精选
本地
TypeScript
Audiense Insights MCP Server

Audiense Insights MCP Server

通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。

官方
精选
本地
TypeScript
VeyraX

VeyraX

一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。

官方
精选
本地
graphlit-mcp-server

graphlit-mcp-server

模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。

官方
精选
TypeScript
Kagi MCP Server

Kagi MCP Server

一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。

官方
精选
Python
e2b-mcp-server

e2b-mcp-server

使用 MCP 通过 e2b 运行代码。

官方
精选
Neon MCP Server

Neon MCP Server

用于与 Neon 管理 API 和数据库交互的 MCP 服务器

官方
精选
Exa MCP Server

Exa MCP Server

模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。

官方
精选