ElevenLabs MCP Server
与 ElevenLabs 文本转语音 API 集成。
Tools
generate_audio_simple
Generate audio from plain text using default voice settings
generate_audio_script
Generate audio from a structured script with multiple voices and actors. Accepts either: 1. Plain text string 2. JSON string with format: { "script": [ { "text": "Text to speak", "voice_id": "optional-voice-id", "actor": "optional-actor-name" }, ... ] }
delete_job
Delete a voiceover job and its associated files
get_audio_file
Get the audio file content for a specific job
list_voices
Get a list of all available ElevenLabs voices with metadata
get_voiceover_history
Get voiceover job history. Optionally specify a job ID for a specific job.
README
ElevenLabs MCP 服务器
一个与 ElevenLabs 文本转语音 API 集成的模型上下文协议 (MCP) 服务器,包含一个服务器组件和一个基于 Web 的示例 MCP 客户端 (SvelteKit),用于管理语音生成任务。
<a href="https://glama.ai/mcp/servers/leukzvus7o"><img width="380" height="200" src="https://glama.ai/mcp/servers/leukzvus7o/badge" alt="ElevenLabs Server MCP server" /></a>
功能
- 使用 ElevenLabs API 从文本生成音频
- 支持多种声音和脚本部分
- SQLite 数据库用于持久化历史记录存储
- 示例 SvelteKit MCP 客户端,用于:
- 简单的文本转语音转换
- 多部分脚本管理
- 语音历史记录跟踪和播放
- 音频文件下载
安装
通过 Smithery 安装
要通过 Smithery 为 Claude Desktop 自动安装 ElevenLabs MCP 服务器:
npx -y @smithery/cli install elevenlabs-mcp-server --client claude
使用 uvx (推荐)
当使用 uvx
时,无需进行特定安装。
将以下配置添加到您的 MCP 设置文件(例如,Claude Desktop 的 cline_mcp_settings.json
):
{
"mcpServers": {
"elevenlabs": {
"command": "uvx",
"args": ["elevenlabs-mcp-server"],
"env": {
"ELEVENLABS_API_KEY": "your-api-key",
"ELEVENLABS_VOICE_ID": "your-voice-id",
"ELEVENLABS_MODEL_ID": "eleven_flash_v2",
"ELEVENLABS_STABILITY": "0.5",
"ELEVENLABS_SIMILARITY_BOOST": "0.75",
"ELEVENLABS_STYLE": "0.1",
"ELEVENLABS_OUTPUT_DIR": "output"
}
}
}
}
开发安装
- 克隆此存储库
- 安装依赖项:
uv venv
- 将
.env.example
复制到.env
并填写您的 ElevenLabs 凭据
{
"mcpServers": {
"elevenlabs": {
"command": "uv",
"args": [
"--directory",
"path/to/elevenlabs-mcp-server",
"run",
"elevenlabs-mcp-server"
],
"env": {
"ELEVENLABS_API_KEY": "your-api-key",
"ELEVENLABS_VOICE_ID": "your-voice-id",
"ELEVENLABS_MODEL_ID": "eleven_flash_v2",
"ELEVENLABS_STABILITY": "0.5",
"ELEVENLABS_SIMILARITY_BOOST": "0.75",
"ELEVENLABS_STYLE": "0.1",
"ELEVENLABS_OUTPUT_DIR": "output"
}
}
}
}
使用示例 SvelteKit MCP 客户端
- 导航到 web UI 目录:
cd clients/web-ui
- 安装依赖项:
pnpm install
- 将
.env.example
复制到.env
并根据需要进行配置 - 运行 web UI:
pnpm dev
- 在浏览器中打开 http://localhost:5174
可用工具
generate_audio_simple
: 使用默认语音设置从纯文本生成音频generate_audio_script
: 从具有多个声音和演员的结构化脚本生成音频delete_job
: 按 ID 删除作业get_audio_file
: 按 ID 获取音频文件list_voices
: 列出所有可用的声音get_voiceover_history
: 获取配音作业历史记录。可以选择指定作业 ID 以获取特定作业。
可用资源
voiceover://history/{job_id}
: 按 ID 获取音频文件voiceover://voices
: 列出所有可用的声音
许可证
该项目根据 MIT 许可证获得许可 - 有关详细信息,请参阅 LICENSE 文件。
推荐服务器
mcp-server-youtube-transcript
一个模型上下文协议服务器,可以从 YouTube 视频中检索文本记录。该服务器通过一个简单的界面直接访问视频的字幕和副标题。
Zonos TTS MCP Server
使用 Claude 促进多种语言和情感的直接语音生成,并通过模型上下文协议与 Zonos TTS 设置集成。

MS-Lucidia-Voice-Gateway-MCP
一个服务器,使用 Windows 原生语音服务提供文本转语音和语音转文本功能,无需外部依赖。
Say MCP Server
在 macOS 上使用 `say` 命令启用文本转语音功能,从而可以广泛控制语音参数,例如声音、语速、音量和音调,以获得可定制的听觉体验。
mcp-hfspace
直接从 Claude 使用 Hugging Face Spaces。使用开源图像生成、聊天、视觉任务等。支持图像、音频和文本上传/下载。

Speech MCP
一个 Goose MCP 扩展程序,提供与现代音频可视化的语音交互功能,允许用户通过语音而非文本与 Goose 进行交流。
ClickSend MCP Server
这个服务器使 AI 模型能够通过 ClickSend 的 API 以编程方式发送短信和发起文本转语音呼叫,并内置了速率限制和输入验证。

Spotify MCP
一个 FastMCP 工具,它允许用户通过 Cursor Composer 中的自然语言命令来控制 Spotify,从而管理播放、搜索内容以及与播放列表互动。
systemprompt-mcp-interview
一个专门的模型上下文协议(MCP)服务器,它支持人工智能驱动的面试角色扮演场景,以便通过逼真的对话反馈进行练习。
TranscriptionTools MCP Server
为 Claude 提供智能转录处理功能,具有自然格式、上下文修复和由深度思考 LLM 提供支持的智能摘要。