ElevenLabs Scribe MCP Server

ElevenLabs Scribe MCP Server

ElevenLabs Scribe ASR API 的模型控制协议 (MCP) 服务器

aromanstatue

研究与数据
访问服务器

README

ElevenLabs Scribe MCP 服务器

一个用于 ElevenLabs 的 Scribe 语音转文本 API 的模型控制协议 (MCP) 服务器实现,提供具有高级上下文管理和双向流式传输的实时转录功能。

特性

  • 实时转录: 直接从您的麦克风流式传输音频并获得即时转录
  • 基于文件的转录: 上传音频文件进行批量处理
  • MCP 协议支持: 模型控制协议的完整实现,以实现更好的上下文管理
  • WebSocket 支持: 实时双向通信
  • 上下文管理: 维护对话上下文以提高转录准确性
  • 多种音频格式: 支持各种音频格式,并自动转换
  • 语言检测: 自动语言检测和置信度评分
  • 事件检测: 识别语音和非语音音频事件

安装

  1. 克隆存储库:
git clone https://github.com/aromanstatue/MCP-Elevenlab-Scribe-ASR.git
cd MCP-Elevenlab-Scribe-ASR
  1. 创建并激活虚拟环境:
python -m venv venv
source venv/bin/activate  # 在 Windows 上: venv\Scripts\activate
  1. 安装依赖项:
pip install -e .
  1. 创建一个包含您的 ElevenLabs API 密钥的 .env 文件:
ELEVENLABS_API_KEY=your-api-key-here

用法

启动服务器

python -m elevenlabs_scribe_mcp_server.main

服务器将默认在端口 8000 上启动(或下一个可用端口)。

使用示例客户端

  1. 文件转录:
python examples/client_example.py --file path/to/audio.wav
  1. 麦克风转录:
python examples/client_example.py --mic

API 端点

  1. REST API:
  • POST /transcribe: 上传音频文件进行转录
  • GET /health: 健康检查端点
  1. WebSocket API:
  • ws://localhost:8000/ws/transcribe: 实时音频转录

MCP 协议

服务器实现了模型控制协议 (MCP),具有以下消息类型:

  1. INIT: 初始化一个新的转录会话
  2. START: 开始音频流式传输
  3. AUDIO: 发送音频数据
  4. TRANSCRIPTION: 接收转录结果
  5. ERROR: 错误消息
  6. STOP: 结束音频流式传输
  7. DONE: 完成会话

开发

运行测试

pytest tests/

项目结构

elevenlabs-scribe-mcp-server/
├── elevenlabs_scribe_mcp_server/
│   ├── __init__.py
│   ├── main.py              # FastAPI 服务器
│   └── mcp/
│       ├── __init__.py
│       ├── protocol.py      # MCP 协议处理程序
│       ├── types.py         # 协议类型
│       └── elevenlabs.py    # ElevenLabs 实现
├── examples/
│   └── client_example.py    # 示例客户端
├── tests/
│   └── test_transcribe.py   # 测试套件
├── pyproject.toml           # 项目元数据
└── README.md

要求

  • Python 3.8+
  • FastAPI
  • Uvicorn
  • PyAudio (用于麦克风支持)
  • aiohttp
  • python-dotenv
  • pydantic

贡献

  1. Fork 存储库
  2. 创建您的功能分支 (git checkout -b feature/amazing-feature)
  3. 提交您的更改 (git commit -m 'Add amazing feature')
  4. 推送到分支 (git push origin feature/amazing-feature)
  5. 打开一个 Pull Request

许可证

MIT 许可证 - 有关详细信息,请参阅 LICENSE 文件。

致谢

  • ElevenLabs 感谢他们出色的 Scribe API
  • FastAPI 感谢现代 Web 框架
  • Python 社区感谢出色的工具和库

推荐服务器

Crypto Price & Market Analysis MCP Server

Crypto Price & Market Analysis MCP Server

一个模型上下文协议 (MCP) 服务器,它使用 CoinCap API 提供全面的加密货币分析。该服务器通过一个易于使用的界面提供实时价格数据、市场分析和历史趋势。 (Alternative, slightly more formal and technical translation): 一个模型上下文协议 (MCP) 服务器,利用 CoinCap API 提供全面的加密货币分析服务。该服务器通过用户友好的界面,提供实时价格数据、市场分析以及历史趋势数据。

精选
TypeScript
MCP PubMed Search

MCP PubMed Search

用于搜索 PubMed 的服务器(PubMed 是一个免费的在线数据库,用户可以在其中搜索生物医学和生命科学文献)。 我是在 MCP 发布当天创建的,但当时正在度假。 我看到有人在您的数据库中发布了类似的服务器,但还是决定发布我的服务器。

精选
Python
mixpanel

mixpanel

连接到您的 Mixpanel 数据。 从 Mixpanel 分析查询事件、留存和漏斗数据。

精选
TypeScript
Sequential Thinking MCP Server

Sequential Thinking MCP Server

这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

精选
Python
Nefino MCP Server

Nefino MCP Server

为大型语言模型提供访问德国可再生能源项目新闻和信息的能力,允许按地点、主题(太阳能、风能、氢能)和日期范围进行筛选。

官方
Python
Vectorize

Vectorize

将 MCP 服务器向量化以实现高级检索、私有深度研究、Anything-to-Markdown 文件提取和文本分块。

官方
JavaScript
Mathematica Documentation MCP server

Mathematica Documentation MCP server

一个服务器,通过 FastMCP 提供对 Mathematica 文档的访问,使用户能够从 Wolfram Mathematica 检索函数文档和列出软件包符号。

本地
Python
kb-mcp-server

kb-mcp-server

一个 MCP 服务器,旨在实现便携性、本地化、简易性和便利性,以支持对 txtai “all in one” 嵌入数据库进行基于语义/图的检索。任何 tar.gz 格式的 txtai 嵌入数据库都可以被加载。

本地
Python
Research MCP Server

Research MCP Server

这个服务器用作 MCP 服务器,与 Notion 交互以检索和创建调查数据,并与 Claude Desktop Client 集成以进行和审查调查。

本地
Python
Cryo MCP Server

Cryo MCP Server

一个API服务器,实现了模型补全协议(MCP),用于Cryo区块链数据提取,允许用户通过任何兼容MCP的客户端查询以太坊区块链数据。

本地
Python