MCP 服务器

Voice Recorder MCP Server

启用从麦克风录制音频并使用 OpenAI 的 Whisper 模型进行转录的功能。既可以作为独立的 MCP 服务器运行，也可以作为 Goose AI 代理扩展运行。

README

Voice Recorder MCP Server

一个用于录制音频并使用 OpenAI 的 Whisper 模型进行转录的 MCP 服务器。旨在作为 Goose 自定义扩展或独立的 MCP 服务器工作。

功能

从默认麦克风录制音频
使用 Whisper 转录录音
作为自定义扩展与 Goose AI 代理集成
包括常见录音场景的提示

安装

# 从源代码安装
git clone https://github.com/DefiBax/voice-recorder-mcp.git
cd voice-recorder-mcp
pip install -e .

使用

作为独立的 MCP 服务器

# 使用默认设置运行 (base.en 模型)
voice-recorder-mcp

# 使用特定的 Whisper 模型
voice-recorder-mcp --model medium.en

# 调整采样率
voice-recorder-mcp --sample-rate 44100

使用 MCP Inspector 进行测试

MCP Inspector 提供了一个交互式界面来测试您的服务器：

# 安装 MCP Inspector
npm install -g @modelcontextprotocol/inspector

# 使用 inspector 运行您的服务器
npx @modelcontextprotocol/inspector voice-recorder-mcp

与 Goose AI 代理一起使用

打开 Goose 并转到 Settings > Extensions > Add > Command Line Extension
将名称设置为 voice-recorder
在 Command 字段中，输入 voice-recorder-mcp 可执行文件的完整路径：
```
/full/path/to/voice-recorder-mcp
```
或者对于特定模型：
```
/full/path/to/voice-recorder-mcp --model medium.en
```
要查找路径，请运行：
```
which voice-recorder-mcp
```
基本功能不需要环境变量
与 Goose 开始对话，并使用以下内容介绍录音机： "我希望你根据 voice-recorder 返回的转录采取行动。例如，如果我口述一个计算，如 1+1，请返回结果。"

可用工具

start_recording: 从默认麦克风开始录制音频
stop_and_transcribe: 停止录制并将音频转录为文本
record_and_transcribe: 录制指定时长的音频并进行转录

Whisper 模型

此扩展支持各种 Whisper 模型大小：

模型	速度	准确性	内存使用	用例
`tiny.en`	最快	最低	最小	测试，快速转录
`base.en`	快	好	低	日常使用 (默认)
`small.en`	中等	更好	中等	良好的平衡
`medium.en`	慢	高	高	重要录音
`large`	最慢	最高	非常高	关键转录

.en 后缀表示专门用于英语的模型，这些模型对于英语内容更快更准确。

要求

Python 3.12+
音频输入设备（麦克风）

配置

您可以使用环境变量配置服务器：

# 设置 Whisper 模型
export WHISPER_MODEL=small.en

# 设置音频采样率
export SAMPLE_RATE=44100

# 设置最大录制时长（秒）
export MAX_DURATION=120

# 然后运行服务器
voice-recorder-mcp