Local Search MCP Server
Enables completely offline Wikipedia search through locally-indexed content using BM25 algorithm, allowing AI assistants to query Wikipedia without internet connectivity or external API calls.
README
Local Search MCP Server
A standalone, offline Wikipedia search server implementing the Model Context Protocol (MCP). This server enables AI assistants to search through locally-indexed Wikipedia content without requiring external API calls or internet connectivity.
Features
- Completely Offline: No external API dependencies (Google Search, etc.)
- Free & Fast: Uses BM25 algorithm for efficient full-text search
- MCP Compatible: Works with any MCP-compatible client (Claude Desktop, etc.)
- Ollama Integration: Includes test client for Ollama-based agents
- Easy Setup: Simple installation with
uvpackage manager
Architecture
┌─────────────┐ ┌──────────────────┐ ┌─────────────┐
│ Ollama │ ◄────── │ MCP Client │ ◄────── │ Human │
│ (LLM) │ │ (test script) │ │ │
└─────────────┘ └──────────────────┘ └─────────────┘
│
│ MCP Protocol
▼
┌──────────────────┐
│ MCP Server │
│ (src/server.py) │
└──────────────────┘
│
▼
┌──────────────────┐
│ BM25 Index │
│ (Wikipedia) │
└──────────────────┘
Installation
Prerequisites
- Python 3.10 or higher
- uv package manager
- (Optional) Ollama with a tool-compatible model (e.g., command-r) for testing
Setup
- Clone the repository:
git clone https://github.com/yourusername/localsearch-mcp.git
cd localsearch-mcp
- Install dependencies:
uv sync
- Build the Wikipedia index (first run only):
uv run python -m src
# Press Ctrl+C after index is built
This will download English Wikipedia (~6.8M articles, ~20GB) and create a BM25 index in the data/ directory. The initial build takes significant time and disk space.
Usage
Running the MCP Server
uv run python -m src
The server will:
- Load the pre-built Wikipedia index
- Start listening for MCP requests on stdio
- Provide the
search_wikipediatool
Testing with Ollama
Simple Test (No LLM)
uv run tests/verify_with_ollama.py --simple
This tests the MCP connection and performs a direct search.
Full Agent Test (Requires Ollama)
# Make sure Ollama is running with a tool-compatible model
ollama pull command-r
ollama serve
# In another terminal:
uv run tests/verify_with_ollama.py
Expected output:
🤖 Starting MCP Client and connecting to Local Search Server...
✅ Connected. Available tools: ['search_wikipedia']
👤 User Query: Pythonというプログラミング言語の歴史について、簡潔に教えて
🛠️ Agent requested 1 tool call(s)
→ Tool: search_wikipedia
→ Args: {'query': 'history of python programming language'}
→ Output length: 1523 chars
🤖 Agent Answer:
Python was created by Guido van Rossum in the late 1980s...
Integration with Claude Desktop
Add this to your Claude Desktop MCP configuration:
{
"mcpServers": {
"local-wiki-search": {
"command": "uv",
"args": ["run", "python", "-m", "src"],
"cwd": "/path/to/localsearch-mcp"
}
}
}
Then restart Claude Desktop and you can use the Wikipedia search tool in your conversations.
Project Structure
localsearch-mcp/
├── pyproject.toml # Dependencies and project metadata
├── README.md # This file
├── data/ # Index storage (created on first run)
│ ├── .gitkeep
│ └── wiki_index.pkl # BM25 index (not in git)
├── src/
│ ├── __init__.py
│ ├── __main__.py # Entry point for `python -m src`
│ ├── server.py # MCP server implementation
│ └── indexer.py # BM25 indexing logic
└── tests/
├── __init__.py
└── verify_with_ollama.py # Ollama integration test client
Available Tools
search_wikipedia
Search English Wikipedia for a given query using BM25 algorithm.
Parameters:
query(string, required): Search keywordstop_k(integer, optional): Number of results to return (default: 3, max: 10)
Returns: Formatted search results with titles, Wikipedia URLs, and content snippets.
Example:
# MCP tool call
result = await session.call_tool(
"search_wikipedia",
arguments={"query": "python programming language", "top_k": 3}
)
Customization
Using Simple English Wikipedia (for development)
For faster development/testing, use the lightweight Simple English Wikipedia:
Edit src/indexer.py:
# Change this line:
ds = load_dataset("wikimedia/wikipedia", "20231101.en", split="train")
# To (Simple English, limited to 10k articles):
ds = load_dataset("wikimedia/wikipedia", "20231101.simple", split="train[:10000]")
This reduces disk space to ~500MB and builds in a few minutes.
Adjusting Index Size
You can limit the number of articles for testing:
# Limit to 1000 articles
ds = load_dataset("wikimedia/wikipedia", "20231101.en", split="train[:1000]")
Development
Running Tests
# Simple MCP connection test
uv run tests/verify_with_ollama.py --simple
# Full Ollama agent test
uv run tests/verify_with_ollama.py
Rebuilding Index
Delete data/wiki_index.pkl and restart the server.
Troubleshooting
Index Not Building
- Check disk space (needs ~500MB for Simple Wikipedia, ~20GB for full)
- Ensure stable internet connection for initial download
- Check Python version (3.10+ required)
Ollama Connection Fails
- Verify Ollama is running:
ollama list - Ensure a tool-compatible model is installed:
ollama pull command-r - Check Ollama API is accessible:
curl http://localhost:11434
MCP Server Not Starting
- Check dependencies:
uv sync - Verify Python path in MCP config
- Check for port conflicts
Contributing
Contributions are welcome! Please feel free to submit a Pull Request.
License
MIT License - see LICENSE file for details
日本語版
概要
ローカル環境で動作する Wikipedia 検索 MCP サーバーです。外部 API に依存せず、完全にオフラインで動作します。
特徴
- 完全オフライン: インターネット接続不要
- 無料・高速: BM25 アルゴリズムによる効率的な全文検索
- MCP 互換: Claude Desktop などの MCP 対応クライアントで使用可能
- Ollama 統合: Ollama を使ったテストクライアント付属
- 簡単セットアップ:
uvによる簡単インストール
インストール
必要要件
- Python 3.10 以上
- uv パッケージマネージャー
- (オプション) テスト用の Ollama とツール対応モデル(例: command-r)
セットアップ手順
- リポジトリをクローン:
git clone https://github.com/yourusername/localsearch-mcp.git
cd localsearch-mcp
- 依存関係をインストール:
uv sync
- Wikipedia インデックスを構築(初回のみ):
uv run python -m src
# インデックス構築後 Ctrl+C で終了
これにより英語版 Wikipedia(約680万記事、約20GB)がダウンロードされ、data/ ディレクトリに BM25 インデックスが作成されます。初回構築には時間とディスク容量が必要です。
使い方
MCP サーバーの起動
uv run src/server.py
サーバーは以下を実行します:
- 構築済み Wikipedia インデックスを読み込み
- 標準入出力で MCP リクエストを待機
search_wikipediaツールを提供
Ollama を使ったテスト
シンプルテスト(LLM なし)
uv run tests/verify_with_ollama.py --simple
MCP 接続と検索機能をテストします。
エージェントテスト(Ollama 必要)
# Ollama と llama3.2 モデルを起動
ollama pull llama3.2
ollama serve
# 別のターミナルで実行:
uv run tests/verify_with_ollama.py
Claude Desktop との統合
Claude Desktop の MCP 設定に以下を追加:
{
"mcpServers": {
"local-wiki-search": {
"command": "uv",
"args": ["run", "/絶対パス/localsearch-mcp/src/server.py"]
}
}
}
Claude Desktop を再起動すると、会話内で Wikipedia 検索が使えるようになります。
利用可能なツール
search_wikipedia
BM25 アルゴリズムを使って Wikipedia を検索します。
パラメータ:
query(文字列, 必須): 検索キーワードtop_k(整数, オプション): 返す結果の数(デフォルト: 3、最大: 10)
戻り値: タイトル、URL、本文スニペットを含む検索結果
カスタマイズ
完全版 Wikipedia を使用
src/indexer.py を編集:
# この行を変更:
ds = load_dataset("wikipedia", "20220301.simple", split="train[:10000]")
# 以下に変更:
ds = load_dataset("wikipedia", "20231101.en", split="train")
注: 約20GB のディスクスペースと長い構築時間が必要です。
トラブルシューティング
インデックスが構築されない
- ディスク容量を確認(Simple 版で約500MB、完全版で約20GB必要)
- 初回ダウンロード用のインターネット接続を確認
- Python バージョンを確認(3.10以上必要)
Ollama 接続エラー
- Ollama が起動しているか確認:
ollama list - llama3.2 がインストールされているか確認:
ollama pull llama3.2 - Ollama API にアクセス可能か確認:
curl http://localhost:11434
ライセンス
MIT License
推荐服务器
Baidu Map
百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。
Playwright MCP Server
一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。
Magic Component Platform (MCP)
一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。
Audiense Insights MCP Server
通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。
VeyraX
一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。
graphlit-mcp-server
模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。
Kagi MCP Server
一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。
e2b-mcp-server
使用 MCP 通过 e2b 运行代码。
Neon MCP Server
用于与 Neon 管理 API 和数据库交互的 MCP 服务器
Exa MCP Server
模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。