🚢 TitanicAIAnalysis: Análisis de Datos con Claude y MCP
泰坦尼克号数据集数据分析的 MCP 服务器
IzarLabs
README
🚢 TitanicAIAnalysis: 使用 Claude 和 MCP 进行数据分析
<div align="center">
</div>
本项目演示了如何使用 模型上下文协议 (MCP) 创建服务器,以公开结构化数据,供 Claude 等语言模型进行分析。 通过使用著名的泰坦尼克号数据集,这个实践示例将教你如何将数据集转换为 LLM 可访问的资源和工具。
📋 内容
🔍 描述
TitanicAIAnalysis 是一个教育项目,展示了如何创建一个 MCP(模型上下文协议)服务器来公开著名的 Kaggle 泰坦尼克号数据集,从而允许 Claude 通过以下方式执行复杂的数据分析:
- Resources (MCP 资源): 公开结构化数据(泰坦尼克号 CSV)和预先计算的统计数据
- Tools (MCP 工具): 提供特定功能,例如乘客搜索
通过这种方法,你可以使用 LLM 的强大功能查询和分析结构化数据,而无需手动发送文件。
📦 要求
- Python 3.10 或更高版本
- Claude Desktop(用于与 Claude 集成)
Titanic.csv
文件(包含在存储库中,最初来自 Kaggle)- 一个可以运行 MCP 服务器的环境
🛠️ 安装
-
克隆此存储库:
git clone https://github.com/tu-usuario/TitanicAIAnalysis.git cd TitanicAIAnalysis
-
配置虚拟环境(使用
uv
):uv init . uv venv source .venv/bin/activate # 在 Windows 上: .venv\Scripts\activate
-
安装依赖项:
uv add "mcp[cli]" pandas
-
确保 Titanic.csv 文件位于项目目录中
📂 项目结构
TitanicAIAnalysis/
│
├── main.py # 带有资源和工具的 MCP 服务器
├── Titanic.csv # 泰坦尼克号数据集
├── inicio.sh # Unix/MacOS 的启动脚本
├── inicio.bat # Windows 的启动脚本(可选)
└── README.md # 此文件
▶️ 如何运行
选项 1:直接运行
你可以直接运行服务器:
python main.py
选项 2:安装到 Claude Desktop
-
准备/授予启动脚本执行权限 (MacOS/Linux):
chmod +x inicio.sh
-
配置 Claude Desktop:
- 打开 Claude Desktop
- 转到设置 → 开发者 → 编辑配置
- 修改
claude_desktop_config.json
:
{ "mcpServers": { "TitanicServerMCP": { "command": "/ruta/absoluta/a/TitanicAIAnalysis/inicio.sh", "args": [] } } }
对于 Windows,使用
inicio.bat
的完整路径或直接命令:{ "mcpServers": { "TitanicServerMCP": { "command": "python", "args": ["C:\\ruta\\completa\\a\\TitanicAIAnalysis\\inicio.bat"] } } }
-
使用 MCP CLI 安装 (替代方案):
cd TitanicAIAnalysis mcp install main.py
-
重启 Claude Desktop
💬 与 Claude 一起使用
一旦服务器运行并连接到 Claude,你将在界面中看到工具图标 (🔨)。
可用资源:
titanic://pasajeros
- 完整的泰坦尼克号数据集titanic://estadisticas
- 关于生存的预先计算的统计数据
可用工具:
buscar_pasajero
- 按姓名搜索有关特定乘客的信息
📊 分析示例
以下是一些你可以使用公开的数据向 Claude 提出的问题:
- "告诉我泰坦尼克号的总体生存统计数据"
- "头等舱乘客的生存率与三等舱乘客相比如何?"
- "搜索有关姓氏为 'Astor' 的乘客的信息"
- "分析社会阶层与生存率之间的相关性"
- "在灾难中是否遵守了 '妇女和儿童优先' 的原则?"
- "票价和生存之间是否存在某种模式?"
- "生成一个简单的图表,显示按性别和等级划分的生存率"
⚖️ 优点和局限性
优点
- 数据更新: 每次请求时都从服务器加载数据
- 结构化数据: Claude 可以处理预处理的数据
- 动态分析: 回答关于数据的临时问题
- 与现有系统集成: 允许连接到数据库或内部 API
局限性
- 数据大小: 非常大的数据集可能会超过 Claude 的上下文限制
- 资源更新: 资源在请求时读取
- 可视化: 对于高级图表,最好使用特定工具或实现可视化工具
🚀 可能的扩展
该项目可以通过多种方式扩展:
- 参数化资源: 实现诸如
titanic://pasajeros/{clase}
之类的资源 - 分析工具: 创建用于复杂统计计算的特定工具
- 可视化: 添加用于生成图表和可视化的工具
- 与数据库集成: 连接到数据库而不是 CSV 文件
- 预测分析: 添加预训练的 ML 模型作为工具
<div align="center"> <p> <sub> 使用 ❤️ 使用 MCP 和 Claude 开发 | <a href="https://github.com/modelcontextprotocol">更多关于 MCP</a> </sub> </p> </div>
推荐服务器
Crypto Price & Market Analysis MCP Server
一个模型上下文协议 (MCP) 服务器,它使用 CoinCap API 提供全面的加密货币分析。该服务器通过一个易于使用的界面提供实时价格数据、市场分析和历史趋势。 (Alternative, slightly more formal and technical translation): 一个模型上下文协议 (MCP) 服务器,利用 CoinCap API 提供全面的加密货币分析服务。该服务器通过用户友好的界面,提供实时价格数据、市场分析以及历史趋势数据。
MCP PubMed Search
用于搜索 PubMed 的服务器(PubMed 是一个免费的在线数据库,用户可以在其中搜索生物医学和生命科学文献)。 我是在 MCP 发布当天创建的,但当时正在度假。 我看到有人在您的数据库中发布了类似的服务器,但还是决定发布我的服务器。
mixpanel
连接到您的 Mixpanel 数据。 从 Mixpanel 分析查询事件、留存和漏斗数据。

Sequential Thinking MCP Server
这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

Nefino MCP Server
为大型语言模型提供访问德国可再生能源项目新闻和信息的能力,允许按地点、主题(太阳能、风能、氢能)和日期范围进行筛选。
Vectorize
将 MCP 服务器向量化以实现高级检索、私有深度研究、Anything-to-Markdown 文件提取和文本分块。
Mathematica Documentation MCP server
一个服务器,通过 FastMCP 提供对 Mathematica 文档的访问,使用户能够从 Wolfram Mathematica 检索函数文档和列出软件包符号。
kb-mcp-server
一个 MCP 服务器,旨在实现便携性、本地化、简易性和便利性,以支持对 txtai “all in one” 嵌入数据库进行基于语义/图的检索。任何 tar.gz 格式的 txtai 嵌入数据库都可以被加载。
Research MCP Server
这个服务器用作 MCP 服务器,与 Notion 交互以检索和创建调查数据,并与 Claude Desktop Client 集成以进行和审查调查。

Cryo MCP Server
一个API服务器,实现了模型补全协议(MCP),用于Cryo区块链数据提取,允许用户通过任何兼容MCP的客户端查询以太坊区块链数据。