File Analysis MCP Server

File Analysis MCP Server

huangyz0918

研究与数据
访问服务器

README

文件分析 MCP 服务器

此模型上下文协议 (MCP) 服务器提供用于读取和写入文件、分析数据(尤其是 CSV 文件)、生成可视化效果以及读取 PDF 文件的工具 - 所有这些都可以通过任何 MCP 客户端(如 Claude Desktop)访问。

功能

文件操作

  • 安全地读取和写入文本文件
  • 列出目录中与模式匹配的文件
  • 获取详细的文件信息(大小、创建时间等)
  • 从 PDF 文件中提取文本内容

数据分析

  • 读取和采样 CSV 文件
  • 使用详细的统计信息分析 CSV 数据
  • 使用各种绘图类型(条形图、折线图、散点图、直方图、箱线图)可视化数据

包含的提示

  • 分析数据文件 - 综合数据分析
  • 数据清理步骤 - 识别和修复数据问题
  • 生成摘要报告 - 为利益相关者提供的执行摘要
  • 探索性数据分析 - 详细的 EDA 工作流程

安装

前提条件

  • Python 3.10 或更高版本
  • Claude Desktop 或其他 MCP 客户端

设置

  1. 安装依赖项:
pip install "mcp[cli]" pandas numpy matplotlib PyPDF2
  1. 设置安全目录(可选):
# 默认目录为 ~/Documents 和 ~/Downloads
# 要自定义,请设置此环境变量:
export MCP_FILE_ROOTS="~/Documents:~/Desktop:~/Downloads"
  1. 在 Claude Desktop 中安装:
mcp install file_analysis_server.py

与 Claude Desktop 一起使用

安装完成后,您可以向 Claude 提出如下问题:

  • “你能列出我的 Documents 文件夹中的文件吗?”
  • “为我读取 ~/Documents/example.txt 的内容”
  • “从我的 ~/Documents/report.pdf 文件中提取文本”
  • “读取我的 PDF 文档的第 5 页”
  • “分析 ~/Downloads/sample.csv 中的数据”
  • “从我的 CSV 文件中创建 'Sales' 列的条形图”
  • “编写我的 quarterly_sales.csv 文件的摘要报告”

安全

服务器强制执行严格的路径验证,以确保只能访问授权目录中的文件。 默认情况下,这些目录限制为 ~/Documents 和 ~/Downloads。

配置

您可以通过设置 MCP_FILE_ROOTS 环境变量来调整允许的目录。 多个目录应以冒号分隔,例如:

mcp install file_analysis_server.py -v MCP_FILE_ROOTS="~/Documents:~/Desktop:~/projects/data"

开发

对于开发和测试:

mcp dev file_analysis_server.py

这将使用 MCP Inspector 界面启动服务器以进行交互式测试。

示例

读取文件

你能读取 ~/Documents/notes.txt 的内容吗?

读取 PDF 文件

你能从 ~/Documents/report.pdf 中提取文本吗?

从 PDF 读取特定页面

请读取 ~/Downloads/manual.pdf 的第 3 页和第 5 页

分析 CSV 数据

我有一个 CSV 文件位于 ~/Downloads/sales_data.csv。 你能分析它并告诉我关于 'Revenue' 列的信息吗?

创建可视化

使用我的 ~/Documents/monthly_data.csv 文件,你能创建一个显示 'Month' 与 'Profit' 的条形图吗?

使用提示

你能对 ~/Downloads/customer_data.csv 运行探索性数据分析吗?

推荐服务器

Crypto Price & Market Analysis MCP Server

Crypto Price & Market Analysis MCP Server

一个模型上下文协议 (MCP) 服务器,它使用 CoinCap API 提供全面的加密货币分析。该服务器通过一个易于使用的界面提供实时价格数据、市场分析和历史趋势。 (Alternative, slightly more formal and technical translation): 一个模型上下文协议 (MCP) 服务器,利用 CoinCap API 提供全面的加密货币分析服务。该服务器通过用户友好的界面,提供实时价格数据、市场分析以及历史趋势数据。

精选
TypeScript
MCP PubMed Search

MCP PubMed Search

用于搜索 PubMed 的服务器(PubMed 是一个免费的在线数据库,用户可以在其中搜索生物医学和生命科学文献)。 我是在 MCP 发布当天创建的,但当时正在度假。 我看到有人在您的数据库中发布了类似的服务器,但还是决定发布我的服务器。

精选
Python
mixpanel

mixpanel

连接到您的 Mixpanel 数据。 从 Mixpanel 分析查询事件、留存和漏斗数据。

精选
TypeScript
Sequential Thinking MCP Server

Sequential Thinking MCP Server

这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

精选
Python
Nefino MCP Server

Nefino MCP Server

为大型语言模型提供访问德国可再生能源项目新闻和信息的能力,允许按地点、主题(太阳能、风能、氢能)和日期范围进行筛选。

官方
Python
Vectorize

Vectorize

将 MCP 服务器向量化以实现高级检索、私有深度研究、Anything-to-Markdown 文件提取和文本分块。

官方
JavaScript
Mathematica Documentation MCP server

Mathematica Documentation MCP server

一个服务器,通过 FastMCP 提供对 Mathematica 文档的访问,使用户能够从 Wolfram Mathematica 检索函数文档和列出软件包符号。

本地
Python
kb-mcp-server

kb-mcp-server

一个 MCP 服务器,旨在实现便携性、本地化、简易性和便利性,以支持对 txtai “all in one” 嵌入数据库进行基于语义/图的检索。任何 tar.gz 格式的 txtai 嵌入数据库都可以被加载。

本地
Python
Research MCP Server

Research MCP Server

这个服务器用作 MCP 服务器,与 Notion 交互以检索和创建调查数据,并与 Claude Desktop Client 集成以进行和审查调查。

本地
Python
Cryo MCP Server

Cryo MCP Server

一个API服务器,实现了模型补全协议(MCP),用于Cryo区块链数据提取,允许用户通过任何兼容MCP的客户端查询以太坊区块链数据。

本地
Python