WorkflowLearner

WorkflowLearner

为了让LLM Agent理解工作流程,可以使用PSR.exe的hmt文件。

u3588064

研究与数据
访问服务器

README

工作流录制器 WorkflowLearner

项目概述 Summary

本项目旨在通过使用PSR.exe录制的MHT文件,让大语言模型(LLM)学习工作流。PSR.exe是Windows操作系统中的问题步骤记录器,可以记录用户操作并生成MHT文件。通过解析这些MHT文件,LLM可以学习和理解用户的工作流程。

在线演示demo: https://deepnote.com/app/skedge-d0bd/-9355fadf-b8e7-4dfb-acf1-7c56103d1360?utm_source=app-settings&utm_medium=product-shared-content&utm_campaign=data-app&utm_content=9355fadf-b8e7-4dfb-acf1-7c56103d1360

功能 Functions

  • 使用PSR.exe录制用户操作并生成MHT文件。
  • 解析MHT文件并提取工作流信息。
  • 使用LLM学习和理解工作流。

安装 installment

前提条件 Requirements

  • Windows操作系统 Windows operating system
  • Python 3.x
  • PSR.exe(问题步骤记录器,Windows自带;Problem Steps Recorder, included with Windows)

安装步骤 Install Steps

克隆仓库/Clone the repository:

git clone https://github.com/u3588064/WorkflowLearner
cd llm-workflow-learning

安装依赖/Install dependencies:

pip install -r requirements.txt

使用方法 Methods

使用PSR.exe录制用户操作 Recording actions with PSR.exe

  1. 打开PSR.exe(问题步骤记录器),可通过Win7/Win8/Win10的搜索栏搜索找到。
  2. 点击“开始记录”按钮,然后开始你的工作。PSR.exe会自动记录鼠标动作(如点击、拖动、滚动等)以及键盘动作(仅是动作,不会记录键入的内容)。
  3. 完成操作后,点击“停止记录”按钮。软件会自动弹出保存窗口。
  4. 结果会以一个Zip压缩包存在,压缩包内是MHT格式的网页,内含分步步骤以及屏幕截图。

解析MHT文件 Parse MHT files:

python parse_mht.py path/to/your/file.mht

使用LLM学习工作流 Use LLM to learn workflows:

python learn_workflow.py path/to/parsed/data.json

文件结构 File Structure:

llm-workflow-learning/
│
├── parse_mht.py          # 解析MHT文件的脚本
├── learn_workflow.py     # 使用LLM学习工作流的脚本
├── requirements.txt      # 项目依赖
├── README.md             # 项目说明文档
└── data/                 # 存放解析后的数据文件

贡献 Contributing

欢迎贡献!请提交Issue或Pull Request。

许可证 License

本项目采用MIT许可证,详见LICENSE文件。

联系方式 Contact

如果您有任何问题或需要进一步的信息,请联系项目维护者:u3588064@connect.hku.hk

qrcode_for_gh_643efb7db5bc_344(1)

推荐服务器

Crypto Price & Market Analysis MCP Server

Crypto Price & Market Analysis MCP Server

一个模型上下文协议 (MCP) 服务器,它使用 CoinCap API 提供全面的加密货币分析。该服务器通过一个易于使用的界面提供实时价格数据、市场分析和历史趋势。 (Alternative, slightly more formal and technical translation): 一个模型上下文协议 (MCP) 服务器,利用 CoinCap API 提供全面的加密货币分析服务。该服务器通过用户友好的界面,提供实时价格数据、市场分析以及历史趋势数据。

精选
TypeScript
MCP PubMed Search

MCP PubMed Search

用于搜索 PubMed 的服务器(PubMed 是一个免费的在线数据库,用户可以在其中搜索生物医学和生命科学文献)。 我是在 MCP 发布当天创建的,但当时正在度假。 我看到有人在您的数据库中发布了类似的服务器,但还是决定发布我的服务器。

精选
Python
mixpanel

mixpanel

连接到您的 Mixpanel 数据。 从 Mixpanel 分析查询事件、留存和漏斗数据。

精选
TypeScript
Sequential Thinking MCP Server

Sequential Thinking MCP Server

这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

精选
Python
Nefino MCP Server

Nefino MCP Server

为大型语言模型提供访问德国可再生能源项目新闻和信息的能力,允许按地点、主题(太阳能、风能、氢能)和日期范围进行筛选。

官方
Python
Vectorize

Vectorize

将 MCP 服务器向量化以实现高级检索、私有深度研究、Anything-to-Markdown 文件提取和文本分块。

官方
JavaScript
Mathematica Documentation MCP server

Mathematica Documentation MCP server

一个服务器,通过 FastMCP 提供对 Mathematica 文档的访问,使用户能够从 Wolfram Mathematica 检索函数文档和列出软件包符号。

本地
Python
kb-mcp-server

kb-mcp-server

一个 MCP 服务器,旨在实现便携性、本地化、简易性和便利性,以支持对 txtai “all in one” 嵌入数据库进行基于语义/图的检索。任何 tar.gz 格式的 txtai 嵌入数据库都可以被加载。

本地
Python
Research MCP Server

Research MCP Server

这个服务器用作 MCP 服务器,与 Notion 交互以检索和创建调查数据,并与 Claude Desktop Client 集成以进行和审查调查。

本地
Python
Cryo MCP Server

Cryo MCP Server

一个API服务器,实现了模型补全协议(MCP),用于Cryo区块链数据提取,允许用户通过任何兼容MCP的客户端查询以太坊区块链数据。

本地
Python