MCP 服务器

MinionWorks – Modular browser agents that work for bananas 🍌

minionworks

浏览器自动化

README

<p align="center"> <img src="static/minion-works-cover-light.png#gh-light-mode-only" alt="Minion Works" width="100%" /> <img src="static/minion-works-cover-dark.png#gh-dark-mode-only" alt="Minion Works" width="100%" /> </p>

<h1 align="center"> MinionWorks – 模块化浏览器代理，为你卖力工作 🍌</h1>

<p align="center"> <em>模块化。可扩展。为现代 Web 自动化而生的 AI 原生浏览器代理。</em> </p>

🚀 概述

Minion Works 是一个模块化的 AI 代理框架，可以连接到你的浏览器并自主执行复杂的任务。专为开发者、研究人员和充满好奇心的构建者而设计。

✨ 特性

🌐 执行 Google 搜索并抓取内容
🤖 使用 LLM（如 GPT-4）来规划行动
🔗 模块化架构，适用于即插即用的用例
🔎 DOM 交互和内容提取
🔄 通过 Python 或 UI 运行工作流

🛠️ 安装

安装包
```
pip install minion-agent
```

设置环境变量

cp .env.example .env
# 编辑你的 .env 文件，填入 OpenAI 或其他 API 密钥

🧪 快速开始

这是一个使用 MinionAgent 和 langchain-openai 的完整示例：

from langchain_openai import ChatOpenAI
from minion_agent.browser import MinionAgent
import asyncio
from dotenv import load_dotenv

# 从 .env 文件加载环境变量
load_dotenv()

async def main():
    # 示例 1：使用环境变量进行 OpenAI 配置
    agent1 = MinionAgent(
        task="比较 GPT-4 和 DeepSeek-V3 的价格",
        llm=ChatOpenAI(model="gpt-4o"),
        headless=True
    )
    result1 = await agent1.run()
    print("Result 1:", result1)

    # 示例 2：提供自定义 LLM 和配置
    agent2 = MinionAgent(
        task="搜索关于 AI 的最新新闻",
        llm=ChatOpenAI(model="gpt-4o"),
        headless=False  # 显示浏览器窗口
    )
    result2 = await agent2.run()
    print("Result 2:", result2)

if __name__ == "__main__":
    asyncio.run(main())

🧠 示例用例

agent = MinionAgent(
    task="查找 2025 年排名前 3 的 ML 会议，并总结每个会议。",
    llm=ChatOpenAI(model="gpt-4")
)
await agent.run()

🧪 测试

pytest --maxfail=1 --disable-warnings -q

确保你在 tests/ 所在的根文件夹中。

🤝 贡献

我们欢迎 PR、反馈和创意！

Fork → Branch → Commit
添加测试
提交 Pull Request
告诉你的朋友 🚀

📖 引用

@software{minion_works2025,
  author = {Sairaam, Aman, Cheena},
  title = {Minion Works: 让 AI 掌管你的浏览器。},
  year = {2025},
  publisher = {GitHub},
  url = {https://github.com/minionworks/minions}
}