11 KiB
11 KiB
这个仓库是MiroMind研究智能体项目的官方开源仓库。它是一个高性能、完全开源的研究智能体系统,旨在执行多步骤的互联网深度研究,用于解决复杂问题(例如:进行未来事件预测)。该项目目前包含四个核心组件:
- 🤖 MiroFlow:一个开源研究智能体框架,在代表性基准(如 FutureX、GAIA、HLE、xBench-DeepSearch、BrowserComp)上实现了可复现的最高性能(代码详见本仓库)。动手尝试一下 [5分钟快速上手]。
- 🤔 MiroThinker:一个开源智能体基座模型,原生支持工具辅助推理。详见 MiroThinker。
- 📊 MiroVerse:14.7万条高质量开源训练数据,用于研究智能体训练。详见 MiroVerse。
- 🚧 MiroTrain / MiroRL:支持研究智能体模型稳定高效训练的基础设施。详见 MiroTrain / MiroRL。
📋 目录
📰 最近更新
- [2025-09-15]: 🎉🎉 MiroFlow v0.3:简化仓库代码架构,提升基准测试表现,使 GPT-5 的未来事件预测准确率提高 11%。MiroFlow 现已在未来预测基准中排名第一。详见 FutureX。
- [2025-08-27]: MiroFlow v0.2:在多个重要的智能体基准测试上达到最高性能,且这些性能均可通过本仓库代码复现,包括 HLE (27.2%)、HLE-Text-Only (29.5%)、BrowserComp-EN (33.2%)、BrowserComp-ZH (47.1%)、xBench-DeepSearch (72.0%)。
- [2025-08-26]: 发布了 GAIA 验证轨迹 (73.94% pass@1) 和用于本地部署的 Gradio 演示。
- [2025-08-08]: MiroFlow v0.1:研究智能体框架首次完整开源发布。
🚀 5分钟快速上手
📋 前置条件
- Python: 3.12 或更高版本
- 包管理器:
uv - 操作系统: Linux, macOS
⚡ 快速设置
示例: 带文档处理能力的智能文档分析。
# 1. 克隆并设置
git clone https://github.com/MiroMindAI/MiroFlow && cd MiroFlow
uv sync
# 2. 配置 API 密钥
cp .env.template .env
# 编辑 .env 并添加您的 OPENROUTER_API_KEY
# 3. 运行您的第一个智能体
uv run main.py trace --config_file_name=agent_quickstart_reading --task="What is the first country listed in the XLSX file that have names starting with Co?" --task_file_name="data/FSI-2023-DOWNLOAD.xlsx"
🎉 预期输出: 您的智能体应该返回 \boxed{Congo Democratic Republic} 😊
💡 提示: 如果遇到问题,请检查您的 API 密钥是否在
.env文件中正确设置,以及是否安装了所有依赖项。
🤖 什么是 MiroFlow?
MiroFlow 是一个高性能、模块化的研究智能体框架,能够在复杂推理任务(例如:未来事件预测)上实现最先进的效果。它支持多轮对话、高度集成的工具生态,以及分层子智能体调度,确保任务最优完成。了解更多请参见我们的 智能体框架介绍。
|
Research Assistant Demo -
阅读CVPR 2025最佳论文并给出研究方向建议
|
🌟 核心亮点
- 可复现的最先进性能:在 多个重要的智能体基准测试 上排名第一,包括 FutureX、GAIA、HLE、xBench-DeepSearch、BrowserComp。
- 高并发与高可靠性:具备健壮的并发管理和容错设计,MiroFlow 能高效处理受限速 API 和不稳定网络,确保顺畅的数据收集和复杂任务的可靠执行。
- 高性价比部署:基于开源的 MiroThinker 模型,MiroFlow 可以在单张 RTX 4090 上运行研究智能体服务,整个栈依赖于免费开源工具,便于部署、扩展和复现,详见 MiroThinker。
🔧 支持的模型与工具
✨ 基准测试性能
截至 2025 年 9 月 10 日,MiroFlow 在 FutureX 基准排行榜 上排名第一,使 GPT-5 的未来预测准确率提高了 11%。
我们在一系列基准测试上对 MiroFlow 进行了评估,包括 GAIA、HLE、BrowseComp 和 xBench-DeepSearch,并取得了目前最好的的结果。
| 模型/框架 | GAIA Val | HLE | HLE-Text | BrowserComp-EN | BrowserComp-ZH | xBench-DeepSearch |
|---|---|---|---|---|---|---|
| MiroFlow | 82.4% | 27.2% | 29.5% | 33.2% | 47.1% | 72.0% |
| OpenAI Deep Research | 67.4% | 26.6% | - | 51.5% | 42.9% | - |
| Gemini Deep Research | - | 26.9% | - | - | - | 50+% |
| Kimi Researcher | - | - | 26.9% | - | - | 69.0% |
| WebSailor-72B | 55.4% | - | - | - | 30.1% | 55.0% |
| Manus | 73.3% | - | - | - | - | - |
| DeepSeek v3.1 | - | - | 29.8% | - | - | 71.2% |
按照我们的详细指南在我们的基准测试文档中重现基准测试结果
❓ 常见问题
我需要什么 API 密钥?
您只需要一个 OpenRouter API 密钥即可开始。OpenRouter 通过单一 API 提供对多个语言模型的访问。
除了 OpenRouter,我可以使用其他语言模型吗?
是的,MiroFlow 支持各种语言模型。查看我们的文档了解配置详情。
🤝 贡献
我们欢迎社区的贡献!无论您是修复错误、添加功能还是改进文档,您的帮助都是受欢迎的。
- 📋 问题反馈: 通过 GitHub Issues 报告错误或请求功能。
- 🔀 拉取请求: 通过拉取请求提交改进。
- 💬 讨论: 加入我们的 Discord 社区 进行问题讨论。
📄 许可证
本项目在 Apache License 2.0 下许可。
🙏 致谢
- 基准测试贡献者 提供了综合评估数据集。
- 开源社区 提供了使这一切成为可能的工具和库。
我们感谢所有帮助 MiroFlow 变得更好的贡献者:
加入我们的社区,帮助我们构建 AI 智能体的未来!
参考文献
技术报告即将发布!
@misc{2025mirothinker,
title={MiroFlow: A High-Performance Open-Source Research Agent Framework},
author={MiroMind AI Team},
howpublished={\url{https://github.com/MiroMindAI/MiroFlow}},
year={2025}
}