MiroThinker的技术报告里,有哪些策略可以分享?
摘要:整理了 MiroThinker 的技术报告和公开资料。目前 MiroThinker release 了三份技术报告,分别是 mirothinker 1.0、mirothinker 1.7 和 miroflow。 目录1. 官方网站2. 开源
整理了 MiroThinker 的技术报告和公开资料。目前 MiroThinker release 了三份技术报告,分别是 mirothinker 1.0、mirothinker 1.7 和 miroflow。
目录1. 官方网站2. 开源代码与模型资源3. 官方文档4. 中文社区的第三方解读(人类撰写)
1. 官方网站
资源
链接
说明
项目主页
mirothinker.io
官方介绍、技术特性、模型版本对比
网页版 demo
dr.miromind.ai
网页版交互式 Demo,可直接试用
公司主页
miromind.ai
MiroMind 团队介绍与项目生态
2. 开源代码与模型资源
2.1 GitHub 仓库
主仓库:MiroMindAI/MiroThinker
MiroFlow(个人理解是一个 Deep Research agent 的框架,可能是 mirothinker 的 harness 的一部分):MiroMindAI/MiroFlow
2.2 Hugging Face 模型
模型 / 数据集名称
参数量
上下文
工具调用
链接
MiroThinker-1.7-mini
30B
256K
300
HF 链接
MiroThinker-1.7
235B
256K
300
HF 链接
MiroThinker-v1.5-30B
30B
256K
400
HF 链接
MiroThinker-v1.5-235B
235B
256K
400
HF 链接
MiroThinker-v1.0-8B/30B/72B
多规格
256K
600
HF 集合页
MiroVerse-v0.1(数据集)
147K+ 个轨迹
/
/
HF 链接
2.3 核心项目生态
MiroMind ODR (Open Deep Research)
├── MiroThinker → 模型(工具增强推理的大语言模型)
├── MiroFlow → Agent框架(可复现的多智能体编排)
├── MiroVerse → 数据集(147K+ 研究轨迹样本)
└── MiroTrain → 训练基础设施(支持RL、长文本训练)
2.4 工作内容与算法概况
核心创新:提出 Interactive Scaling(交互式扩展) 作为模型性能的"第三维度",与模型规模、上下文长度并列
训练方法:
中期训练(mid-training)强化规划与工具交互能力
SFT + DPO + RL 三阶段优化
时序敏感沙盒训练,避免"未来信息泄露"
推理机制:
支持假设 → 搜索 → 验证 →修正的闭环推理
局部验证(单步逻辑)+ 全局验证(整体一致性)
最高支持 600 次工具调用/任务
工具集成:Web 搜索(Serper)、网页抓取(Jina)、代码执行(E2B)、文档解析、多模态处理等
3. 官方文档
官方文档
类型
链接 / 位置
内容
README
GitHub/README.md
快速开始、配置说明、基准评测
工具文档
libs/miroflow-tools/README.md
MCP 工具配置、API 密钥说明
部署指南
GitHub Wiki / docs/ 目录
SGLang / vLLM 部署、量化方案、Docker 支持
技术报告
论文
arXiv ID
发布日期
核心贡献
MiroThinker: Pushing the Performance Boundaries of Open-Source Research Agents via Model, Context, and Interactive Scaling
2511.11793
2025-11
提出 Interactive Scaling,v1.0 版本基准结果
MiroThinker-1.7 & H1: Towards Heavy-Duty Research Agents via Verification
2603.15726
2026-03
引入验证机制,1.7 与 H1版本技术细节
MiroFlow: Towards High-Performance and Robust Open-Source Agent Framework
2602.22808
2026-02
Agent 框架设计,支持高并发与可复现评测
官方博客:miromind.ai/blog(感觉在技术上的信息量不大)
4. 中文社区的第三方解读(人类撰写)
发布者
文章
量子位
陈天桥代季峰打响 2026 大模型第一枪:30B 参数跑出 1T 性能(最初是看量子位的推送 了解到 mirothinker 并试用,发现 deep research 表现很强)
始智 AI
MiroThinker 开源,专为深度研究和解决多步复杂任务而生
AI 产品银海
已开源!这个搜索智能体模型,思路有点不一样
开放传神(OpenCSG)
MiroThinker-1.7:当 AI 学会"慢思考",推理能力迎来质的飞跃
