MiroThinker的技术报告里，有哪些策略可以分享？

摘要：整理了 MiroThinker 的技术报告和公开资料。目前 MiroThinker release 了三份技术报告，分别是 mirothinker 1.0、mirothinker 1.7 和 miroflow。目录1. 官方网站2. 开源

整理了 MiroThinker 的技术报告和公开资料。目前 MiroThinker release 了三份技术报告，分别是 mirothinker 1.0、mirothinker 1.7 和 miroflow。目录1. 官方网站2. 开源代码与模型资源3. 官方文档4. 中文社区的第三方解读（人类撰写） 1. 官方网站资源链接说明项目主页 mirothinker.io 官方介绍、技术特性、模型版本对比网页版 demo dr.miromind.ai 网页版交互式 Demo，可直接试用公司主页 miromind.ai MiroMind 团队介绍与项目生态 2. 开源代码与模型资源 2.1 GitHub 仓库主仓库：MiroMindAI/MiroThinker MiroFlow（个人理解是一个 Deep Research agent 的框架，可能是 mirothinker 的 harness 的一部分）：MiroMindAI/MiroFlow 2.2 Hugging Face 模型模型 / 数据集名称参数量上下文工具调用链接 MiroThinker-1.7-mini 30B 256K 300 HF 链接 MiroThinker-1.7 235B 256K 300 HF 链接 MiroThinker-v1.5-30B 30B 256K 400 HF 链接 MiroThinker-v1.5-235B 235B 256K 400 HF 链接 MiroThinker-v1.0-8B/30B/72B 多规格 256K 600 HF 集合页 MiroVerse-v0.1（数据集） 147K+ 个轨迹 / / HF 链接 2.3 核心项目生态 MiroMind ODR (Open Deep Research) ├── MiroThinker → 模型（工具增强推理的大语言模型） ├── MiroFlow → Agent框架（可复现的多智能体编排） ├── MiroVerse → 数据集（147K+ 研究轨迹样本） └── MiroTrain → 训练基础设施（支持RL、长文本训练） 2.4 工作内容与算法概况核心创新：提出 Interactive Scaling（交互式扩展）作为模型性能的"第三维度"，与模型规模、上下文长度并列训练方法：中期训练（mid-training）强化规划与工具交互能力 SFT + DPO + RL 三阶段优化时序敏感沙盒训练，避免"未来信息泄露" 推理机制：支持假设 → 搜索 → 验证 →修正的闭环推理局部验证（单步逻辑）+ 全局验证（整体一致性）最高支持 600 次工具调用/任务工具集成：Web 搜索（Serper）、网页抓取（Jina）、代码执行（E2B）、文档解析、多模态处理等 3. 官方文档官方文档类型链接 / 位置内容 README GitHub/README.md 快速开始、配置说明、基准评测工具文档 libs/miroflow-tools/README.md MCP 工具配置、API 密钥说明部署指南 GitHub Wiki / docs/ 目录 SGLang / vLLM 部署、量化方案、Docker 支持技术报告论文 arXiv ID 发布日期核心贡献 MiroThinker: Pushing the Performance Boundaries of Open-Source Research Agents via Model, Context, and Interactive Scaling 2511.11793 2025-11 提出 Interactive Scaling，v1.0 版本基准结果 MiroThinker-1.7 & H1: Towards Heavy-Duty Research Agents via Verification 2603.15726 2026-03 引入验证机制，1.7 与 H1版本技术细节 MiroFlow: Towards High-Performance and Robust Open-Source Agent Framework 2602.22808 2026-02 Agent 框架设计，支持高并发与可复现评测官方博客：miromind.ai/blog（感觉在技术上的信息量不大） 4. 中文社区的第三方解读（人类撰写）发布者文章量子位陈天桥代季峰打响 2026 大模型第一枪：30B 参数跑出 1T 性能（最初是看量子位的推送了解到 mirothinker 并试用，发现 deep research 表现很强）始智 AI MiroThinker 开源，专为深度研究和解决多步复杂任务而生 AI 产品银海已开源！这个搜索智能体模型，思路有点不一样开放传神（OpenCSG） MiroThinker-1.7：当 AI 学会"慢思考"，推理能力迎来质的飞跃

MiroThinker的技术报告里，有哪些策略可以分享？

相关推荐