MiMo-V2.5-Pro 是小米最强的 1T MoE 开源(MIT)agentic 模型,靠"长程任务一致性 + 极低价 + Claude Code 适配"在国内开源赛道站稳第一梯队;但其"全球开源第一""胜过 Claude Code"几乎全是未经第三方验证的自报分,独立基准(XSCT)只给中游,幻觉与抢答是公认硬伤。
| 维度 | 🟣 MiMo-V2.5-Pro | 🟢 MiMo-V2-Pro(前代) |
|---|---|---|
| 发布日期 | 2026-04-22 | 2026-03-18(曾匿名 Hunter Alpha 上 OpenRouter) |
| 参数 | 1.02T MoE,激活 42B(FP8 E4M3) | >1T MoE,激活 42B |
| 上下文 | 1M(基础档 256K),输出 32K | 1M |
| 模态 | 主打文本/编码/agent;暂不支持视频/语音(全模态由 V2.5 承担) | 文本为主 |
| 开源协议 | ✅ MIT(可商用,开源权重) | 专有 / Proprietary |
| 知识截止 | 2025-05 | — |
国内实测认可"长程一致性 + 速度 + Claude Code 适配",但幻觉、抢答、CoT 冗长是公认硬伤;"胜过 Claude Code"为未经第三方验证自报。抓取局限:知乎/XSCT 正文 403;未找到 Reddit/HN 原生英文上手帖(可能因主要在国内/OpenRouter 流通)。
V2.5-Pro "无中断肝出 macOS"——4 小时连续生成 54 个应用、浏览器可真实冲浪,3D 像素农场游戏从零完整实现。
qbitai.com/2026/04/41051928 页苹果英文财报 PDF "精准概括重点",多模态准确识别检验报告和模糊 Switch 图片。但联网检索弱——遗漏小米17系列、把 2024 产品当 2025。
36kr.com/p/3779401615864584盛赞 Claude Code + MiMo-V2.5-Pro = 目前国内最适合 Claude Code 的组合;4.3h/672 次工具调用写完 SysY 编译器、11.5h/近 2000 次调用写 8000+ 行视频剪辑软件。
知乎/CSDN(摘要)前端代码生成"速度惊艳"、"说人话"优于 GPT-5.4;但幻觉率较高,"会凭空猜测接口文档导致代码出错",需求细节覆盖不如 GPT-5.4。结论:"备用的高效编码模型"。
80aj.com 深度实测普遍吐槽思考未完就抢答、中英文混输、无故声称"检测不到上下文"、超长 CoT 不提升实际表现(疑调参问题)。
linux.do/t/topic/2035378MiMo Code 宣称胜过 Claude Code 的分数全部为小米内部自报、未经第三方/Scale SEAL 验证;对标用 Sonnet 4.6 而非更强的 Opus;575 名开发者测试在小米自有基础设施内运行。
techtimes.com| 项 | 内容 |
|---|---|
| 开源 | V2.5 与 V2.5-Pro 均 MIT 开源权重(vs 上一代专有,重大转向) |
| 定价演变 | 初始 ¥7/¥21(0–256K);2026-05-27 永久降价 57–99%,新价约 $1.00/$3.00/缓存 $0.20。AA 实测计价 $0.435/$0.87/混合 $0.18 |
| MiMo Code(06-10) | 基于 OpenCode fork 的终端 agentic 工具,捆绑免费调用 V2.5-Pro |
| vs 上一代 | V2-Pro 当年靠"匿名免费 + 单周 5000 亿 token"打开局面;V2.5 延续低价开源 + 100 万亿免费 token 推广 |
| 指标 | MiMo-V2.5-Pro | 来源性质 / 对照 |
|---|---|---|
| AA 智能指数 | 54(同类 #2/89) | 三方 前代 V2-Pro 49 |
| ClawEval (pass³) agentic | 63.8–64%,~70K token/轨迹(省 40–60% token) | 自报 |
| SWE-Bench Pro(经 MiMo Code) | 62%(vs Sonnet 4.6 57%) | 自报·未经 SEAL 验证 |
| XSCT Bench 综合 | 84.9,#23/30(落后头部 5–6.6 分) | 独立·摘要 |
| 输出速度 | 标准 42.3 tps(AA 评偏慢、极啰嗦 92M token);UltraSpeed 1000+ tps | 两者勿混淆 |