国内 · 小米 Xiaomi MiMo · 代际评测

MiMo-V2.5-ProvsMiMo-V2-Pro

2026-04-22 开源 · 1.02T MoE / MIT，主打长程 agentic；6 月衍生 UltraSpeed + MiMo Code

📅 看板更新 2026-06-15🟣 V2.5-Pro 发布 2026-04-22🟢 前代 V2-Pro（03-18）🔎 来源：AA三方+量子位/36氪/80aj/linux.do实测

总览 · 一句话定论

MiMo-V2.5-Pro 是小米最强的 1T MoE 开源（MIT）agentic 模型，靠"长程任务一致性 + 极低价 + Claude Code 适配"在国内开源赛道站稳第一梯队；但其"全球开源第一""胜过 Claude Code"几乎全是未经第三方验证的自报分，独立基准（XSCT）只给中游，幻觉与抢答是公认硬伤。

对标定论（vs V2-Pro）

开源 / 商业化专有→MIT、永久降价 57–99%、捆绑免费 MiMo Code大幅优

Agent / 长任务智能指数 49→54，专为长程工具调用优化优

模态V2.5 原生全模态；但 V2.5-Pro 暂不支持视频/语音优(有注)

Infra / 速度UltraSpeed 通用 GPU 破 1000 tps（限量内测+3×价）优

严谨性 / 幻觉实测仍报幻觉、抢答、CoT 冗长未明显改善

① 模型基本信息

维度	🟣 MiMo-V2.5-Pro	🟢 MiMo-V2-Pro（前代）
发布日期	2026-04-22	2026-03-18（曾匿名 Hunter Alpha 上 OpenRouter）
参数	1.02T MoE，激活 42B（FP8 E4M3）	>1T MoE，激活 42B
上下文	1M（基础档 256K），输出 32K	1M
模态	主打文本/编码/agent；暂不支持视频/语音（全模态由 V2.5 承担）	文本为主
开源协议	✅ MIT（可商用，开源权重）	专有 / Proprietary
知识截止	2025-05	—

代际关键变化：协议从专有 → MIT 完全开源（重大利好）；智能指数 49→54；定位从"通用对话"转向"agentic 智能体/长任务执行"。

② 创新技术

架构：1.02T MoE / 42B 激活的混合注意力（Sliding Window + Global Attention 5:1 交织）；FP8 混合精度、MTP + RL 偏重推理。
UltraSpeed / TileRT（06-09，核心 infra）：8 卡通用 GPU（非定制芯片）上让 1T 模型破 1000+ tokens/s（约标准版 10×），靠 ① MXFP4 量化（仅 MoE 专家层 FP4+QAT）② DFlash 投机解码 ③ TileRT 运行时（Persistent Engine Kernel + Warp Specialization）。代价：定价约标准版 3×。厂商自报
小米承诺三年投入至少 87 亿美元于 AI。

③ 实测口碑核心模块

国内实测认可"长程一致性 + 速度 + Claude Code 适配"，但幻觉、抢答、CoT 冗长是公认硬伤；"胜过 Claude Code"为未经第三方验证自报。抓取局限：知乎/XSCT 正文 403；未找到 Reddit/HN 原生英文上手帖（可能因主要在国内/OpenRouter 流通）。

正面负面中性/混合

正面 / 实测

量子位公众号·实测正面

V2.5-Pro "无中断肝出 macOS"——4 小时连续生成 54 个应用、浏览器可真实冲浪，3D 像素农场游戏从零完整实现。

qbitai.com/2026/04/410519

36氪媒体·实测正面有保留

28 页苹果英文财报 PDF "精准概括重点"，多模态准确识别检验报告和模糊 Switch 图片。但联网检索弱——遗漏小米17系列、把 2024 产品当 2025。

36kr.com/p/3779401615864584

知乎/CSDN 摘要摘要转述组合推荐

盛赞 Claude Code + MiMo-V2.5-Pro = 目前国内最适合 Claude Code 的组合；4.3h/672 次工具调用写完 SysY 编译器、11.5h/近 2000 次调用写 8000+ 行视频剪辑软件。

知乎/CSDN（摘要）

负面 / 质疑

80aj 深度实测博客·已读全文幻觉高

前端代码生成"速度惊艳"、"说人话"优于 GPT-5.4；但幻觉率较高，"会凭空猜测接口文档导致代码出错"，需求细节覆盖不如 GPT-5.4。结论："备用的高效编码模型"。

80aj.com 深度实测

linux.do《进步不错，问题也大》linux.do·摘要抢答/混输

普遍吐槽思考未完就抢答、中英文混输、无故声称"检测不到上下文"、超长 CoT 不提升实际表现（疑调参问题）。

linux.do/t/topic/2035378

TechTimes媒体·质疑自报分

MiMo Code 宣称胜过 Claude Code 的分数全部为小米内部自报、未经第三方/Scale SEAL 验证；对标用 Sonnet 4.6 而非更强的 Opus；575 名开发者测试在小米自有基础设施内运行。

techtimes.com

SmallMainlinux.do·逐字(86赞)慢+Tier 2

Unity C# 横评（42 模型同题）：Mimo V2.5 Pro 速度倒数第三（37 分钟），完成度列 Tier 2（"明显功能错误/遗漏"），落后 GLM5.2/Kimi K2.7（Tier 1）；普通版 Mimo V2.5 更降至 Tier 3。

linux.do/t/topic/2395506

实测共识 vs 跑分质疑

长程任务一致性、速度、Claude Code 适配获国内一致好评。
幻觉、抢答、CoT 冗长是硬伤。
独立 XSCT Bench 仅给中游 #23/30（84.9），与"全球开源第一"口径冲突。

④ 商业化

项	内容
开源	V2.5 与 V2.5-Pro 均 MIT 开源权重（vs 上一代专有，重大转向）
定价演变	初始 ¥7/¥21（0–256K）；2026-05-27 永久降价 57–99%，新价约 $1.00/$3.00/缓存 $0.20。AA 实测计价 $0.435/$0.87/混合 $0.18
MiMo Code（06-10）	基于 OpenCode fork 的终端 agentic 工具，捆绑免费调用 V2.5-Pro
vs 上一代	V2-Pro 当年靠"匿名免费 + 单周 5000 亿 token"打开局面；V2.5 延续低价开源 + 100 万亿免费 token 推广

⑤ Benchmark

指标	MiMo-V2.5-Pro	来源性质 / 对照
AA 智能指数	54（同类 #2/89）	三方前代 V2-Pro 49
ClawEval (pass³) agentic	63.8–64%，~70K token/轨迹（省 40–60% token）	自报
SWE-Bench Pro（经 MiMo Code）	62%（vs Sonnet 4.6 57%）	自报·未经 SEAL 验证
XSCT Bench 综合	84.9，#23/30（落后头部 5–6.6 分）	独立·摘要
输出速度	标准 42.3 tps（AA 评偏慢、极啰嗦 92M token）；UltraSpeed 1000+ tps	两者勿混淆

速度矛盾点：AA 实测标准版仅 42.3 tps、TTFT 3.58s（偏慢）；6 月 UltraSpeed 才达 1000 tps，但限量内测。自报 benchmark 与独立结果（XSCT #23）矛盾大，缺第三方权威验证（未上 Scale SEAL）。