投研看板LLM 跟踪评价小米 MiMo-V2.5-Pro
国内 · 小米 Xiaomi MiMo · 代际评测

MiMo-V2.5-ProvsMiMo-V2-Pro

2026-04-22 开源 · 1.02T MoE / MIT,主打长程 agentic;6 月衍生 UltraSpeed + MiMo Code
📅 看板更新 2026-06-15🟣 V2.5-Pro 发布 2026-04-22🟢 前代 V2-Pro(03-18)🔎 来源:AA三方+量子位/36氪/80aj/linux.do实测

总览 · 一句话定论

MiMo-V2.5-Pro 是小米最强的 1T MoE 开源(MIT)agentic 模型,靠"长程任务一致性 + 极低价 + Claude Code 适配"在国内开源赛道站稳第一梯队;但其"全球开源第一""胜过 Claude Code"几乎全是未经第三方验证的自报分,独立基准(XSCT)只给中游,幻觉与抢答是公认硬伤。

对标定论(vs V2-Pro)

开源 / 商业化专有→MIT、永久降价 57–99%、捆绑免费 MiMo Code大幅优
Agent / 长任务智能指数 49→54,专为长程工具调用优化
模态V2.5 原生全模态;但 V2.5-Pro 暂不支持视频/语音优(有注)
Infra / 速度UltraSpeed 通用 GPU 破 1000 tps(限量内测+3×价)
严谨性 / 幻觉实测仍报幻觉、抢答、CoT 冗长未明显改善

模型基本信息

维度🟣 MiMo-V2.5-Pro🟢 MiMo-V2-Pro(前代)
发布日期2026-04-222026-03-18(曾匿名 Hunter Alpha 上 OpenRouter)
参数1.02T MoE,激活 42B(FP8 E4M3)>1T MoE,激活 42B
上下文1M(基础档 256K),输出 32K1M
模态主打文本/编码/agent;暂不支持视频/语音(全模态由 V2.5 承担)文本为主
开源协议MIT(可商用,开源权重)专有 / Proprietary
知识截止2025-05
代际关键变化:协议从专有 → MIT 完全开源(重大利好);智能指数 49→54;定位从"通用对话"转向"agentic 智能体/长任务执行"。

创新技术

实测口碑 核心模块

国内实测认可"长程一致性 + 速度 + Claude Code 适配",但幻觉、抢答、CoT 冗长是公认硬伤;"胜过 Claude Code"为未经第三方验证自报。抓取局限:知乎/XSCT 正文 403;未找到 Reddit/HN 原生英文上手帖(可能因主要在国内/OpenRouter 流通)。

正面负面中性/混合
正面 / 实测
量子位公众号·实测正面

V2.5-Pro "无中断肝出 macOS"——4 小时连续生成 54 个应用、浏览器可真实冲浪,3D 像素农场游戏从零完整实现。

qbitai.com/2026/04/410519
36氪媒体·实测正面有保留

28 页苹果英文财报 PDF "精准概括重点",多模态准确识别检验报告和模糊 Switch 图片。但联网检索弱——遗漏小米17系列、把 2024 产品当 2025。

36kr.com/p/3779401615864584
知乎/CSDN 摘要摘要转述组合推荐

盛赞 Claude Code + MiMo-V2.5-Pro = 目前国内最适合 Claude Code 的组合;4.3h/672 次工具调用写完 SysY 编译器、11.5h/近 2000 次调用写 8000+ 行视频剪辑软件。

知乎/CSDN(摘要)
负面 / 质疑
80aj 深度实测博客·已读全文幻觉高

前端代码生成"速度惊艳"、"说人话"优于 GPT-5.4;但幻觉率较高,"会凭空猜测接口文档导致代码出错",需求细节覆盖不如 GPT-5.4。结论:"备用的高效编码模型"。

80aj.com 深度实测
linux.do《进步不错,问题也大》linux.do·摘要抢答/混输

普遍吐槽思考未完就抢答、中英文混输、无故声称"检测不到上下文"、超长 CoT 不提升实际表现(疑调参问题)。

linux.do/t/topic/2035378
TechTimes媒体·质疑自报分

MiMo Code 宣称胜过 Claude Code 的分数全部为小米内部自报、未经第三方/Scale SEAL 验证;对标用 Sonnet 4.6 而非更强的 Opus;575 名开发者测试在小米自有基础设施内运行。

techtimes.com

实测共识 vs 跑分质疑

商业化

内容
开源V2.5 与 V2.5-Pro 均 MIT 开源权重(vs 上一代专有,重大转向)
定价演变初始 ¥7/¥21(0–256K);2026-05-27 永久降价 57–99%,新价约 $1.00/$3.00/缓存 $0.20。AA 实测计价 $0.435/$0.87/混合 $0.18
MiMo Code(06-10)基于 OpenCode fork 的终端 agentic 工具,捆绑免费调用 V2.5-Pro
vs 上一代V2-Pro 当年靠"匿名免费 + 单周 5000 亿 token"打开局面;V2.5 延续低价开源 + 100 万亿免费 token 推广

Benchmark

指标MiMo-V2.5-Pro来源性质 / 对照
AA 智能指数54(同类 #2/89)三方 前代 V2-Pro 49
ClawEval (pass³) agentic63.8–64%,~70K token/轨迹(省 40–60% token)自报
SWE-Bench Pro(经 MiMo Code)62%(vs Sonnet 4.6 57%)自报·未经 SEAL 验证
XSCT Bench 综合84.9,#23/30(落后头部 5–6.6 分)独立·摘要
输出速度标准 42.3 tps(AA 评偏慢、极啰嗦 92M token);UltraSpeed 1000+ tps两者勿混淆
速度矛盾点:AA 实测标准版仅 42.3 tps、TTFT 3.58s(偏慢);6 月 UltraSpeed 才达 1000 tps,但限量内测。自报 benchmark 与独立结果(XSCT #23)矛盾大,缺第三方权威验证(未上 Scale SEAL)。