国内 · 月之暗面 Moonshot · 代际评测
Kimi K2.7-CodevsKimi K2.6
2026-06-12 发布 · 构建于通用版 K2.6 之上的编码专用变体,主打更快、省思考 token
📅 看板更新 2026-06-15🟣 K2.7-Code 发布 2026-06-12🟢 前代 K2.6(2026-04-20,通用版)🔎 来源:官方+AA三方+HN/AkitaOnRails/智东西/linux.do 实测
⚠️ 关系厘清:"Kimi 2.7"的真身是编码专用变体 K2.7-Code,构建在 4 月发布的通用版 K2.6 之上,继承同一套 1T/32B MoE 架构。关闭 thinking 模式会自动回退到 K2.6。独立分(AA Index 54、GDPval 1520)都属 K2.6;K2.7-Code 本代仅有厂商自报、未提交独立评测。
总览 · 一句话定论
K2.7-Code 是在通用版 K2.6 上做的编码专用变体,更快、思考 token 砍约 30%、过度思考明显减少、前端视觉强;但被普遍评为"提速不提智"——自报编码跑分大涨却未提交独立评测,且独立实测发现它在通用版 K2.6 能处理的部分特性上反而退步。
对标定论(vs K2.6)
编码(自报)Kimi Code Bench v2 50.9→62.0(+21.8%)K2.7 优(自报)
速度 / 效率砍 30% 思考 token、过度思考减少、更果断K2.7 优
通用能力 / 指令遵循独立实测发现不发系统提示等退步,"提速不提智"退步/持平
多模态 / 架构继承 K2.6 同套 MoE + MoonViT持平
独立验证K2.6 有 AA #4;K2.7 本代未提交独立评测缺
① 模型基本信息
| 维度 | 🟣 Kimi K2.7-Code | 🟢 Kimi K2.6(前代/底座) |
| 发布日期 | 2026-06-12 | 2026-04-20 |
| 定位 | 编码专用变体(构建于 K2.6 之上) | 通用旗舰 |
| 架构 | MoE · 1T 总 / 32B 激活 · 384 专家(8+1 共享) · 61 层 · MLA | 同套架构 |
| 上下文 | 256K | 256K |
| 模态 | 多模态 · MoonViT 400M 视觉编码器(继承 K2.6) | 多模态(文/图/视频) |
| 开源 / 协议 | ✅ Modified MIT(HF 已放出,约 595GB) | ✅ Modified MIT |
| 采样 / 模式 | 强制 thinking、固定 temp 1.0 / top_p 0.95;关闭则回退 K2.6 | 常规 |
② 创新技术(K2.7-Code 相对 K2.6 的改动)
- 编码专用微调:在 K2.6 底座上针对编码/agentic 强化。
- 强制 thinking 推理模式:模型卡硬编码 forces thinking / preserve_thinking=True;在 Kimi Code 内手动关闭会回退到 K2.6 而非报错。
- 思考 token 砍约 30%:在保持/提升能力的同时降低 production agent loop 推理开销——被实测者(Handy AI)认可"真正解决成本问题"的点。
- 固定采样参数(temp 1.0 / top_p 0.95),降低调参不确定性。
- 据报道能写出真正手写的 Triton kernel(K2.6 多为套库封装)。
③ 实测口碑 核心模块
一致信号:相对 K2.6 更快、过度思考减少、前端视觉强;但"提速不提智"、通用特性有退步、自报跑分遭质疑。抓取局限:linux.do/知乎登录墙,相关条目为搜索摘要转述;Reddit 本环境被拦截。
正面负面中性/混合
正面 / 提升(vs K2.6)
智东西 / 陈骏达公众号·一手更果断
"一种更为果断的感受,过度思考反复自我质疑的问题少了很多";复刻 macOS demo 有完整开机动画,"智能体小镇"文件架构清晰。
智东西(网易转载)
pizlonator / nobleachHacker News正面
把 177KB OpenSSL 补丁 rebase(约 $5–10);为 ZenC 生成 libpq 封装、推理"像工程师在白板上推演"(约 $4)。
HN item?id=48502347
负面 / 退步 / 质疑
AkitaOnRails独立博客·实测相对 K2.6 退步
Ruby 工程 86/100、约 $0.30、快近一倍;但不通过 with_instructions 发系统提示,相对 K2.6 是退步——"标榜 Code 专精版,却在通用版 K2.6 能处理的特性上退步了"。
akitaonrails.com
橘鸦JuyaB站 UP主无惊艳
实测做完整落地页:"开发耗时增加,没有明显惊艳的提升。"
B站(橘鸦Juya)
Handy AI / VentureBeat质疑·非实测跑分质疑
"K2.7 更诚实但并没更强(more honest but not more capable)";自报跑分只对比 K2.6、回避对 Fable 5 的 SWE-Bench,"是刻意选择"。
VentureBeat
实测共识(vs K2.6)
- 更快、过度思考减少、前端视觉强、性价比好。
- "提速不提智":通用特性有退步(不发系统提示)、指令遵循延续 K2.6 老毛病。
- 自报编码大涨但未提交 SWE-bench / DeepSWE 等独立评测。
④ 商业化
| 模型 | 官方价 / OpenRouter(in/out 每百万) | 备注 |
| K2.7-Code | 官方 $0.95/$4.00(缓存 $0.19);OpenRouter $0.75/$3.50 | 人民币约 6.5元/27元;缓存 1.3元。随 KimiCode 套餐上线 |
| K2.6(前代) | OpenRouter $0.68/$3.41 | — |
vs 上一代:价格基本持平 K2.6("略微涨价"指相对更早版本);思考 token 砍 30% → 实际成本下降。预告 6 倍极速版 API(高速版约 180–260 Token/s),并接入 opencode go 等第三方。
⑤ Benchmark
K2.7-Code 自报(仅对比 K2.6)厂商自报
| 基准 | K2.7-Code | K2.6 |
| Kimi Code Bench v2 | 62.0 | 50.9(+21.8%) |
| MLS Bench Lite | 35.1 | 26.7(+31.5%) |
| MCP Mark Verified | 81.1 | 72.8(+8.3%) |
| Program Bench | 53.6(落后 GPT-5.5 的 69.1) | +11% |
独立第三方(属 K2.6)一代前
| AA Intelligence Index | K2.6 = 54,排名 #4(落后 Anthropic/Google/OpenAI 的 57) |
| GDPval-AA(agentic Elo) | K2.6 = 1520(vs K2.5 的 1309,大涨) |
关键问题:K2.7-Code 三项跑分全为 Moonshot 自家闭源 benchmark、仅对比上一代、未提交 SWE-Bench / DeepSWE 等独立评测,回避对 Fable 5/Opus 4.8/GPT-5.5 的标准对比——从业者据此质疑"benchmarks don't check out"。