投研看板LLM 跟踪评价Kimi K2.7-Code
国内 · 月之暗面 Moonshot · 代际评测

Kimi K2.7-CodevsKimi K2.6

2026-06-12 发布 · 构建于通用版 K2.6 之上的编码专用变体,主打更快、省思考 token
📅 看板更新 2026-06-15🟣 K2.7-Code 发布 2026-06-12🟢 前代 K2.6(2026-04-20,通用版)🔎 来源:官方+AA三方+HN/AkitaOnRails/智东西/linux.do 实测

总览 · 一句话定论

K2.7-Code 是在通用版 K2.6 上做的编码专用变体,更快、思考 token 砍约 30%、过度思考明显减少、前端视觉强;但被普遍评为"提速不提智"——自报编码跑分大涨却未提交独立评测,且独立实测发现它在通用版 K2.6 能处理的部分特性上反而退步

对标定论(vs K2.6)

编码(自报)Kimi Code Bench v2 50.9→62.0(+21.8%)K2.7 优(自报)
速度 / 效率砍 30% 思考 token、过度思考减少、更果断K2.7 优
通用能力 / 指令遵循独立实测发现不发系统提示等退步,"提速不提智"退步/持平
多模态 / 架构继承 K2.6 同套 MoE + MoonViT持平
独立验证K2.6 有 AA #4;K2.7 本代未提交独立评测

模型基本信息

维度🟣 Kimi K2.7-Code🟢 Kimi K2.6(前代/底座)
发布日期2026-06-122026-04-20
定位编码专用变体(构建于 K2.6 之上)通用旗舰
架构MoE · 1T 总 / 32B 激活 · 384 专家(8+1 共享) · 61 层 · MLA同套架构
上下文256K256K
模态多模态 · MoonViT 400M 视觉编码器(继承 K2.6)多模态(文/图/视频)
开源 / 协议✅ Modified MIT(HF 已放出,约 595GB)✅ Modified MIT
采样 / 模式强制 thinking、固定 temp 1.0 / top_p 0.95;关闭则回退 K2.6常规

创新技术(K2.7-Code 相对 K2.6 的改动)

实测口碑 核心模块

一致信号:相对 K2.6 更快、过度思考减少、前端视觉强;但"提速不提智"、通用特性有退步、自报跑分遭质疑。抓取局限:linux.do/知乎登录墙,相关条目为搜索摘要转述;Reddit 本环境被拦截。

正面负面中性/混合
正面 / 提升(vs K2.6)
智东西 / 陈骏达公众号·一手更果断

"一种更为果断的感受,过度思考反复自我质疑的问题少了很多";复刻 macOS demo 有完整开机动画,"智能体小镇"文件架构清晰。

智东西(网易转载)
pizlonator / nobleachHacker News正面

把 177KB OpenSSL 补丁 rebase(约 $5–10);为 ZenC 生成 libpq 封装、推理"像工程师在白板上推演"(约 $4)。

HN item?id=48502347
linux.dolinux.do·摘要更快

"相比 K2.6 过度思考明显减少、速度很快,在自己项目里至少不弱于 DSv4Pro,甚至更强"。

linux.do/t/topic/2390290
负面 / 退步 / 质疑
AkitaOnRails独立博客·实测相对 K2.6 退步

Ruby 工程 86/100、约 $0.30、快近一倍;但不通过 with_instructions 发系统提示,相对 K2.6 是退步——"标榜 Code 专精版,却在通用版 K2.6 能处理的特性上退步了"。

akitaonrails.com
linux.do 横评 75 分linux.do·摘要提速不提智

给 K2.7 打 75 分,"能力原地踏步(相比 K2.6 无大跃进),但速度明显更快"——"提速不提智"是论坛代表性定调。

linux.do/t/topic/2389471
橘鸦JuyaB站 UP主无惊艳

实测做完整落地页:"开发耗时增加,没有明显惊艳的提升。"

B站(橘鸦Juya)
Handy AI / VentureBeat质疑·非实测跑分质疑

"K2.7 更诚实但并没更强(more honest but not more capable)";自报跑分只对比 K2.6、回避对 Fable 5 的 SWE-Bench,"是刻意选择"。

VentureBeat

实测共识(vs K2.6)

商业化

模型官方价 / OpenRouter(in/out 每百万)备注
K2.7-Code官方 $0.95/$4.00(缓存 $0.19);OpenRouter $0.75/$3.50人民币约 6.5元/27元;缓存 1.3元。随 KimiCode 套餐上线
K2.6(前代)OpenRouter $0.68/$3.41
vs 上一代:价格基本持平 K2.6("略微涨价"指相对更早版本);思考 token 砍 30% → 实际成本下降。预告 6 倍极速版 API(高速版约 180–260 Token/s),并接入 opencode go 等第三方。

Benchmark

K2.7-Code 自报(仅对比 K2.6)厂商自报

基准K2.7-CodeK2.6
Kimi Code Bench v262.050.9(+21.8%)
MLS Bench Lite35.126.7(+31.5%)
MCP Mark Verified81.172.8(+8.3%)
Program Bench53.6(落后 GPT-5.5 的 69.1)+11%

独立第三方(属 K2.6)一代前

AA Intelligence IndexK2.6 = 54,排名 #4(落后 Anthropic/Google/OpenAI 的 57)
GDPval-AA(agentic Elo)K2.6 = 1520(vs K2.5 的 1309,大涨)
关键问题:K2.7-Code 三项跑分全为 Moonshot 自家闭源 benchmark、仅对比上一代、未提交 SWE-Bench / DeepSWE 等独立评测,回避对 Fable 5/Opus 4.8/GPT-5.5 的标准对比——从业者据此质疑"benchmarks don't check out"。