国内 · 月之暗面 Moonshot · 代际评测

Kimi K2.7-CodevsKimi K2.6

2026-06-12 发布 · 构建于通用版 K2.6 之上的编码专用变体，主打更快、省思考 token

📅 看板更新 2026-06-15🟣 K2.7-Code 发布 2026-06-12🟢 前代 K2.6（2026-04-20，通用版）🔎 来源：官方+AA三方+HN/AkitaOnRails/智东西/linux.do 实测

总览 · 一句话定论

K2.7-Code 是在通用版 K2.6 上做的编码专用变体，更快、思考 token 砍约 30%、过度思考明显减少、前端视觉强；但被普遍评为"提速不提智"——自报编码跑分大涨却未提交独立评测，且独立实测发现它在通用版 K2.6 能处理的部分特性上反而退步。

对标定论（vs K2.6）

编码（自报）Kimi Code Bench v2 50.9→62.0（+21.8%）K2.7 优(自报)

速度 / 效率砍 30% 思考 token、过度思考减少、更果断K2.7 优

通用能力 / 指令遵循独立实测发现不发系统提示等退步，"提速不提智"退步/持平

多模态 / 架构继承 K2.6 同套 MoE + MoonViT持平

独立验证K2.6 有 AA #4；K2.7 本代未提交独立评测缺

另见跨厂商横评：Kimi K2.7-Code vs GLM-5.2（国产编码横评）

① 模型基本信息

维度	🟣 Kimi K2.7-Code	🟢 Kimi K2.6（前代/底座）
发布日期	2026-06-12	2026-04-20
定位	编码专用变体（构建于 K2.6 之上）	通用旗舰
架构	MoE · 1T 总 / 32B 激活 · 384 专家(8+1 共享) · 61 层 · MLA	同套架构
上下文	256K	256K
模态	多模态 · MoonViT 400M 视觉编码器（继承 K2.6）	多模态（文/图/视频）
开源 / 协议	✅ Modified MIT（HF 已放出，约 595GB）	✅ Modified MIT
采样 / 模式	强制 thinking、固定 temp 1.0 / top_p 0.95；关闭则回退 K2.6	常规

② 创新技术（K2.7-Code 相对 K2.6 的改动）

编码专用微调：在 K2.6 底座上针对编码/agentic 强化。
强制 thinking 推理模式：模型卡硬编码 forces thinking / preserve_thinking=True；在 Kimi Code 内手动关闭会回退到 K2.6 而非报错。
思考 token 砍约 30%：在保持/提升能力的同时降低 production agent loop 推理开销——被实测者（Handy AI）认可"真正解决成本问题"的点。
固定采样参数（temp 1.0 / top_p 0.95），降低调参不确定性。
据报道能写出真正手写的 Triton kernel（K2.6 多为套库封装）。

③ 实测口碑核心模块

一致信号：相对 K2.6 更快、过度思考减少、前端视觉强；但"提速不提智"、通用特性有退步、自报跑分遭质疑。抓取局限：linux.do/知乎登录墙，相关条目为搜索摘要转述；Reddit 本环境被拦截。

正面负面中性/混合

正面 / 提升（vs K2.6）

智东西 / 陈骏达公众号·一手更果断

"一种更为果断的感受，过度思考反复自我质疑的问题少了很多"；复刻 macOS demo 有完整开机动画，"智能体小镇"文件架构清晰。

智东西（网易转载）

pizlonator / nobleachHacker News正面

把 177KB OpenSSL 补丁 rebase（约 $5–10）；为 ZenC 生成 libpq 封装、推理"像工程师在白板上推演"（约 $4）。

HN item?id=48502347

linux.dolinux.do·摘要更快

"相比 K2.6 过度思考明显减少、速度很快，在自己项目里至少不弱于 DSv4Pro，甚至更强"。

linux.do/t/topic/2390290

SmallMainlinux.do·逐字(86赞)完成度高但慢

Unity C# 横评（42 模型同题）：Kimi K2.7 Code 完成度列 Tier 1（国产第一梯队，仅次 GLM5.2 之后、与 GPT5.5-high 同档）；但耗时 39 分钟、倒数第二慢（仅快于 GLM5.2 的 45 分钟）——重任务下"快"的口碑并不成立。

linux.do/t/topic/2395506

负面 / 退步 / 质疑

AkitaOnRails独立博客·实测相对 K2.6 退步

Ruby 工程 86/100、约 $0.30、快近一倍；但不通过 with_instructions 发系统提示，相对 K2.6 是退步——"标榜 Code 专精版，却在通用版 K2.6 能处理的特性上退步了"。

akitaonrails.com

linux.do 横评 75 分linux.do·摘要提速不提智

给 K2.7 打 75 分，"能力原地踏步（相比 K2.6 无大跃进），但速度明显更快"——"提速不提智"是论坛代表性定调。

linux.do/t/topic/2389471

橘鸦JuyaB站 UP主无惊艳

实测做完整落地页："开发耗时增加，没有明显惊艳的提升。"

B站（橘鸦Juya）

Handy AI / VentureBeat质疑·非实测跑分质疑

"K2.7 更诚实但并没更强（more honest but not more capable）"；自报跑分只对比 K2.6、回避对 Fable 5 的 SWE-Bench，"是刻意选择"。

VentureBeat

实测共识（vs K2.6）

更快、过度思考减少、前端视觉强、性价比好。
"提速不提智"：通用特性有退步（不发系统提示）、指令遵循延续 K2.6 老毛病。
自报编码大涨但未提交 SWE-bench / DeepSWE 等独立评测。

④ 商业化

模型	官方价 / OpenRouter（in/out 每百万）	备注
K2.7-Code	官方 $0.95/$4.00（缓存 $0.19）；OpenRouter $0.75/$3.50	人民币约 6.5元/27元；缓存 1.3元。随 KimiCode 套餐上线
K2.6（前代）	OpenRouter $0.68/$3.41	—

vs 上一代：价格基本持平 K2.6（"略微涨价"指相对更早版本）；思考 token 砍 30% → 实际成本下降。预告 6 倍极速版 API（高速版约 180–260 Token/s），并接入 opencode go 等第三方。

⑤ Benchmark

K2.7-Code 自报（仅对比 K2.6）厂商自报

基准	K2.7-Code	K2.6
Kimi Code Bench v2	62.0	50.9（+21.8%）
MLS Bench Lite	35.1	26.7（+31.5%）
MCP Mark Verified	81.1	72.8（+8.3%）
Program Bench	53.6（落后 GPT-5.5 的 69.1）	+11%

独立第三方（属 K2.6）一代前

AA Intelligence Index	K2.6 = 54，排名 #4（落后 Anthropic/Google/OpenAI 的 57）
GDPval-AA（agentic Elo）	K2.6 = 1520（vs K2.5 的 1309，大涨）

关键问题：K2.7-Code 三项跑分全为 Moonshot 自家闭源 benchmark、仅对比上一代、未提交 SWE-Bench / DeepSWE 等独立评测，回避对 Fable 5/Opus 4.8/GPT-5.5 的标准对比——从业者据此质疑"benchmarks don't check out"。