综合多源实测(HN、X、独立评测者、中文公众号一手稿、B站、linux.do),两个模型走了截然不同的路线:GLM-5.2 在编码完成度/工程稳定性上领先、逼近 Opus 4.8,但慢;Kimi K2.7-Code 主打更快、思考 token 更省、前端视觉强,被普遍评为"提速不提智"。
参数规模、上下文、模态、开源协议、发布时间。Kimi 侧为高可信主源(HF 模型卡 / OpenRouter / 官网);GLM-5.2 部分规格依赖中文二手媒体多源交叉(非一手技术报告)。
| 维度 | 🟣 Kimi K2.7-Code | 🟢 GLM-5.2 |
|---|---|---|
| 定位 | 编码专用变体(构建于通用版 K2.6 之上) | 通用 + 编码,主打"真正可用的 1M 上下文" |
| 发布日期 | 2026-06-12 | 2026-06-13 |
| 架构 | MoE · 1T 总参 / 32B 激活 | MoE · 底层GLM-5系 744B 总参 / 40B 激活 |
| 专家配置 | 384 专家(8 选 1 + 1 共享)· 61 层 · MLA 注意力 | 256 专家 · DSA 稀疏注意力 + MLA |
| 上下文长度 | 256K | 1,000,000(输出上限 131,072) |
| 模态 | 多模态 · MoonViT 400M 视觉编码器(文/图/视频,视频标注 experimental) | 纯文本(无多模态) |
| 开源 / 协议 | ✅ 开源 · Modified MIT(HF 已放出,约 595GB 磁盘) | 计划 MIT 开源 · 权重"下周"放出(当前仅 Coding Plan 可用) |
| 采样参数 | 固定 temp 1.0 / top_p 0.95(强制 thinking) | 未特别约束 |
| 前代 | K2.6(2026-04-20)/ K2.5 | GLM-5(02-11)/ GLM-5.1 |
两家本代的差异化技术卖点。Kimi 侧重推理效率工程化,GLM 侧重长上下文与稀疏注意力。
本看板的重点。按渠道分组(HN / X / 独立评测 / 公众号 / B站 / linux.do),区分"对模型本身的实测" vs "对厂商跑分的质疑",每条标注情绪与原帖链接。抓取限制已诚实标注:Reddit 在本环境被拦截;linux.do / 知乎 / 小红书正文有登录墙,相关引述为搜索引擎索引摘要而非逐字原话。
用 K2.7-Code 把一个 177KB 的 OpenSSL 补丁从 3.3.1 rebase 到 3.5.7,指令很少却完成了这种非平凡 rebase,整个 API 约 $5–$10。
news.ycombinator.com/item?id=48502347为 ZenC 生成 libpq 封装,称其推理"像工程师在白板上推演",约 1 小时花 ~$4。但比 Claude 更啰嗦/解释型,Claude 更直接。
news.ycombinator.com/item?id=48502347"一种更为果断的感受,过度思考反复自我质疑的问题少了很多";复刻 macOS demo 有完整开机动画,"智能体小镇"文件架构清晰、分工合理。
智东西原文(网易转载)SVG 开机动画反复修改多次仍不理想,"和苹果 logo 没太大关系";one-shot 生成有 bug、画面无法渲染需多轮迭代;"距 GPT-5.5、Opus 4.8 仍有差距"。
智东西原文"Lunar Lander" 编程小游戏三模型对比,K2.7 垫底(GLM-5.2 🥇 > MiniMax M3 🥈 > K2.7 🥉)。
x.com/ivanfioravantiRuby 工程实测 86/100、约 $0.30、快近一倍;但不通过 with_instructions 发系统提示,相对 K2.6 是退步——"标榜 Code 专精版,却在通用版 K2.6 能处理的特性上退步"。
akitaonrails.com 全文横评帖给 K2.7 打 75 分,"能力原地踏步(相比 K2.6 无大跃进),但速度明显更快"——"提速不提智"是论坛代表性定调。另有帖称"过度思考明显减少,不弱于 DSv4Pro"。
linux.do/t/topic/2389471 · 2390290实测做完整落地页:"开发耗时增加,没有明显惊艳的提升。"——目前对 K2.7 最直接的负面体感。
B站搜索"橘鸦Juya Kimi K2.7 Code""GLM5.2 VS Kimi 2.7 Code"双任务横评:K2.7 在纯前端视觉效果(Canvas 火焰焚信动画)上表现突出;但全栈电商项目稳定性/完成度不及 GLM-5.2。
bilibili.com/video/BV1ecJp6zEzi"K2.7 更诚实但并没更强(more honest but not more capable)";自报跑分只对比 K2.6、回避对 Fable 5 的 SWE-Bench,"是刻意选择,不是疏忽",不会用于高风险架构决策。
handyai.substack.com · VentureBeat"YES!!! GLM-5.2 is here! I loved 5.1!" 三模型编码对比中 GLM-5.2 拿第一(胜 MiniMax M3、Kimi K2.7);用 Claude Code 复刻 Space Invaders 约用 2M tokens(含 cache)。
对比推文 · 实测推文Ruby 工程 87/100,A 级第 6 名,史上最大版本间跃升(GLM-5.1 仅 46 → 5.2 达 87);"全场最干净的依赖注入",API 用法对照源码零幻觉。
akitaonrails.com 全文A 级里最慢,耗时 43 分钟,因端点被限流(仅 12–55 tokens/秒);状态存储无容量上限、重启即失效、多 worker 不安全。
akitaonrails.com 全文机械天文钟"第一发就一口气写完整整 900 行骨架"、首版可直接运行、能自主发现 bug 后重写;3D 点球守门员动作"参考西甲门将生物力学论文、每帧旋转方向数值验证";实现 30+ 函数公式引擎、60 步撤销重做。
硅星人Pro原文(虎嗅转载)执行节奏失衡——"14 分钟仅停留在设计讨论和零散代码阶段",需手动触发"继续"才推进,易误以为卡死;界面审美偏弱;与 Claude 等顶尖模型"仍存在差距"。
硅星人Pro原文Unity C# 真实项目横评:GLM-5.2 明确超过 Kimi K2.7 Code,成为当前最强国产模型,完成质量逼近 Opus 4.8;"跻身第一梯队,长任务表现尤好"。
linux.do/t/topic/2395506 · 2394670代表性吐槽帖:推理链冗长、慢;会出现"模型自己意识到陷入死循环却跳不出来",思考过程让人难受;不过最终产出和工具调用正常。
linux.do/t/topic/2395375要吃满 1M 须把模型名填成 glm-5.2[1m] 并把上下文压缩配到 80%,否则用不到 1M;实测 ~400–500k 内准确性/指令遵循与 Claude 差距不大、幻觉极低,但满 1M 无人验证。
标题即结论:"速度快、幻觉低、不扯淡,但 Coding 能力不敌顶模"——与论坛"第一梯队但不及 Opus/Fable 5"判断一致。
bilibili.com/video/BV1sxJs6cEMS智谱发起"6/13–6/14 用 GLM-5.2 并在公众号/小红书/抖音晒体验抽 100 名送 1 月 Max"活动 —— 近两日小红书/公众号上的 GLM 正面"晒单"带奖励动机,原创实测可信度需显著打折。知乎多篇 zhuanlan(如"非常棒""测评汇总")疑似 AI 营销软文。
甄别提示,非具体评测API 定价、订阅方案、相对上一代变化、OpenRouter 用量。⚠️ GLM-5.2 专属 API 价本轮未公布("下周"上线),下表 GLM 的 OpenRouter 价为上一代 GLM-5。
| 模型 | 官方价 | OpenRouter 价 | 备注 |
|---|---|---|---|
| Kimi K2.7-Code | $0.95 / $4.00(缓存命中 $0.19) | $0.75 / $3.50 | 人民币约 6.5元 / 27元;缓存 1.3元。与 K2.6 同价。 |
| Kimi K2.6(前代) | — | $0.68 / $3.41 | 一代前 |
| GLM-5.2 | 下周上线 | 未上架 | 当前仅经 GLM Coding Plan 订阅分发 |
| GLM-5(前代) | — | $0.60 / $1.92 | 一代前·GLM 系明显更便宜 |
| 套餐 | 价格 | 含 GLM-5/5.2 | 额度(社区实测) |
|---|---|---|---|
| Lite | ¥49/月(年付≈¥34) | ❌ 仅 GLM-4.7/4.6 | — |
| Pro | ¥149/月(年付≈¥104) | ✅ | 5h 非高峰约 6000 万 token |
| Max | ¥469/月(年付≈¥328) | ✅ | 5h 约 2 亿 token、周上限约 10 亿,"够全职开发" |
⚠️ 本代独立第三方分尚未沉淀:Kimi K2.7-Code 仅有厂商自报、GLM-5.2 发布即零基准。下方可比的独立分主要属一代前模型(K2.6 / GLM-5),务必按代际阅读。
| 模型 | Artificial Analysis | LMArena | 其它 |
|---|---|---|---|
| Kimi K2.6(非 K2.7!) | Intelligence Index 54,排名 #4(落后 Anthropic/Google/OpenAI 的 57) | — | GDPval-AA agentic Elo 1520(vs K2.5 的 1309,大涨) |
| 智谱 GLM-5(非 5.2!) | Intelligence Index v4.0 50,开源权重榜首 | Text Arena & Code Arena 均 #1 开源模型 | — |
| Kimi K2.7-Code 自报 | 分数(vs K2.6) |
|---|---|
| Kimi Code Bench v2 | 62.0 vs 50.9(+21.8%) |
| MLS Bench Lite | 35.1 vs 26.7(+31.5%) |
| MCP Mark Verified | 81.1 vs 72.8(+8.3%,注:部分二手源误标 +11.4%) |
| Program Bench | +11%(但绝对值 53.6,落后 GPT-5.5 的 69.1) |