国内 · 智谱 Zhipu AI · 代际评测

GLM-5.2vsGLM-5.1 / GLM-5

2026-06-13 发布 · 主打"真正可用的 1M 上下文"，编码完成度逼近 Opus 4.8

📅 看板更新 2026-06-15🟢 GLM-5.2 发布 2026-06-13⬜ 前代 GLM-5（02-11）/ GLM-5.1🔎 来源：官方+AkitaOnRails/ivanfioravanti/硅星人Pro/linux.do 实测

总览 · 一句话定论

GLM-5.2（底层 GLM-5 系 744B/40B MoE，主打 1M 上下文）相对上一代是编码完成度/工程稳定性的大幅跃升——独立横评从 GLM-5.1 的 46 分跳到 87 分（史上最大版本间跃升），逼近 Opus 4.8；但慢（限流、推理啰嗦、偶发死循环）、发布即零基准、1M 满载无人验证、API 与开源权重仍是"下周"计划态。

对标定论（vs GLM-5.1 / GLM-5）

编码完成度AkitaOnRails 46→87（+41，史上最大跃升）、逼近 Opus 4.85.2 大幅优

长上下文主打 1M（实测 ~400–500k 内可靠、幻觉极低）5.2 优满1M待验证

速度 / 延迟限流、43 分钟、推理链冗长、偶发死循环退步/硬伤

跑分透明度GLM-5 有 #1 开源记录；GLM-5.2 发布即零基准退步

交付状态先开 Coding Plan；API + MIT 权重"下周"计划态

① 模型基本信息

维度	🟢 GLM-5.2	⬜ GLM-5 / GLM-5.1（前代）
发布日期	2026-06-13（先向 Coding Plan 全量用户开放）	GLM-5：2026-02-11；GLM-5.1 其后
架构	底层 GLM-5 系 744B 总 / 40B 激活 MoE · 256 专家 · DSA+MLA	同系 GLM-5
上下文 / 输出	1M / 输出上限 131,072	较短
模态	纯文本（无多模态）	纯文本
开源 / 协议	计划 MIT 开源 · 权重"下周"放出（当前仅 Coding Plan 可用）	GLM-5 已开源（开源权重榜首）
分发	GLM Coding Plan（Lite/Pro/Max/团队版）；API"下周"	已有 API + OpenRouter

缺口：GLM-5.2 相对 GLM-5/5.1 的具体架构改动、是否仍 744B/40B、1M 如何实现，本轮均未取得一手技术报告。

② 创新技术

"真正可用的 1M 上下文"为官方主推升级（强调"可用"而非仅"能塞下"）；实测 ~400–500k 内准确性/指令遵循接近 Claude。
DSA（DeepSeek Sparse Attention）稀疏注意力 + MLA：来自底层 GLM-5 系技术栈（arxiv 技术报告逐字确认）。
Muon Split 优化器：按注意力头独立正交化 MLA 投影矩阵。
⚠️ 5.2 相对 5.1 的具体改动、"1M 可用"如何实现无数据背书，遭海外博客（buildfastwithai、agent-wars）质疑。

③ 实测口碑核心模块

多源一致：编码完成度/工程稳定性领先、逼近 Opus 4.8；硬伤是慢。抓取来源：linux.do 已用登录态浏览器逐字核实（SmallMain/Rlete 帖）；知乎/小红书仍登录墙、Reddit 被安全策略禁，相关条目仍为摘要。营销噪声：智谱 6/13–14 "晒体验抽 Max"活动使近两日小红书/公众号 GLM 好评可信度需打折。

正面负面中性/混合

正面 / 实测

AkitaOnRails独立博客·实测大跃升

Ruby 工程 87/100，A 级，史上最大版本间跃升（GLM-5.1 仅 46 → 5.2 达 87）；"全场最干净的依赖注入"，RubyLLM API 用法对照源码零幻觉。

akitaonrails.com

ivanfioravantiX / Twitter正面·第一

"YES!!! GLM-5.2 is here! I loved 5.1!" 三模型编码对比中 GLM-5.2 拿第一（胜 MiniMax M3、Kimi K2.7）。

x.com/ivanfioravanti

硅星人Pro / 董道力公众号·一手正面

机械天文钟"第一发就一口气写完整整 900 行骨架"、首版可直接运行、能自主发现 bug 后重写；3D 点球守门员动作"参考西甲门将生物力学论文、每帧旋转方向数值验证"。

硅星人Pro（虎嗅转载）

SmallMainlinux.do·逐字(86赞)国产最强

Unity C# 皮肤系统横评（42 模型同题）：完成度列 Tier 1（仅次 Fable5/GPT5.5-xhigh/Opus4.8）。原话："GLM 5.2 毋庸置疑地胜过了 Kimi K2.7 Code，成为了国产表现最好的模型，甚至和 Opus 4.8 的完成度也不相上下"；+1331 行代码、6.5M tokens。

linux.do/t/topic/2395506

负面 / 槽点

AkitaOnRails独立博客·实测最慢

A 级里最慢，耗时 43 分钟，因端点被限流（仅 12–55 tokens/秒）；状态存储无容量上限、重启即失效、多 worker 不安全。

akitaonrails.com

Rlete《西游记后传》linux.do·逐字(29赞)啰嗦/死循环

Max 档出现超长推理。原话："他在思考的过程中能意识到死循环了，但是却出不来……但是输出内容、工具调用、修改结果都正常可用，但是这个思考过程太虐了——太慢了"。回帖吐槽推理链"中英文结合，难绷"。

linux.do/t/topic/2395375

硅星人Pro / 董道力公众号·一手节奏/审美

执行节奏失衡——"14 分钟仅停留在设计讨论和零散代码阶段"，需手动触发"继续"才推进，易误以为卡死；界面审美偏弱。

硅星人Pro原文

省流评测B站不敌顶模

标题即结论："速度快、幻觉低、不扯淡，但 Coding 能力不敌顶模"——与论坛"第一梯队但不及 Opus/Fable 5"一致。

bilibili BV1sxJs6cEMS

1M 上下文实测口径

linux.do：~400–500k 上下文下准确性/指令遵循跟 Claude 差距不大、幻觉极低。
配置坑：要吃满 1M 须把模型名填成 glm-5.2[1m] 并把上下文压缩配到 80%，否则用不到 1M。
满 1M 截至 6-15 无任何独立长程压测佐证，官方"真正可用"无数据背书。

④ 商业化

GLM Coding Plan（GLM-5.2 当前主要分发方式）

套餐	价格	含 GLM-5/5.2	额度（社区实测）
Lite	¥49/月（年付≈¥34）	❌ 仅 GLM-4.7/4.6	—
Pro	¥149/月（年付≈¥104）	✅	5h 非高峰约 6000 万 token
Max	¥469/月（年付≈¥328）	✅	5h 约 2 亿 token、周上限约 10 亿，"够全职开发"

计费坑：高峰时段（北京时间 14:00–18:00）调用 ×3 计费、非高峰 ×2；1M 上下文打开后 token 消耗变快。
API / 开源：API 与 MIT 开源权重"下周"上线计划态；GLM-5.2 专属 API 价未公布（上一代 GLM-5 在 OpenRouter 为 $0.60/$1.92）。
性价比口碑：正面——"Claude Code 的体验，Claude Max 1/10 的价格"；反面——有博客实测认为真实可用量低于宣传、叠加海外访问/支付门槛后不一定强过 Claude Pro。白嫖入口：ZCode 3.0 可免费尝鲜（新用户每天约 300 万 token + 5 天试用）。

⑤ Benchmark

独立第三方（属 GLM-5）一代前

AA Intelligence Index v4.0	GLM-5 = 50，开源权重榜首
LMArena	GLM-5 在 Text Arena & Code Arena 均 #1 开源模型

本代独立横评（小样本）三方

AkitaOnRails（Ruby 工程）	87/100，A 级第 6；GLM-5.1=46（+41，史上最大跃升）；但最慢 43 分钟
ivanfioravanti（Lunar Lander 编码）	GLM-5.2 第 1 > MiniMax M3 > Kimi K2.7

两项独测均为单人/小型测试，样本有限，但方向一致指向 GLM-5.2 编码体感优于同期国产开源。