国内 · 智谱 Zhipu AI · 代际评测
GLM-5.2vsGLM-5.1 / GLM-5
2026-06-13 发布 · 主打"真正可用的 1M 上下文",编码完成度逼近 Opus 4.8
📅 看板更新 2026-06-15🟢 GLM-5.2 发布 2026-06-13⬜ 前代 GLM-5(02-11)/ GLM-5.1🔎 来源:官方+AkitaOnRails/ivanfioravanti/硅星人Pro/linux.do 实测
⚠️ 代际提醒:独立榜单上的 OpenRouter $0.60/$1.92、Intelligence Index 50 分、LMArena #1 开源 都属 GLM-5(2 月发布),不是 GLM-5.2;GLM-5.2 自身发布时零基准、专属 API 价未公布,API 与 MIT 开源权重"下周"才上线(计划态)。"真正可用 1M 上下文"为官方话术,满 1M 截至 6-15 无独立压测佐证。
总览 · 一句话定论
GLM-5.2(底层 GLM-5 系 744B/40B MoE,主打 1M 上下文)相对上一代是编码完成度/工程稳定性的大幅跃升——独立横评从 GLM-5.1 的 46 分跳到 87 分(史上最大版本间跃升),逼近 Opus 4.8;但慢(限流、推理啰嗦、偶发死循环)、发布即零基准、1M 满载无人验证、API 与开源权重仍是"下周"计划态。
对标定论(vs GLM-5.1 / GLM-5)
编码完成度AkitaOnRails 46→87(+41,史上最大跃升)、逼近 Opus 4.85.2 大幅优
长上下文主打 1M(实测 ~400–500k 内可靠、幻觉极低)5.2 优满1M待验证
速度 / 延迟限流、43 分钟、推理链冗长、偶发死循环退步/硬伤
跑分透明度GLM-5 有 #1 开源记录;GLM-5.2 发布即零基准退步
交付状态先开 Coding Plan;API + MIT 权重"下周"计划态
① 模型基本信息
| 维度 | 🟢 GLM-5.2 | ⬜ GLM-5 / GLM-5.1(前代) |
| 发布日期 | 2026-06-13(先向 Coding Plan 全量用户开放) | GLM-5:2026-02-11;GLM-5.1 其后 |
| 架构 | 底层 GLM-5 系 744B 总 / 40B 激活 MoE · 256 专家 · DSA+MLA | 同系 GLM-5 |
| 上下文 / 输出 | 1M / 输出上限 131,072 | 较短 |
| 模态 | 纯文本(无多模态) | 纯文本 |
| 开源 / 协议 | 计划 MIT 开源 · 权重"下周"放出(当前仅 Coding Plan 可用) | GLM-5 已开源(开源权重榜首) |
| 分发 | GLM Coding Plan(Lite/Pro/Max/团队版);API"下周" | 已有 API + OpenRouter |
缺口:GLM-5.2 相对 GLM-5/5.1 的具体架构改动、是否仍 744B/40B、1M 如何实现,本轮均未取得一手技术报告。
② 创新技术
- "真正可用的 1M 上下文"为官方主推升级(强调"可用"而非仅"能塞下");实测 ~400–500k 内准确性/指令遵循接近 Claude。
- DSA(DeepSeek Sparse Attention)稀疏注意力 + MLA:来自底层 GLM-5 系技术栈(arxiv 技术报告逐字确认)。
- Muon Split 优化器:按注意力头独立正交化 MLA 投影矩阵。
- ⚠️ 5.2 相对 5.1 的具体改动、"1M 可用"如何实现无数据背书,遭海外博客(buildfastwithai、agent-wars)质疑。
③ 实测口碑 核心模块
多源一致:编码完成度/工程稳定性领先、逼近 Opus 4.8;硬伤是慢。抓取局限:linux.do/知乎/小红书登录墙,相关条目为搜索摘要转述。营销噪声:智谱 6/13–14 "晒体验抽 Max"活动使近两日小红书/公众号 GLM 好评可信度需打折。
正面负面中性/混合
正面 / 实测
AkitaOnRails独立博客·实测大跃升
Ruby 工程 87/100,A 级,史上最大版本间跃升(GLM-5.1 仅 46 → 5.2 达 87);"全场最干净的依赖注入",RubyLLM API 用法对照源码零幻觉。
akitaonrails.com
ivanfioravantiX / Twitter正面·第一
"YES!!! GLM-5.2 is here! I loved 5.1!" 三模型编码对比中 GLM-5.2 拿第一(胜 MiniMax M3、Kimi K2.7)。
x.com/ivanfioravanti
硅星人Pro / 董道力公众号·一手正面
机械天文钟"第一发就一口气写完整整 900 行骨架"、首版可直接运行、能自主发现 bug 后重写;3D 点球守门员动作"参考西甲门将生物力学论文、每帧旋转方向数值验证"。
硅星人Pro(虎嗅转载)
linux.do 横评linux.do·摘要第一梯队
Unity C# 真实项目横评:GLM-5.2 明确超过 Kimi K2.7、成为当前最强国产、完成质量逼近 Opus 4.8;"跻身第一梯队,长任务表现尤好"。
linux.do/t/topic/2395506
负面 / 槽点
AkitaOnRails独立博客·实测最慢
A 级里最慢,耗时 43 分钟,因端点被限流(仅 12–55 tokens/秒);状态存储无容量上限、重启即失效、多 worker 不安全。
akitaonrails.com
硅星人Pro / 董道力公众号·一手节奏/审美
执行节奏失衡——"14 分钟仅停留在设计讨论和零散代码阶段",需手动触发"继续"才推进,易误以为卡死;界面审美偏弱。
硅星人Pro原文
1M 上下文实测口径
- linux.do:~400–500k 上下文下准确性/指令遵循跟 Claude 差距不大、幻觉极低。
- 配置坑:要吃满 1M 须把模型名填成
glm-5.2[1m] 并把上下文压缩配到 80%,否则用不到 1M。
- 满 1M 截至 6-15 无任何独立长程压测佐证,官方"真正可用"无数据背书。
④ 商业化
GLM Coding Plan(GLM-5.2 当前主要分发方式)
| 套餐 | 价格 | 含 GLM-5/5.2 | 额度(社区实测) |
| Lite | ¥49/月(年付≈¥34) | ❌ 仅 GLM-4.7/4.6 | — |
| Pro | ¥149/月(年付≈¥104) | ✅ | 5h 非高峰约 6000 万 token |
| Max | ¥469/月(年付≈¥328) | ✅ | 5h 约 2 亿 token、周上限约 10 亿,"够全职开发" |
计费坑:高峰时段(北京时间 14:00–18:00)调用 ×3 计费、非高峰 ×2;1M 上下文打开后 token 消耗变快。
API / 开源:API 与 MIT 开源权重"下周"上线 计划态;GLM-5.2 专属 API 价未公布(上一代 GLM-5 在 OpenRouter 为 $0.60/$1.92)。
性价比口碑:正面——"Claude Code 的体验,Claude Max 1/10 的价格";反面——有博客实测认为真实可用量低于宣传、叠加海外访问/支付门槛后不一定强过 Claude Pro。白嫖入口:ZCode 3.0 可免费尝鲜(新用户每天约 300 万 token + 5 天试用)。
⑤ Benchmark
⚠️ GLM-5.2 发布即零基准——发布一小时内 X 上主流反应即"where are the benchmarks?"。下方独立分均属上一代 GLM-5,勿挂到 5.2 头上。
独立第三方(属 GLM-5)一代前
| AA Intelligence Index v4.0 | GLM-5 = 50,开源权重榜首 |
| LMArena | GLM-5 在 Text Arena & Code Arena 均 #1 开源模型 |
本代独立横评(小样本)三方
| AkitaOnRails(Ruby 工程) | 87/100,A 级第 6;GLM-5.1=46(+41,史上最大跃升);但最慢 43 分钟 |
| ivanfioravanti(Lunar Lander 编码) | GLM-5.2 第 1 > MiniMax M3 > Kimi K2.7 |
两项独测均为单人/小型测试,样本有限,但方向一致指向 GLM-5.2 编码体感优于同期国产开源。