投研看板LLM 跟踪评价GLM-5.2
国内 · 智谱 Zhipu AI · 代际评测

GLM-5.2vsGLM-5.1 / GLM-5

2026-06-13 发布 · 主打"真正可用的 1M 上下文",编码完成度逼近 Opus 4.8
📅 看板更新 2026-06-15🟢 GLM-5.2 发布 2026-06-13⬜ 前代 GLM-5(02-11)/ GLM-5.1🔎 来源:官方+AkitaOnRails/ivanfioravanti/硅星人Pro/linux.do 实测

总览 · 一句话定论

GLM-5.2(底层 GLM-5 系 744B/40B MoE,主打 1M 上下文)相对上一代是编码完成度/工程稳定性的大幅跃升——独立横评从 GLM-5.1 的 46 分跳到 87 分(史上最大版本间跃升),逼近 Opus 4.8;但慢(限流、推理啰嗦、偶发死循环)、发布即零基准、1M 满载无人验证、API 与开源权重仍是"下周"计划态

对标定论(vs GLM-5.1 / GLM-5)

编码完成度AkitaOnRails 46→87(+41,史上最大跃升)、逼近 Opus 4.85.2 大幅优
长上下文主打 1M(实测 ~400–500k 内可靠、幻觉极低)5.2 优满1M待验证
速度 / 延迟限流、43 分钟、推理链冗长、偶发死循环退步/硬伤
跑分透明度GLM-5 有 #1 开源记录;GLM-5.2 发布即零基准退步
交付状态先开 Coding Plan;API + MIT 权重"下周"计划态

模型基本信息

维度🟢 GLM-5.2⬜ GLM-5 / GLM-5.1(前代)
发布日期2026-06-13(先向 Coding Plan 全量用户开放)GLM-5:2026-02-11;GLM-5.1 其后
架构底层 GLM-5 系 744B 总 / 40B 激活 MoE · 256 专家 · DSA+MLA同系 GLM-5
上下文 / 输出1M / 输出上限 131,072较短
模态纯文本(无多模态)纯文本
开源 / 协议计划 MIT 开源 · 权重"下周"放出(当前仅 Coding Plan 可用)GLM-5 已开源(开源权重榜首)
分发GLM Coding Plan(Lite/Pro/Max/团队版);API"下周"已有 API + OpenRouter
缺口:GLM-5.2 相对 GLM-5/5.1 的具体架构改动、是否仍 744B/40B、1M 如何实现,本轮均未取得一手技术报告。

创新技术

实测口碑 核心模块

多源一致:编码完成度/工程稳定性领先、逼近 Opus 4.8;硬伤是慢。抓取局限:linux.do/知乎/小红书登录墙,相关条目为搜索摘要转述。营销噪声:智谱 6/13–14 "晒体验抽 Max"活动使近两日小红书/公众号 GLM 好评可信度需打折。

正面负面中性/混合
正面 / 实测
AkitaOnRails独立博客·实测大跃升

Ruby 工程 87/100,A 级,史上最大版本间跃升(GLM-5.1 仅 46 → 5.2 达 87);"全场最干净的依赖注入",RubyLLM API 用法对照源码零幻觉。

akitaonrails.com
ivanfioravantiX / Twitter正面·第一

"YES!!! GLM-5.2 is here! I loved 5.1!" 三模型编码对比中 GLM-5.2 拿第一(胜 MiniMax M3、Kimi K2.7)。

x.com/ivanfioravanti
硅星人Pro / 董道力公众号·一手正面

机械天文钟"第一发就一口气写完整整 900 行骨架"、首版可直接运行、能自主发现 bug 后重写;3D 点球守门员动作"参考西甲门将生物力学论文、每帧旋转方向数值验证"。

硅星人Pro(虎嗅转载)
linux.do 横评linux.do·摘要第一梯队

Unity C# 真实项目横评:GLM-5.2 明确超过 Kimi K2.7、成为当前最强国产、完成质量逼近 Opus 4.8;"跻身第一梯队,长任务表现尤好"。

linux.do/t/topic/2395506
负面 / 槽点
AkitaOnRails独立博客·实测最慢

A 级里最慢,耗时 43 分钟,因端点被限流(仅 12–55 tokens/秒);状态存储无容量上限、重启即失效、多 worker 不安全。

akitaonrails.com
linux.do《西游记后传》linux.do·摘要啰嗦/死循环

代表性吐槽:推理链冗长、慢;会出现"模型自己意识到陷入死循环却跳不出来",思考过程让人难受;不过最终产出和工具调用正常。

linux.do/t/topic/2395375
硅星人Pro / 董道力公众号·一手节奏/审美

执行节奏失衡——"14 分钟仅停留在设计讨论和零散代码阶段",需手动触发"继续"才推进,易误以为卡死;界面审美偏弱。

硅星人Pro原文
省流评测B站不敌顶模

标题即结论:"速度快、幻觉低、不扯淡,但 Coding 能力不敌顶模"——与论坛"第一梯队但不及 Opus/Fable 5"一致。

bilibili BV1sxJs6cEMS

1M 上下文实测口径

商业化

GLM Coding Plan(GLM-5.2 当前主要分发方式)

套餐价格含 GLM-5/5.2额度(社区实测)
Lite¥49/月(年付≈¥34)❌ 仅 GLM-4.7/4.6
Pro¥149/月(年付≈¥104)5h 非高峰约 6000 万 token
Max¥469/月(年付≈¥328)5h 约 2 亿 token、周上限约 10 亿,"够全职开发"
计费坑:高峰时段(北京时间 14:00–18:00)调用 ×3 计费、非高峰 ×2;1M 上下文打开后 token 消耗变快。
API / 开源:API 与 MIT 开源权重"下周"上线 计划态;GLM-5.2 专属 API 价未公布(上一代 GLM-5 在 OpenRouter 为 $0.60/$1.92)。
性价比口碑:正面——"Claude Code 的体验,Claude Max 1/10 的价格";反面——有博客实测认为真实可用量低于宣传、叠加海外访问/支付门槛后不一定强过 Claude Pro。白嫖入口:ZCode 3.0 可免费尝鲜(新用户每天约 300 万 token + 5 天试用)。

Benchmark

独立第三方(属 GLM-5)一代前

AA Intelligence Index v4.0GLM-5 = 50,开源权重榜首
LMArenaGLM-5 在 Text Arena & Code Arena 均 #1 开源模型

本代独立横评(小样本)三方

AkitaOnRails(Ruby 工程)87/100,A 级第 6;GLM-5.1=46(+41,史上最大跃升);但最慢 43 分钟
ivanfioravanti(Lunar Lander 编码)GLM-5.2 第 1 > MiniMax M3 > Kimi K2.7
两项独测均为单人/小型测试,样本有限,但方向一致指向 GLM-5.2 编码体感优于同期国产开源。