目 录CONTENT

文章目录

GLM-5.2 发布一周,平台接入情况汇总

过客
2026-06-19 / 0 评论 / 2 点赞 / 35 阅读 / 0 字

GLM-5.2 发布一周了。6 月 13 号智谱先面向 Coding Plan 存量用户开放,17 号 API 和开源权重正式上线。现在把它在各个平台的接入情况整理一下,也说说我踩过的坑。

5.2 比 5.1 强在哪,一句话说完

  • 上下文 200K → 1M​(实测扛 88 万 token 完成完整开发链路)
  • Terminal-Bench 2.1:63.5 → 81.0​,SWE-bench Pro 58.4 → 62.1
  • Code Arena 盲测全球可用模型第一​,Code V3 开源第一
  • API 价格跟 5.1 一样​,MIT 开源随便部署

从平台测试数据来看,跟 Opus 4.8 比大概差 1~4 个百分点,看具体基准。Coding 上压 GPT-5.5 一头。

哪些平台能用了

先说我自己在用的。

OpenCode Go(主力在用)

我目前用的是 OpenCode Go 订阅。10/月(首月5),每 5 小时可以调 GLM-5.2 共 880 次。如果不够可以用推荐好友来续量。

支持模型挺全:GLM-5.2/5.1、Kimi K2.7 Code / K2.6、Qwen 3.7 Max / 3.6 Plus、MiniMax M3、MiMo V2.5。一个 Key 搞定所有模型,OpenAI 兼容格式,OpenClaw/Hermes/OpenCode 之类的直接配 Base URL 和 Key 就能用。

体感上,API 稳定性还行,但是高峰期 GLM-5.2 响应会慢——毕竟太火了。非高峰时段速度正常。

官方渠道

平台 方式 价格
Z.ai Coding Plan 订阅制,支持 Claude Code / OpenCode / OpenClaw 等 Lite ¥49, Pro ¥149, Max ¥469
Z.ai API 按 token 计费 跟 5.1 同价
ZCode 3.0 智谱官方 IDE 新用户 5 天免费,每天 GLM-5.2 300 万 token

官方 Pro 版送 AutoGLM-OpenClaw 一个月。但问题是有时候会售罄。

火山引擎方舟(已拉黑,慎重)

火山方舟 Coding Plan 是最早一批上线了 GLM-5.2。价格 Lite ¥40/月,Pro ¥200/月。不限购,模型全家桶看起来很香。

但是。

我用火山是 GLM-5.1 时期的事,体验非常糟糕。我的亲身经历:20 分钟内跑了大约 30 次调用,5 小时额度就耗完了。这不是偶然,36 氪后来的一篇报道里提到大量用户有同样的问题——有人发帖"一个任务几轮对话 5 小时限制就快用完了",还有人因为连续滑动窗口触发了 6004 次请求限额。

更坑的是​调用系数​。火山对不同模型收不同"次数":豆包全系列扣 1 次,DeepSeek 扣 2 次,GLM-5.1 和 Kimi 扣 5 次。也就是说你花同样的额度,用 GLM 比用豆包"贵"5 倍。这个系数规则之前都没有,可能后面有被说的太多了,在套餐说明的小字里补了一下,很多人买完才发现。

高峰期还有 429 错误和首字延迟 1 分钟以上的问题。这些是我用 GLM-5.1 时期的情况,GLM-5.2 时期会不会改善不知道。​最近看到很多火山9.9套餐的活动,也有人私信我说火山CodingPlan合作的,但我没有理,也不想去尝试,一朝被蛇咬十年怕井绳。

京东云 JoyBuilder

一直没怎么关注的京东云也首批接入了,直接在 JoyBuilder 模型开发平台一键调用。适合已经在京东云上有业务的人。

360 智脑开放平台

模型广场搜 z-ai/glm-5.2,按量计费 输入¥8/1M tokens, 输出 ¥28/1M tokens。价格透明,没那么多套路,只是有点小贵。

硅基流动

国内老牌聚合平台了,也是第一时间跟进,按量计费。

阿里云百炼

阿里云百炼也第一时间跟进了,但暂时只有按量付费的可用,TokenPlan也有了,但CodingPlan暂时不可用。

海外推理平台

平台 接入方式 特点
Cloudflare Workers AI @cf/zai-org/glm-5.2,262K ctx 6/16 上线,后续扩到 1M
OpenCode Go 聚合多家国内 provider 便宜量够
OpenRouter 聚合多家 provider 比价方便
Together AI serverless 已经上架
Baseten OpenAI 兼容 endpoint 可 dedicated deployment
FriendliAI Day-0 上线 serverless pay-per-token

开源权重(自部署)

6 月 17 号放出,MIT 协议无地域限制:

  • HuggingFace: zai-org/GLM-5.2(BF16 / FP8 两个版本)
  • ModelScope: ZhipuAI/GLM-5.2
  • GitHub: zai-org/GLM-5

规格:744B 总参数 MoE,~40B 激活。vLLM / SGLang / transformers 都支持。国产算力 Day-0 适配了昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞。

8x H200 跑满 1M(需 FP8 KV cache),单卡 FP8 量化也能跑但上下文会受限。这都不是个人能玩的,参数看看就行了。

还没跟进的(目前还是 5 / 5.1)

  • 百度千帆 — 当前 GLM-5
  • 腾讯云 — 当前 GLM-5
  • 讯飞星火 — 当前 GLM-5.1

总结

GLM-5.2 本身是个好模型,能力确实是国产开源T0序列,有些基准已经摸到 Opus 4.8 的边。但接入平台的质量参差不齐。

我的建议:​如果你不差钱想省心 官方 Z.ai 的 API 直接买、或百炼、硅基流动这种老牌大厂。想省钱可以考虑OpenCode Go,不要为了便宜几块钱去碰那些计费不透明的平台或小的中转站​。

免费体验的话 ZCode 3.0 新用户 5 天免费,零成本先试试水。

关于GLM 5.2 是否真的好用,等我先用段时间再来评价,没用过时只能根据参数和基准数据来说,远没亲生体验来的实在。

2
  1. 支付宝打赏

    qrcode alipay
  2. 微信打赏

    qrcode weixin

评论区