上次写了 MiniMax M3 发布,我顺手被背刺了一刀 Token Plan。当时说"看看后面 K2.6 的继任者怎么出"。结果一周后Kimi 发了 K2.7-Code,又过了一天智谱发了 GLM-5.2。
两周三个模型。 这更新速度不愧是中国速度。
今天不测模型,就聊聊我对这三个模型的感受和它们各自在打什么牌。
先理清楚时间线
| 模型 | 时间 | 厂商 | 定位 |
|---|---|---|---|
| MiniMax M3 | 5月31日 | MiniMax | 三项全能:Coding+1M上下文+多模态 |
| Kimi K2.7-Code | 6月12日 | 月之暗面 | 纯编程模型,专治过度思考 |
| GLM-5.2 | 6月13日 | 智谱 | 最强Coding,1M上下文,MIT开源 |
从 5 月 31 号到 6 月 13 号,刚好两周。
如果你再往前算一点:
- 4 月 20 号,Kimi K2.6
- 4 月 24 号,DeepSeek V4
- 5 月 中下旬 Qwen 3.7 Max
- 5 月底 MiniMax M3
- 6 月 12 Kimi K2.7-Code
- 6 月 13 GLM-5.2
国产大模型这是从"修仙"改走"冲刺"了,半个月一个版本。
MiniMax M3:三项全能,但落地翻车
M3 发布时我写了篇文章吐槽。不是说它不行,是宣传和体验之间差距太大。
它的牌是"唯一开源三项旗舰能力":
- SWE-Bench Pro 59%,超 GPT-5.5
- BrowseComp 83.5,超 Opus 4.7
- 1M 上下文保底 512K
- 原生多模态
自研的 MSA 稀疏注意力在架构上确实有东西,1M 上下文还能保证效率——这在整个国产开源模型里是第一家做到的。
但我的真实体验是:
同一个加密算法改造任务,M3 思考 20 分钟一轮、3 轮迭代搞了 2 小时。最后还是自己手写了个 NIST 实现,不是我想要的 AES-256。
跑分和实际干活之间差了……一个级别。
而且当天换了 Token Plan,老用户被迫改套餐,股价跌了 15.7%。这条已经被骂烂了我不重复了。
M3 的价值: 它的架构方向是对的,MSA 这套稀疏注意力是国产模型里少有的底层创新。但你把它当日常用的话,建议先试再买。
Kimi K2.7-Code:终于把"过度思考"砍了
这个模型我昨天看到的消息。Kimi 这次走得挺务实的——不搞全能,就搞编程一件事。
最直接的一个改进:过度思考(overthinking)大幅减轻。
K2.6 时代有个很烦的问题:你跟它说"写个按钮",它能想半天"我到底该用什么框架、用什么设计模式、考虑不考虑无障碍,还能自己和自己对话半天"。这哪是写代码,这是写哲学论文。
K2.7-Code 的改进数据挺实在的:
- 平均 token 消耗 降 30%
- Kimi Code Bench v2 提升 21.8%
- MLS Bench Lite 提升 31.5%
- Agent 基准测试提升约 10%
30% 的 token 降量是实打实的钱。
价格没涨,跟 K2.6 一样:输入 6.5 元/输出 27 元每百万 token(标准版)。
还有个有意思的消息:6 月 15 号(周一)上线高速版。普通版的 5-6 倍速度,常规场景约 180 Token/s,只收 2 倍价格。
这个定价策略很聪明——你要慢就便宜,要快就贵点,自选。
注意了: K2.7-Code 必须开 Thinking 模式才能用。把 Thinking 关掉的话 API 直接报错,Kimi Code 会回退到 K2.6。这就等于把你的"我要不要思考"选择权给收了。不过对编程来说,开思考本来就是默认操作,倒也不膈应。
K2.7-Code 的价值: 它是目前国内最务实的编程专用模型,**解决了上一代最大的用户痛点(overthinking)**,高速版的性价比非常能打。
GLM-5.2:卡在 Claude 被封的窗口期
这个发布时间点太巧了。
昨天(6月12日),Anthropic 收到美国政府指令,暂停对美国境内外籍公民开放 Claude Mythos 5 和 Fable 5——包括 Anthropic 的外籍员工。
今天(6月13日)17:21 整,智谱全量开放 GLM-5.2 给 Coding Plan 用户。
17:21 是美国的几点来着?美东时间凌晨 5:21。也就是说智谱在美国收到的禁令时间的同一分钟,发布了"致敬版"开放。
"前沿智能不应只属于少数人,也不应被少数规则随时收回。"这句 slogan 打得确实漂亮。
说回模型本身:
- 百万级上下文(真 1M,不是 PPT)
- 智谱史上最强 Coding 模型
- 长程编程任务领先,延续 GLM-5/5.1 的路线
- 协议:MIT 开源,API 下周上,权重下周发
GLM-5 系列一直在长程任务上比较强。之前 GLM-5.1 的单次持续工作超过 8 小时的 demo 我记得看过。这次的 5.2 是接力的下一步。
但有个问题: GLM-5.2 目前只对 Coding Plan 用户开放。你今天想用,得先买套餐。API 要等到下周才上,权重也是下周才开源。
这就意味着:今天你没法白嫖。想第一时间体验得先掏钱。
跟 Kimi K2.7-Code 这种直接 API 就上、OpenCode Go计划已经可以用、甚至 HuggingFace 已经能下权重的比起来,GLM-5.2 的门槛高了一点。
不过考虑到 Claude 被封的背景,很多本来用 Claude Code 的团队现在慌得一匹,急着找替代方案。GLM-5.2 这个时间点出现,本身就是一记精准的夺食。
三模型速览
| 维度 | MiniMax M3 | Kimi K2.7-Code | GLM-5.2 |
|---|---|---|---|
| 发布时间 | 5/31 | 6/12 | 6/13 |
| 定位 | 三项全能开源旗舰 | 纯编程专用 | 最强Coding+1M上下文 |
| 上下文 | 1M(保底512K) | 256K | 1M |
| 参数量 | 未公开 | 1.1T | 744B(上代延续) |
| 价格输入 | $0.30/百万token | ¥6.5/百万token | 未公布(Coding Plan) |
| 是否开源 | 是 | 是 | 是(MIT,下周) |
| 最大亮点 | MSA稀疏注意力架构 | 砍掉overthinking+高速版 | 政治timing+百万上下文 |
| 真实体验 | 跑分高但小任务翻车 | 果断、token省30% | 待测 |
| 适合谁 | 想尝鲜旗舰能力的 | 日常Coding重度用户 | Claude被封后找替代的 |
说说我的用法
三个模型我现在的态度:
Kimi K2.7-Code 会作为日常编程主力。 原因很简单:专门做编程的模型,砍了 overthinking,有高速版,价格没涨。OpenCode 里换着用很舒服。
GLM-5.2 等下周 API 上线了再试。 上个版本GLM-5.1编程效果还是蛮不错的,现在 Coding Plan 门槛我没买,但它的 1M 上下文对我处理大型代码仓库时可能有价值。
两周三个模型,国产大模型这波卷是真的卷。
但换个角度想,**两周前我还在说"国产 Coding 还得看 DeepSeek 和海外模型"**,现在三个能打的排着队出来——总归是好事。
这几个模型在哪儿用
先说结论:两个新模型都太新了,第三方云平台还没跟上。 想立刻用的话得走官方渠道。
Kimi K2.7-Code 可用平台
可以直接用的:
- ✅ Kimi API 开放平台(platform.kimi.com)——已上线标准版,价格跟 K2.6 一样,输入 6.5 元/输出 27 元每百万 token
- ✅ Kimi Code Plan——默认模型已自动升级到 K2.7 Code,如果你是订阅用户,打开就能用
- ✅ Kimi 会员计划/企业版——包含 Code Plan 权益的套餐都覆盖了
- ✅ HuggingFace——权重已开源,可以本地部署自己跑
- ✅ OpenCode、OpenRouter——已经上线架了
国内第三方云平台:暂未上架。 阿里云百炼、火山引擎方舟、腾讯云 TokenHub 目前都只到 K2.6。估计要等一两周才会跟进。
**高速版要等周一(6月15日)**,普通版 5-6 倍速度、2 倍价格,到时候 API 上直接选就行。
GLM-5.2 可用平台
目前能用的只有:
- ✅ GLM Coding Plan——今天 17:21 刚向 Lite/Pro/Max/团队版全量开放。有套餐的话现在就能用。
即将开放:
- ⏳ API——预计下周上线,到时候可以按量调用
- ⏳ 开源权重——下周 HuggingFace/ModelScope 发布,MIT 协议
国内外第三方云平台:统一没跟上。 阿里云百炼、火山引擎方舟、腾讯云 TokenHub、百度千帆目前都只到 GLM-5/5.1。GLM-5.2 预计得等开源后才会陆续上架。
时效性提示: 这篇文章写于 6 月 13 日,模型都才发布 1-2 天。平台接入情况变化很快,你看到的时候可能已经不一样了——建议直接去各平台控制台搜一下模型名。
评论区