两周三个模型：MiniMax M3、Kimi K2.7-Code、GLM-5.2 接棒发新模型-过客

上次写了 MiniMax M3 发布，我顺手被背刺了一刀 Token Plan。当时说"看看后面 K2.6 的继任者怎么出"。结果一周后Kimi 发了 K2.7-Code，又过了一天智谱发了 GLM-5.2。

两周三个模型。 这更新速度不愧是中国速度。

今天不测模型，就聊聊我对这三个模型的感受和它们各自在打什么牌。

先理清楚时间线

模型	时间	厂商	定位
MiniMax M3	5月31日	MiniMax	三项全能：Coding+1M上下文+多模态
Kimi K2.7-Code	6月12日	月之暗面	纯编程模型，专治过度思考
GLM-5.2	6月13日	智谱	最强Coding，1M上下文，MIT开源

从 5 月 31 号到 6 月 13 号，刚好两周。

如果你再往前算一点：

4 月 20 号，Kimi K2.6
4 月 24 号，DeepSeek V4
5 月中下旬 Qwen 3.7 Max
5 月底 MiniMax M3
6 月 12 Kimi K2.7-Code
6 月 13 GLM-5.2

国产大模型这是从"修仙"改走"冲刺"了，半个月一个版本。

MiniMax M3：三项全能，但落地翻车

M3 发布时我写了篇文章吐槽。不是说它不行，是宣传和体验之间差距太大。

它的牌是"唯一开源三项旗舰能力"：

SWE-Bench Pro 59%，超 GPT-5.5
BrowseComp 83.5，超 Opus 4.7
1M 上下文保底 512K
原生多模态

自研的 MSA 稀疏注意力在架构上确实有东西，1M 上下文还能保证效率——这在整个国产开源模型里是第一家做到的。

但我的真实体验是：

同一个加密算法改造任务，M3 思考 20 分钟一轮、3 轮迭代搞了 2 小时。最后还是自己手写了个 NIST 实现，不是我想要的 AES-256。

跑分和实际干活之间差了……一个级别。

而且当天换了 Token Plan，老用户被迫改套餐，股价跌了 15.7%。这条已经被骂烂了我不重复了。

M3 的价值： 它的架构方向是对的，MSA 这套稀疏注意力是国产模型里少有的底层创新。但你把它当日常用的话，建议先试再买。

Kimi K2.7-Code：终于把"过度思考"砍了

这个模型我昨天看到的消息。Kimi 这次走得挺务实的——不搞全能，就搞编程一件事。

最直接的一个改进：过度思考（overthinking）大幅减轻。

K2.6 时代有个很烦的问题：你跟它说"写个按钮"，它能想半天"我到底该用什么框架、用什么设计模式、考虑不考虑无障碍，还能自己和自己对话半天"。这哪是写代码，这是写哲学论文。

K2.7-Code 的改进数据挺实在的：

平均 token 消耗 降 30%
Kimi Code Bench v2 提升 21.8%
MLS Bench Lite 提升 31.5%
Agent 基准测试提升约 10%

30% 的 token 降量是实打实的钱。

价格没涨，跟 K2.6 一样：输入 6.5 元/输出 27 元每百万 token（标准版）。

还有个有意思的消息：6 月 15 号（周一）上线高速版。普通版的 5-6 倍速度，常规场景约 180 Token/s，只收 2 倍价格。

这个定价策略很聪明——你要慢就便宜，要快就贵点，自选。

注意了： K2.7-Code 必须开 Thinking 模式才能用。把 Thinking 关掉的话 API 直接报错，Kimi Code 会回退到 K2.6。这就等于把你的"我要不要思考"选择权给收了。不过对编程来说，开思考本来就是默认操作，倒也不膈应。

K2.7-Code 的价值： 它是目前国内最务实的编程专用模型，**解决了上一代最大的用户痛点（overthinking）**，高速版的性价比非常能打。

GLM-5.2：卡在 Claude 被封的窗口期

这个发布时间点太巧了。

昨天（6月12日），Anthropic 收到美国政府指令，暂停对美国境内外籍公民开放 Claude Mythos 5 和 Fable 5——包括 Anthropic 的外籍员工。

今天（6月13日）17:21 整，智谱全量开放 GLM-5.2 给 Coding Plan 用户。

17:21 是美国的几点来着？美东时间凌晨 5:21。也就是说智谱在美国收到的禁令时间的同一分钟，发布了"致敬版"开放。

"前沿智能不应只属于少数人，也不应被少数规则随时收回。"这句 slogan 打得确实漂亮。

说回模型本身：

百万级上下文（真 1M，不是 PPT）
智谱史上最强 Coding 模型
长程编程任务领先，延续 GLM-5/5.1 的路线
协议：MIT 开源，API 下周上，权重下周发

GLM-5 系列一直在长程任务上比较强。之前 GLM-5.1 的单次持续工作超过 8 小时的 demo 我记得看过。这次的 5.2 是接力的下一步。

但有个问题： GLM-5.2 目前只对 Coding Plan 用户开放。你今天想用，得先买套餐。API 要等到下周才上，权重也是下周才开源。

这就意味着：今天你没法白嫖。想第一时间体验得先掏钱。

跟 Kimi K2.7-Code 这种直接 API 就上、OpenCode Go计划已经可以用、甚至 HuggingFace 已经能下权重的比起来，GLM-5.2 的门槛高了一点。

不过考虑到 Claude 被封的背景，很多本来用 Claude Code 的团队现在慌得一匹，急着找替代方案。GLM-5.2 这个时间点出现，本身就是一记精准的夺食。

三模型速览

维度	MiniMax M3	Kimi K2.7-Code	GLM-5.2
发布时间	5/31	6/12	6/13
定位	三项全能开源旗舰	纯编程专用	最强Coding+1M上下文
上下文	1M（保底512K）	256K	1M
参数量	未公开	1.1T	744B（上代延续）
价格输入	$0.30/百万token	¥6.5/百万token	未公布（Coding Plan）
是否开源	是	是	是（MIT，下周）
最大亮点	MSA稀疏注意力架构	砍掉overthinking+高速版	政治timing+百万上下文
真实体验	跑分高但小任务翻车	果断、token省30%	待测
适合谁	想尝鲜旗舰能力的	日常Coding重度用户	Claude被封后找替代的

说说我的用法

三个模型我现在的态度：

Kimi K2.7-Code 会作为日常编程主力。 原因很简单：专门做编程的模型，砍了 overthinking，有高速版，价格没涨。OpenCode 里换着用很舒服。

GLM-5.2 等下周 API 上线了再试。 上个版本GLM-5.1编程效果还是蛮不错的，现在 Coding Plan 门槛我没买，但它的 1M 上下文对我处理大型代码仓库时可能有价值。

两周三个模型，国产大模型这波卷是真的卷。

但换个角度想，**两周前我还在说"国产 Coding 还得看 DeepSeek 和海外模型"**，现在三个能打的排着队出来——总归是好事。

这几个模型在哪儿用

先说结论：两个新模型都太新了，第三方云平台还没跟上。 想立刻用的话得走官方渠道。

Kimi K2.7-Code 可用平台

可以直接用的：

✅ Kimi API 开放平台（platform.kimi.com）——已上线标准版，价格跟 K2.6 一样，输入 6.5 元/输出 27 元每百万 token
✅ Kimi Code Plan——默认模型已自动升级到 K2.7 Code，如果你是订阅用户，打开就能用
✅ Kimi 会员计划/企业版——包含 Code Plan 权益的套餐都覆盖了
✅ HuggingFace——权重已开源，可以本地部署自己跑
✅ OpenCode、OpenRouter——已经上线架了

国内第三方云平台：暂未上架。 阿里云百炼、火山引擎方舟、腾讯云 TokenHub 目前都只到 K2.6。估计要等一两周才会跟进。

**高速版要等周一（6月15日）**，普通版 5-6 倍速度、2 倍价格，到时候 API 上直接选就行。

GLM-5.2 可用平台

目前能用的只有：

✅ GLM Coding Plan——今天 17:21 刚向 Lite/Pro/Max/团队版全量开放。有套餐的话现在就能用。

即将开放：

⏳ API——预计下周上线，到时候可以按量调用
⏳ 开源权重——下周 HuggingFace/ModelScope 发布，MIT 协议

国内外第三方云平台：统一没跟上。 阿里云百炼、火山引擎方舟、腾讯云 TokenHub、百度千帆目前都只到 GLM-5/5.1。GLM-5.2 预计得等开源后才会陆续上架。

时效性提示： 这篇文章写于 6 月 13 日，模型都才发布 1-2 天。平台接入情况变化很快，你看到的时候可能已经不一样了——建议直接去各平台控制台搜一下模型名。

目录CONTENT

两周三个模型：MiniMax M3、Kimi K2.7-Code、GLM-5.2 接棒发新模型