6 月 1 日 MiniMax M3 发布当天,官方发了一堆炸裂数据:12 小时自主复现 ICLR 论文、SWE-Bench Pro 59%、1M 上下文……然后就拿 OpenCode 试了试。
结果大跌眼镜。
这篇文章不讲官方宣传那套东西,只讲我自己的真实体验(仅陈述体验,不代表其他观点) + 一个让我窝火的"套餐变更"。
一、M3 发布的喧嚣
M3 干了啥:
- 自研稀疏注意力架构 MSA,1M 上下文保底 512K
- 三大能力合一:前沿 Coding + 百万上下文 + 原生多模态
- 官方 demo:12 小时自主复现 ICLR 论文
- SWE-Bench Pro 59%,对标 Opus 4.7
- 价格 7 天 5 折:0.30 / 1.20(输入/输出每百万)
看着挺美。
二、Token Plan 顺手背刺老用户
M3 发布同一天,MiniMax 静悄悄把原来的 Coding Plan 改成了 Token Plan。我 6 月 1 日打开订阅页才发现。
改了什么:
| 套餐 | 原 Coding Plan | 新 Token Plan |
|---|---|---|
| Starter 29 元/月 | 600次/5小时 | 直接取消,老用户 3 亿 token |
| Plus 49 元/月 | 1500次/5小时 | 6 亿 token / 月 |
| Max 119 元/月 | 4500次/5小时 | 18 亿 token / 月 |
| Ultra 469 元/月 | ... | 55 亿 token / 月 |

看着只是改个名字,核心区别大了:
- 原来是按调用次数算,每 5 小时刷新一次
- 现在是按总 Token 量算,一月清零
在 Coding Plan 时代,一次 Prompt 占多大 Token 跟套餐额度无关——只要你不疯狂调,6 亿次调用 49 元用得飞起。
换成 Token Plan 之后:
- M3 这种 1M 上下文的模型,Token 消耗按输入内容长度算
- 你扔一份代码进去 review,光输入就好几万 token
- 多轮对话、Agent 任务,token 累加速度比"调用次数"快多了
- 老用户没几个能撑过月底
6 天前的 5 月 26 号,我刚写了篇文章吹 MiniMax 29 元 Starter 套餐用得爽。结果这个套餐说没就没了,而且只有3亿Token,平均算下来1块钱1千万token。这个量比起 opencode go的首月$5来说差的有点多哈。
社区反馈:什么值得买、知乎、微博搜一下"Token Plan",基本清一色吐槽——"不讲合约精神"、"暗改规则"、"换着花样割韭菜"。身边几个老订阅的朋友已经开始申请退订了。
三、M3 真实体验:2 小时改个加密算法
说回 M3 本身。我拿它来改一个老项目的加密方案:
- 客户端:Cocos Creator,TypeScript
- 服务器:Go
- 原方案:客户端用
crypto-js做 AES-ECB 加密,服务器 Go 端解密 - 目标:改成 AES-GCM(ECB 早就不安全了)
听起来是个很小、很明确的任务对吧?改一个加密算法而已。
第一次尝试
把任务扔给 OpenCode 里的 M3,告诉它客户端、服务器使用ECB算法的位置和函数名在哪,在不影响原有逻辑的情况下修改算法,要求两端都能跑通。
M3 思考了十多分钟,然后给出一版代码。客户端跑起来——
crypto-js.js:3907 Uncaught TypeError: Cannot read properties of undefined (reading 'createEncryptor')
典型 API 用错了。我把完整报错贴回去。
第二次尝试
这次思考了近 20 分钟。改完,客户端编译过了,服务器 Go 端也编译过了。
但是:服务器解密时直接报——
cipher: message authentication failed
AES-GCM 的认证失败。这是个 GCM 特有的问题,要么是 IV/Nonce 用错,要么是 AAD 长度对不上,要么是密文格式编码有问题。M3 这次给出的方案我没细看,但显然是哪里逻辑没对上。
第三次尝试
**这次 M3 干脆放弃了 crypto-js**。
它自己按 NIST SP 800-38D 规范手写了一个 AES-128-GCM 实现——直接调 Web Crypto API,不依赖任何第三方库。
听起来很"硬核",但实际上:
- AES-128 不是我要求的(我要的是 AES-256)
- 手写加密实现,怎么 review 安全性?M3 自己写出来的东西,出了问题你找谁修?
- 这种"自己撸"的行为恰恰说明它前面调的库用法没调对,最后用绕过问题的方式解决
这次又思考了 近半个小时。
第三次还是报了一次
cipher: message authentication failed
最终2 个多小时过去了,又调了几次,加密总算能跑通。功能是实现了,但:
- 代码可读性差
- 客户端那套手写 GCM 后面维护会很难
- 服务器端的 Go GCM 解密需要重新对一下字段名
这就是号称"前沿 Coding 能力、超越 GPT-5.5" 的旗舰模型 M3,改个加密算法,3 轮迭代 + 2 小时。
如果换真人写,1 小时都用不了。M3 的"思考"是它自己慢——20 分钟一轮,谁受得了。
四、跑分 vs 干活
| 维度 | 官方数据 | 实际体验 |
|---|---|---|
| SWE-Bench Pro | 59%,超 GPT-5.5 | 改个加密改 3 轮 + 2 小时 |
| BrowseComp | 83.5%,超 Opus 4.7 | 多轮任务累计 token 飞起 |
| 宣传"代码直接可交付" | 官方原话 | 报错了自己都不知道为什么 |
| 12 小时复现论文 | 官方 demo | 真实小任务反而翻车 |
跑分高 ≠ 干活快 ≠ 干活对。
M3 这次的"杀手 demo"是长程 Agent 任务(12 小时复现论文),看着很惊艳。但落到我这种短平快的真实工程任务上,M3 的多轮迭代成本极高:
- 每次思考 20 分钟
- 错了不告诉你哪里错了
- token 累计起来比你预想的多得多
- Token Plan 一月 6 亿 token,改个加密可能就用掉6百多万(New-API统计)
五、资本市场的态度
6 月 1 日港股:
- MiniMax 收盘**跌 15.7%**,上市以来最大单日跌幅
- 收盘价 710 港元,总市值 2226.81 亿港元
- 跌的原因:5/31 公告启动 A 股 IPO + M3 表现不及预期
你看,资本也不怎么买账。
之前股价最高 1330 港元(3/18 港股第一高价股),现在 710,腰斩还多。AI 公司的故事再漂亮,最终还是要看模型能不能真的干活、能不能真的赚钱。
六、写在最后
我不是说 M3 不好。M3 是个能用的模型,跑分也确实不错,发布的信息收集我也整理过。
但:
- Token Plan 的变更方式很恶心——老套餐说没就没,还改用 token 计量,老用户用脚投票
- M3 在真实工程任务上的表现远不如宣传——多轮迭代慢、报错不精确、自己写的代码安全性存疑
- 实际使用成本被宣传低估——M3 长上下文 + 长思考 = 一次任务烧大量 token
- 股价跌 15.7% 是一次市场投票——别只看官方怎么吹
给新用户:先在 OpenCode 里免费用几天,再决定要不要订阅。
给老用户:赶紧看看自己的订阅页,该退订退订,别等月底清零。
6 天前我还在说 MiniMax 29 元套餐+DeepSeek。6 天后我:真香个鬼。
评论区