2014 年,百度研究院来了个实习生,中科院自动化所的博士,河南县城出来的。他给自己算过一笔账:毕业后最理想的去处是 IBM,写 Java,年薪 28 万。
2026 年春节,一款叫 OpenClaw 的 Agent 工具全球爆火,开发者搭龙虾需要底层大模型撑着。有个模型又快又便宜,一周在 OpenRouter 上吞掉 1.44 万亿 Token,登顶全平台第一。
这个模型叫 M2.5,公司叫 MiniMax。
上市两个月,股价从 165 港元冲到 1300 港元,市值破 3000 亿,而它还是一家年收入不到 8000 万美元的公司。
做出 MiniMax 的人,就是十二年前那个实习生,闫俊杰。
2021 年春节,闫俊杰回河南老家过年,去看了外公。
外公跟他说,想写一本回忆录,记录这 80 年的人生。但不会打字,也没办法把故事好好组织起来,说了几次,就搁下了。
闫俊杰在 AI 行业做了十多年。那一刻他突然意识到,他做的这些东西,哪怕已经在产业里落地,帮了多少企业,但对一个想写回忆录的老人来说,一点用都没有。
这个细节后来被反复引用,有点励志故事的味道。但它确实解释了一件事:他做 AI 的动机很朴素,让普通人真的能用上。这股执念,后来驱动了一系列反直觉的决策。
2021 年底,他从商汤离职了。
时间点很关键。商汤当时正在准备港股上市,他是副总裁,研究院副院长,智慧城市事业群 CTO,走的时候是公司最值钱的时候之一。他没等到上市,没等到财富兑现,就出来了。
ChatGPT 是 2022 年 11 月才发布的。
MiniMax,2021 年 12 月成立。
这个时间差,是后来一切的基础。闫俊杰后来自己说,要不是做得早,在后来「明星研究员和大厂 AI 背景更受欢迎」的融资环境里,MiniMax 根本打不过别人。
他父母都是普通人。高中在县城读,考上东南大学数学系,后来中科院自动化所读博,清华博士后,再进商汤,一步步走出来,没有任何海外背景,也没有什么显赫的人脉起点。
在百度实习那阵子,他和地平线的余凯有过交集。余凯后来说,学术能力可以训练,但能把 AI 技术工程化落地的人,凤毛麟角。闫俊杰是其中之一。
进商汤之后,他七年从实习生做到副总裁。2018 年,在人手不够的情况下,他带队做出了一套「All for One」模型算法,在竞标里反超旷视和依图,拿到行业第一。有人评价他「看论文速度奇快,不管陈词滥调,只看精华要义」。这种效率,后来成了 MiniMax 的公司文化。
他给公司取名 MiniMax,来自博弈论里冯·诺依曼的极小化极大算法。
他的解释是,做决策要先防住最坏的风险,再选相对最优解。
2021 年 12 月,MiniMax 完成天使轮,3100 万美元,投前估值 1.7 亿美元。进来的有米哈游、IDG、高瓴、云启。
米哈游那笔钱有点特别。闫俊杰和米哈游董事长刘伟私交不错,天使轮就进来了,现在刘伟还在 MiniMax 的董事会里挂着非执行董事。
米哈游本身就是 MiniMax 的客户,游戏里的 NPC 对话、剧情生成,都在用他们的模型。
天使轮之后,故事遭遇了一个小插曲。
2023 年 3 月,硅谷银行宣布破产。MiniMax 当时所有资金都在那家银行。这是创业初期最险的一次,钱没了,融资环境还一片混乱。但他们撑过去了,两个月后拿到 A 轮 2.57 亿美元,估值 11.57 亿美元。
接下来的名单越来越夸张。阿里进来了,腾讯进来了,红杉跟了进去。到上市前,7 轮融资,累计近 15 亿美元,估值 42 亿美元。IPO 后阿里持股 12.52%,是最大外部股东。
闫俊杰早期融资有一个习惯:只和投资机构的最高位谈。他见了红杉的沈南鹏,见了高瓴的张磊。
但这张股东表上还有一个人值得单独讲:贠烨祎。
1994 年生,约翰·霍普金斯大学电子工程本科,辅修经济学和数学。2017 年本科一毕业就进商汤,干的是融资与战略投资,一年后升任 CEO 徐立的行政助理兼战略部总监。她深度参与了商汤从早期到港股上市的整个过程。
2021 年,她和闫俊杰一起出来创业。
有投资人评价她「干练、有气场、执行力强,有种超出其年龄的成熟」。她和闫俊杰的分工很清晰:一个定义技术愿景,一个把愿景变成钱和资源。闫俊杰能钻进技术里,头发都剃光了也无所谓,但市场、资本、全球化,是贠烨祎的战场。
上市敲钟那天,两个人站在同一个台子上。贠烨祎 31 岁,身价超过 40 亿港元。
MiniMax 上市时,全公司 385 人,平均年龄 29 岁。
公司从成立到 2025 年 9 月,累计花费约 5 亿美元。OpenAI 同期花了 400 亿到 550 亿美元。
这个对比有点荒谬。用不到对手 1% 的钱,做出了全模态全球领先的公司。省钱只是结果。真正的原因是他们把 AI 用到了极致。公司 80% 的代码由 AI 完成,内部管 AI 叫「实习生」,这些实习生权限高到可以直接访问代码库、改线上环境,飞书里和它聊几句,review 完直接上线。
这种效率让 MiniMax 的人均产出高到不正常。
产品层面,他们从一开始就走全模态路线:语言、视频、语音、音乐,四个方向同时压。别人都在学 ChatGPT 做对话,闫俊杰押的是多模态融合。他的判断是,多模态是持续提升智能的基本前提,不做全模态,下一代模型就没有机会。
2023 年夏天,他做了一个更激进的决定。
把 80% 的算力和研发资源,全部压到 MoE(混合专家系统)上。
那个时候,国内主流还在迭代稠密模型,MoE 被认为是「前沿但不成熟」的技术。闫俊杰的逻辑很简单:如果要服务千万级、亿级用户,生成 token 的成本和延时,用稠密模型根本撑不住。不做 MoE,规模上不去,一切都是白搭。
2024 年初,MiniMax 发布了国内首个 MoE 大模型。
产品上,他们也没有去卷国内市场。C 端做了星野和 Talkie,一个在国内,一个在海外,做 AI 陪伴;海螺 AI 做视频生成,2024 年下半年连续半年全球视频生成应用月活第一。
现在的数字:2.36 亿用户,覆盖 200 个国家和地区,海外收入占 73%。B 端 21.4 万企业客户和开发者,Google Vertex AI、微软 Azure、AWS 都已经部署了 MiniMax 的模型,Notion 首个开源模型选择,也是 MiniMax。
2 月的 ARR 突破了 1.5 亿美元,M2 系列单日 Token 消耗量是去年 12 月的 6 倍,其中编程方向增长超 10 倍。
这才是市场愿意给 200 倍市销率的原因。
但有一组数字要拆开看。
年报里,C 端毛利率 4.7%,B 端毛利率 69.4%。公司 67% 的收入来自 C 端,但 C 端几乎不贡献毛利。四季度粗算下来,C 端毛利率已经跌到约 2.1%。整体毛利率从 12.2% 提升到 25.4%,主要是因为 B 端收入比例在四季度快速拉升,把整体数字拖上来了。
这是一道没解完的题。
2025 年 6 月,MiniMax 发布 M1 模型。
闫俊杰在朋友圈发了一句话:
「第一次感觉到大山不是不能翻越。」
这句话背后的现实,中美头部模型技术能力可能只差 5%,但这 5% 让海外公司占据了价值高出 10 倍的场景,收取高出 10 倍的价格,最终形成近百倍的商业化差距。OpenAI 最新估值超过 7000 亿美元。MiniMax 上市市值 800 亿港元,不到 100 亿美元。
他做过一个判断,全球未来会有五家顶级 AGI 公司,其中至少两家来自中国,甚至有一家能做到第一。
1 月 9 日上市之后,他紧接着在 1 月 19 日出现在总理主持的专家企业家座谈会上,成为继 DeepSeek 梁文锋之后第二位参会的 AI 大模型创始人。
然后 3 月 2 日,首份年报出来,港股当天大涨。
财报会上,闫俊杰花了很长时间讲一件事:MiniMax 要从「大模型公司」变成「AI 时代的平台型公司」。
他给平台价值下了一个公式:智能密度 × Token 吞吐。互联网时代的平台是流量入口,AI 时代的平台是能定义智能边界、同时在商业上吃到红利的公司。Google 在做,OpenAI 在做,他们也要做。
他面对的对手,体量是他的几十倍。
港股上市只是把他推到了另一个战场。季报、分析师、市值压力,这些东西和写代码完全不是一回事。二级市场不相信情怀,只看数字。C 端的故事能不能转化成毛利,B 端的增速能不能维持,M3 什么时候出来,这些问题,接下来每个季度都要回答。
但把视角拉远一点看,MiniMax 的故事不只是一家公司的故事。
美国这几年在芯片上卡得越来越紧。A100 限售,H100 限售,H800 也限售。逻辑很直接:掐住算力,就掐住了 AI 的喉咙。
中国这边被迫走了一条完全不同的路。
DeepSeek 用 H800 跑出了接近 H100 的效果。MiniMax 用 5 亿美元干了 OpenAI 花几百亿才干到的事。闫俊杰 2023 年赌 MoE,原因是手里那点卡根本撑不起亿级用户的推理量。M2.5 连续工作一小时 1 美元,是 GPT-5 的二十分之一。混合注意力架构、线性注意力、CISPO 算法,创新都是被逼出来的。
芯片封锁的本意是拉大差距,但实际效果是把中国 AI 公司逼进了一条低算力、高效率的进化路线。
钱少,卡少,人少,反而逼出了极致的工程能力和架构创新。
这跟华为做芯片的逻辑一样,你封锁我一项能力,我就在其他维度补回来,补的过程中,可能长出你没有的东西。
OpenAI 现在 4000 多人,2025 年烧了 80 亿美元现金,到 2030 年计划砸 6000 亿美元的算力。MiniMax 385 人,累计花了 5 亿美元。
谁赢还不知道。但至少现在,赌 MiniMax 会死的人越来越少了。
2014 年那个在百度实习的河南博士生,大概不会想到,十二年后他站在的这个位置,背后连着的是一整场国运级别的技术竞争。
他选择继续跑下去。


