2014 年，百度研究院来了个实习生，中科院自动化所的博士，河南县城出来的。他给自己算过一笔账：毕业后最理想的去处是 IBM，写 Java，年薪 28 万。 2026… 2014 年，百度研究院来了个实习生，中科院自动化所的博士，河南县城出来的。他给自己算过一笔账：毕业后最理想的去处是 IBM，写 Java，年薪 28 万。 2026…

MiniMax：一个河南县城青年和他的3000亿

作者：BlockWeek

来源：BlockWeek

2026/03/18 18:56

阅读时长 17 分钟

如需对本内容提供反馈或相关疑问，请通过邮箱 [email protected] 联系我们。

2014 年，百度研究院来了个实习生，中科院自动化所的博士，河南县城出来的。他给自己算过一笔账：毕业后最理想的去处是 IBM，写 Java，年薪 28 万。

2026 年春节，一款叫 OpenClaw 的 Agent 工具全球爆火，开发者搭龙虾需要底层大模型撑着。有个模型又快又便宜，一周在 OpenRouter 上吞掉 1.44 万亿 Token，登顶全平台第一。

这个模型叫 M2.5，公司叫 MiniMax。

上市两个月，股价从 165 港元冲到 1300 港元，市值破 3000 亿，而它还是一家年收入不到 8000 万美元的公司。

做出 MiniMax 的人，就是十二年前那个实习生，闫俊杰。

提前一年多的赌注

2021 年春节，闫俊杰回河南老家过年，去看了外公。

外公跟他说，想写一本回忆录，记录这 80 年的人生。但不会打字，也没办法把故事好好组织起来，说了几次，就搁下了。

闫俊杰在 AI 行业做了十多年。那一刻他突然意识到，他做的这些东西，哪怕已经在产业里落地，帮了多少企业，但对一个想写回忆录的老人来说，一点用都没有。

这个细节后来被反复引用，有点励志故事的味道。但它确实解释了一件事：他做 AI 的动机很朴素，让普通人真的能用上。这股执念，后来驱动了一系列反直觉的决策。

2021 年底，他从商汤离职了。

时间点很关键。商汤当时正在准备港股上市，他是副总裁，研究院副院长，智慧城市事业群 CTO，走的时候是公司最值钱的时候之一。他没等到上市，没等到财富兑现，就出来了。

ChatGPT 是 2022 年 11 月才发布的。

MiniMax，2021 年 12 月成立。

这个时间差，是后来一切的基础。闫俊杰后来自己说，要不是做得早，在后来「明星研究员和大厂 AI 背景更受欢迎」的融资环境里，MiniMax 根本打不过别人。

他父母都是普通人。高中在县城读，考上东南大学数学系，后来中科院自动化所读博，清华博士后，再进商汤，一步步走出来，没有任何海外背景，也没有什么显赫的人脉起点。

在百度实习那阵子，他和地平线的余凯有过交集。余凯后来说，学术能力可以训练，但能把 AI 技术工程化落地的人，凤毛麟角。闫俊杰是其中之一。

进商汤之后，他七年从实习生做到副总裁。2018 年，在人手不够的情况下，他带队做出了一套「All for One」模型算法，在竞标里反超旷视和依图，拿到行业第一。有人评价他「看论文速度奇快，不管陈词滥调，只看精华要义」。这种效率，后来成了 MiniMax 的公司文化。

他给公司取名 MiniMax，来自博弈论里冯·诺依曼的极小化极大算法。

他的解释是，做决策要先防住最坏的风险，再选相对最优解。

一张奇特的股东表

2021 年 12 月，MiniMax 完成天使轮，3100 万美元，投前估值 1.7 亿美元。进来的有米哈游、IDG、高瓴、云启。

米哈游那笔钱有点特别。闫俊杰和米哈游董事长刘伟私交不错，天使轮就进来了，现在刘伟还在 MiniMax 的董事会里挂着非执行董事。

米哈游本身就是 MiniMax 的客户，游戏里的 NPC 对话、剧情生成，都在用他们的模型。

天使轮之后，故事遭遇了一个小插曲。

2023 年 3 月，硅谷银行宣布破产。MiniMax 当时所有资金都在那家银行。这是创业初期最险的一次，钱没了，融资环境还一片混乱。但他们撑过去了，两个月后拿到 A 轮 2.57 亿美元，估值 11.57 亿美元。

接下来的名单越来越夸张。阿里进来了，腾讯进来了，红杉跟了进去。到上市前，7 轮融资，累计近 15 亿美元，估值 42 亿美元。IPO 后阿里持股 12.52%，是最大外部股东。

闫俊杰早期融资有一个习惯：只和投资机构的最高位谈。他见了红杉的沈南鹏，见了高瓴的张磊。

但这张股东表上还有一个人值得单独讲：贠烨祎。

1994 年生，约翰·霍普金斯大学电子工程本科，辅修经济学和数学。2017 年本科一毕业就进商汤，干的是融资与战略投资，一年后升任 CEO 徐立的行政助理兼战略部总监。她深度参与了商汤从早期到港股上市的整个过程。

2021 年，她和闫俊杰一起出来创业。

有投资人评价她「干练、有气场、执行力强，有种超出其年龄的成熟」。她和闫俊杰的分工很清晰：一个定义技术愿景，一个把愿景变成钱和资源。闫俊杰能钻进技术里，头发都剃光了也无所谓，但市场、资本、全球化，是贠烨祎的战场。

上市敲钟那天，两个人站在同一个台子上。贠烨祎 31 岁，身价超过 40 亿港元。

385 人和 1% 的钱

MiniMax 上市时，全公司 385 人，平均年龄 29 岁。

公司从成立到 2025 年 9 月，累计花费约 5 亿美元。OpenAI 同期花了 400 亿到 550 亿美元。

这个对比有点荒谬。用不到对手 1% 的钱，做出了全模态全球领先的公司。省钱只是结果。真正的原因是他们把 AI 用到了极致。公司 80% 的代码由 AI 完成，内部管 AI 叫「实习生」，这些实习生权限高到可以直接访问代码库、改线上环境，飞书里和它聊几句，review 完直接上线。

这种效率让 MiniMax 的人均产出高到不正常。

产品层面，他们从一开始就走全模态路线：语言、视频、语音、音乐，四个方向同时压。别人都在学 ChatGPT 做对话，闫俊杰押的是多模态融合。他的判断是，多模态是持续提升智能的基本前提，不做全模态，下一代模型就没有机会。

2023 年夏天，他做了一个更激进的决定。

把 80% 的算力和研发资源，全部压到 MoE（混合专家系统）上。

那个时候，国内主流还在迭代稠密模型，MoE 被认为是「前沿但不成熟」的技术。闫俊杰的逻辑很简单：如果要服务千万级、亿级用户，生成 token 的成本和延时，用稠密模型根本撑不住。不做 MoE，规模上不去，一切都是白搭。

2024 年初，MiniMax 发布了国内首个 MoE 大模型。

产品上，他们也没有去卷国内市场。C 端做了星野和 Talkie，一个在国内，一个在海外，做 AI 陪伴；海螺 AI 做视频生成，2024 年下半年连续半年全球视频生成应用月活第一。

现在的数字：2.36 亿用户，覆盖 200 个国家和地区，海外收入占 73%。B 端 21.4 万企业客户和开发者，Google Vertex AI、微软 Azure、AWS 都已经部署了 MiniMax 的模型，Notion 首个开源模型选择，也是 MiniMax。

2 月的 ARR 突破了 1.5 亿美元，M2 系列单日 Token 消耗量是去年 12 月的 6 倍，其中编程方向增长超 10 倍。

这才是市场愿意给 200 倍市销率的原因。

但有一组数字要拆开看。

年报里，C 端毛利率 4.7%，B 端毛利率 69.4%。公司 67% 的收入来自 C 端，但 C 端几乎不贡献毛利。四季度粗算下来，C 端毛利率已经跌到约 2.1%。整体毛利率从 12.2% 提升到 25.4%，主要是因为 B 端收入比例在四季度快速拉升，把整体数字拖上来了。

这是一道没解完的题。

大山不是不能翻越

2025 年 6 月，MiniMax 发布 M1 模型。

闫俊杰在朋友圈发了一句话：

「第一次感觉到大山不是不能翻越。」

这句话背后的现实，中美头部模型技术能力可能只差 5%，但这 5% 让海外公司占据了价值高出 10 倍的场景，收取高出 10 倍的价格，最终形成近百倍的商业化差距。OpenAI 最新估值超过 7000 亿美元。MiniMax 上市市值 800 亿港元，不到 100 亿美元。

他做过一个判断，全球未来会有五家顶级 AGI 公司，其中至少两家来自中国，甚至有一家能做到第一。

1 月 9 日上市之后，他紧接着在 1 月 19 日出现在总理主持的专家企业家座谈会上，成为继 DeepSeek 梁文锋之后第二位参会的 AI 大模型创始人。

然后 3 月 2 日，首份年报出来，港股当天大涨。

财报会上，闫俊杰花了很长时间讲一件事：MiniMax 要从「大模型公司」变成「AI 时代的平台型公司」。

他给平台价值下了一个公式：智能密度 × Token 吞吐。互联网时代的平台是流量入口，AI 时代的平台是能定义智能边界、同时在商业上吃到红利的公司。Google 在做，OpenAI 在做，他们也要做。

他面对的对手，体量是他的几十倍。

港股上市只是把他推到了另一个战场。季报、分析师、市值压力，这些东西和写代码完全不是一回事。二级市场不相信情怀，只看数字。C 端的故事能不能转化成毛利，B 端的增速能不能维持，M3 什么时候出来，这些问题，接下来每个季度都要回答。

但把视角拉远一点看，MiniMax 的故事不只是一家公司的故事。

美国这几年在芯片上卡得越来越紧。A100 限售，H100 限售，H800 也限售。逻辑很直接：掐住算力，就掐住了 AI 的喉咙。

中国这边被迫走了一条完全不同的路。

DeepSeek 用 H800 跑出了接近 H100 的效果。MiniMax 用 5 亿美元干了 OpenAI 花几百亿才干到的事。闫俊杰 2023 年赌 MoE，原因是手里那点卡根本撑不起亿级用户的推理量。M2.5 连续工作一小时 1 美元，是 GPT-5 的二十分之一。混合注意力架构、线性注意力、CISPO 算法，创新都是被逼出来的。

芯片封锁的本意是拉大差距，但实际效果是把中国 AI 公司逼进了一条低算力、高效率的进化路线。

钱少，卡少，人少，反而逼出了极致的工程能力和架构创新。

这跟华为做芯片的逻辑一样，你封锁我一项能力，我就在其他维度补回来，补的过程中，可能长出你没有的东西。

OpenAI 现在 4000 多人，2025 年烧了 80 亿美元现金，到 2030 年计划砸 6000 亿美元的算力。MiniMax 385 人，累计花了 5 亿美元。

谁赢还不知道。但至少现在，赌 MiniMax 会死的人越来越少了。

2014 年那个在百度实习的河南博士生，大概不会想到，十二年后他站在的这个位置，背后连着的是一整场国运级别的技术竞争。

他选择继续跑下去。

免责声明: 本网站转载的文章均来源于公开平台，仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利，请联系 [email protected] 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证，并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考，不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。