2023年可以说是人工智能行业最振奋的一年,大模型的能力每隔一段时间就会上一个新台阶,汹涌澎湃的技术革命迅速影响着每一个人的生活,AGI不再是一种技术理想,而是触手可及的现实。
到了2024年,人工智能的热度不减,但口口相传的“百模大战”并未上演。资本市场罕见地“降温”,不少大模型悄无声息地消失,有机会进入决赛圈的大模型创业者,仅剩下寥寥数家。
其中就有孵化出海螺AI的MiniMax,一家不为太多人所熟知,估值却早已超过25亿美元的现象级独角兽。
01 技术路线几乎没有退路
目前国内估值超过10亿美元的大模型创业团队只有五六家,MiniMax恰恰又是其中最为特殊的存在:
1、月之暗面、百川智能、零一万物等均成立于2023年,MiniMax却是一家诞生于2021年的企业,比友商们早了两年时间。
2、有别于李开复、王小川等人的“明星”身份和高调风格,MiniMax的创始人闫俊杰不可谓不低调,很少在公开场合露面。
3、“抢算力”俨然是整个AI行业的常态,MiniMax没有够购买任何GPU,而是以相对便宜的价格找火山引擎租了大量GPU算力。
为何特立独行的MiniMax能够活下来?答案就藏在闫俊杰时常提及的一句话里:“我选的技术路线几乎没有退路”。
直接的例子就是MoE(混合专家模型)上的“豪赌”。
时间回到2023年夏天,国内的大模型厂商们纷纷加快了研发进度,摆在MiniMax面前的现实问题是:自家2B和2C的产品已经有很多用户,传统dense(稠密)模型生成token的成本太高,延时太严重;在计算资源有限的情况下,只有MoE才能训练完当时的数据。
理论上讲,MoE相较于dense模型的预训练速度更快,在相同参数的情况下,有着更快的推理速度,但在微调方面存在诸多挑战,比如泛化能力不足容易引发过拟合现象,属于典型的“技术派才有的红利”。
其他厂商选择dense模型快速迭代的时候,MiniMax放了80%以上的算力和研发资源做MoE,而且没有Plan B。
拐点出现在2024年初,MiniMax发布了国内首个基于MoE架构的abab 6,找到了越来越多加速实现Scaling Laws的途径,包括改进模型架构、重构数据pipeline等等,并在三个月后研发出了更强大的abab 6.5。
正如外界所熟知的,长文本能力在2024年成为生产力工具的“胜负手”,万亿参数的abab 6.5已经200k tokens 的上下文长度,综合能力已经不逊于国外主流大模型;使用同样的训练技术和数据的abab 6.5s,进一步提升了推理速度,可以在1秒内处理近3万字的文本。
按照业界常用的“大海捞针”机制,即在很长的文本中放入一个和该文本无关的句子(针),然后通过自然语言提问模型,看模型是否准确将这个针回答出来。在891次问答中,abab 6.5均能正确回答。
现在,MoE模型已经上升为行业共识,被认为是高性能AI大模型的必选项,而MiniMax已经在这条路上“抢跑”了一年。
02 技术驱动的产品方法论
让许多人没想到的是,一群痴迷于技术的工程师,“意外”做出了多个日活用户超过100万的产品,包括Glow、星野、海螺AI等,涵盖内容社区、生产力工具等不同方向。
曾有媒体在采访时询问闫俊杰:“你们第一个模型还没做出来,就招了产品经理,当时你如何向他描述你想要一个怎样的产品?”出乎预料的是,闫俊杰给出的回答只要三个字:“不知道。”
闫俊杰口中的“不知道”,源于对技术的敬畏:当前AI原生的超级产品,无不源自突破性的技术进步。
比如搜索问答几乎是所有对话式AI的标配,也是我们使用生产力工具提升工作效率的刚需功能。但越是基础的功能,越能验证生产力工具的价值,考验背后大模型的能力。
百度发布2024年Q1财报后,我们同时在海螺AI和国外的一款产品进行了对比,用户体验可谓高下立见:
海螺AI整理出了百度的核心业务信息,包括营收、利润等关键数据,以及百度智能云、开发者社区、百度APP、萝卜快快等核心业务数据,有着清晰的逻辑和侧重,并且每条内容都关联了对应的信息源,甚至在末尾附加了和百度财报相关的常见问题。
另一款产品也准确回答了财报的核心信息,但仅仅引述了一些媒体报道,输出内容的结构化很弱,需要人工二次处理信息。和直接用搜索引擎查找信息的方式相比,并未节省太多的时间。
再比如长尾内容的检索和生成能力。像百度财报这样的热门议题,很容易找到相关的媒体报道,一些小众的长尾内容,似乎更能考验生产力工具的内容检索和生成能力。
我们的问题是皮尔斯·布朗的代表作《火星崛起》,曾被《娱乐周刊》评为2014年度最佳图书,但知名度不如《火星救援》、《星球崛起》等可能被AI混淆的名著。海螺AI准确理解了我们的需求,生成的故事梗概可圈可点,并给出了深刻的评价;豆包将我们的需求误解为《星球崛起》,生成的内容居然是《火星三部曲》的介绍。
技术的上限左右着产品的上限。
MiniMax之所以做出了海螺AI这样“能打”的生产力工具,根源在于技术驱动的产品方法论,只有具备足够好的产品能力,才能承接和转化取得的技术进展,否则会落得一场空。
当然,MiniMax也有自己的“野心”。就像闫俊杰所筹划的:“在技术快速进化的窗口关闭前,做出用户量巨大的To C产品。”
03 做普通人每天用的产品
资本圈里流传着一句话:判断一位人工智能创业者是否真正的AGI信仰,就看这个人创业是在2023年之前还是之后。作为普通用户,则有另一套判断标准,即能不能解决实际问题,扎扎实实地提高工作效率。
行事低调的闫俊杰,很少围绕AGI的话题高谈阔论,但在媒体采访时讲述了自己朴素的信仰:Intelligence with everyone。
怎么理解“与用户共创智能”?海螺AI无疑是最直观的研究对象。
生产力工具作为当下最拥挤的大模型赛道,市面上的产品已经多达几十款,豆包、文心一言、智谱清言、Kimi……哪怕是在高度内卷的局面下,肩负MiniMax信仰的海螺AI,依然表现出了差异化和稀缺性。
首先是简洁的产品设计。
为了争夺用户的注意力和时长,越来越多的对话式AI产品在首页上添加了丰富的菜单栏,努力向用户表达功能的多样性。海螺AI不可谓不克制,首页上除了简单的功能引导和对话框外,并没有其他影响注意力的元素。
不同的设计风格,似乎谈不上孰优孰劣,但从生产力工具的定位来说,页面的简洁与否和大模型能力不无关系。倘若大模型的能力足够强大,哪怕没有花里胡哨的功能露出,也可以通过生成的内容占领用户心智。刻意强调功能的多样性和玩法的趣味性,反而在大模型的能力上漏了怯。
其次是过硬的产品能力。
诸如搜索问答、语音对话、长文总结等功能,早已是对话式AI产品的标配,也是高度同质化的主要诱因。但只要深入使用一段时间,或者进行简单的结果对比,并不难判断能力上的高下,找到最适合的生产力工具。
而产品能力的强弱,往往体现在一些细节中。以我们高频使用的长文总结为例,将第三方行业报告上传到海螺AI,可以准确梳理报告的核心信息,并根据报告内容进行对话。原先阅读一篇报告需要至少两个小时的时间,现在不到5分钟就能完成,工作效率可以说是实现了指数级增长。
然后是多元的使用场景。
有些产品尽可能在首页上推荐足够多的“角色”,来告诉我们有很多使用场景,适合不同的用户。仅仅在prompt下功夫,当真可以满足不同人群的需求吗?市场初期也许奏效,可终归不是解决问题的最优解。
海螺AI的答案是从能力上满足不同人群的需求:帮研究人员快速总结和分析长篇学术论文或研究报告、帮内容创作者整合关键信息并生成爆款文章、帮知识工作者整理和回顾学习资料、为日常用户提供生活中的即时帮助……就像是一个能打的六边形战士,背后是万亿参数MOE大模型的底气。
一言以蔽之,只有做出足够产品化、能服务大众的AI技术和产品,才可以给社会带来足够高的反馈。在MiniMax的认知里,AGI不是原子弹那样的大杀器,而是普通人每天会用的产品和服务。
04 写在最后
每一次代际演变的出现,都会经历百花齐放到超级APP“统治”市场的过程。
大模型的产品化也不例外。现阶段AI产品的核心价值,主要来自模型性能和算法能力,不排除会上演“赢者通吃”的一幕。特别是对于寻求生产力的用户,拥抱海螺AI这样的超级APP,卸载掉“尝鲜”时下载的几十个APP,将是可以预见的结果。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
四个月前邀请码炒至10万元,如今官网变灰、社交账号清空,这家AI新贵的闪电迁移折射中国科技企业出海潮涌。7月11日,打开Manus官网的用户发现一则突兀提示:“Manus在你所在的地区不可用”。而就在不久前,这个位置还显示着“Manus中文版本正在开发中”的乐观声明。同时,Manus官方微博和小红书
文/十界来源/节点财经一场围绕算力自主的竞赛,正在科创板上演。近日,国产全功能GPU厂商摩尔线程递交科创板招股书,拟募资约80亿人民币,成为今年上半年科创板拟募资规模最大的冲刺者,也打响了“国产英伟达”上市的第一枪。据招股书显示,摩尔线程自2020年成立以来,主营全功能GPU芯片的研发与销售,以自主
“AI大模型六小虎”百川智能危机重重。这是前搜狗CEO王小川创办的AI公司。昨天就爆出新闻,百川智能的联合创始人离职,这是王小川入局AI的第一道大坎。接下的成败非常关键:(1)拿下河北(2)学习科大讯飞百川智能离职高端概览:(1)2025年7月10日,百川智能技术联合创始人谢剑将离职。他是百川只能的
百度AI团队今日正式推出PaddleOCR3.1版本,以突破性的多语言组合识别(MultilingualCompositionPerception,MCP)技术为核心,彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别,为全球化企业、跨境业务及多元文化场
“宇树已形成硬件、算法、场景联动的业务飞轮,自研率超95%的技术壁垒让其成为全球机器人赛道不可忽视的中国力量。”首程资本管理合伙人朱方文在追加投资时如是评价。7月7日,据每日经济新闻从宇树科技投资方处获悉,国内人形机器人领军企业宇树科技(UnitreeRobotics)已明确计划于科创板IPO,预计
推理与多模态的终极融合,将彻底终结用户在不同模型间切换的烦恼。7月7日,OpenAI正式确认将在今年夏季推出新一代人工智能模型GPT-5。这一突破性产品将整合现有的多个强大模型,特别是融合专注推理能力的“O系列”与具备多模态功能的“GPT系列”,为用户提供前所未有的统一体验。OpenAI开发者体验负
高考一结束,忙坏了海内外一众大模型。豆包、DeepSeek、ChatGPT、元宝、文心一言、通义千问……掀起了一波“AI赶考”大战。据悉,去年高考期间,大模型的成绩才勉强过一本线,今年集体晋升985。据悉,豆包甚至过了清北的录取线。头部大模型在高考“考场”上玩得不亦乐乎,中小AI创企的处境却日益尴尬
文/二风来源/节点财经每年高考成绩放榜后,数千万考生和家长将迎来另一场硬仗——填报志愿。今年,这一领域迎来了AI的全面介入,多家互联网大厂和教育公司纷纷推出智能志愿填报产品,为考生提供院校和专业选择建议。据艾媒咨询数据,2023年中国高考志愿填报市场付费规模约9.5亿元,近九成考生愿意借助志愿填报服
苹果还没从WWDC25的“群嘲”中走出,又迎来了一次新的痛击。据路透社报道,21日,苹果公司遭到股东集体起诉,被指在信息披露中低估了将先进生成式AI整合进语音助手Siri所需的时间,导致iPhone销量受影响、股价下滑,构成证券欺诈。在这份诉讼中,库克、首席财务官凯文·帕雷克及前首席财务官卢卡·马埃