文 | 智能相对论
作者 | 陈泊丞
在2024世界人工智能大会暨人工智能全球治理高级别会议产业发展主论坛上,百度创始人、董事长兼首席执行官李彦宏谈了些对于AI大模型的看法,语惊四座。
他先是指出,“百模大战造成了社会资源的巨大浪费,尤其是算力的浪费。但同时也使得我们追赶世界上最先进基础模型的能力得到了建立。”
而后又强调,“没有应用,光有基础模型,不管是开源还是闭源都一文不值。”同时李彦宏也表示,要跳出移动时代的思维逻辑,避免掉入“超级应用陷阱”,不是只有10亿DAU的应用才叫成功。
可以说,李彦宏的发言挺激烈的。这似乎也是第一次有大佬在这么高级别的场合去把“百模大战”和大模型的发展摊开了说。
当然,秉持着类似观点的,也不只是李彦宏。
金沙江创投主管合伙人朱啸虎在6月的黑马大课上也提到,很多创业者盲目投资AI底层技术。虽然创造了“百模大战”的盛况,但也造成了社会资源浪费。
他强调,“很显然,AI创业的赚钱风向,已经彻底变了。”
怎么变?
除了李彦宏、朱啸虎之外,还有猎豹移动董事长兼CEO、猎户星空董事长傅盛,智谱AI COO张帆、百川智能创始人王小川等大佬在不同的场合也或多或少谈到了大模型行业竞争转变的方向,能最终达成共识的关键点在于“场景”和“应用”。
聚焦基础大模型的“卷”所导致的“百模大战”似乎该喊停了,大模型的重点还是得“卷”场景应用。
大佬们在这一点上达成了共识。今年以来,大家的口风都变了!
不要过度竞争基础大模型,该“卷”场景应用了
在过去一段时间内,美国涌向了大量专注于大模型应用开发的创业公司,如Adept、Stability.ai、Runway、BettrData、Tinybird、UnSkript等等。
同时,像OpenAI、Anthropic这样的大模型头部领军企业以及如谷歌、微软等科技巨头也在致力于利用开源模型或自主研发的基础模型,开发出各种应用场景的解决方案。
GPTs的推出以及OpenAI宣称的一系列给开发者让利的行为,都旨在吸引更多的创业团队参与到GPT技术的创新和应用中,从而丰富GPT生态系统,帮助OpenAI在接下来的时间内占据大模型领域在场景应用方向的优势。
以国外大模型行业的趋势来看,国内这些大佬们的口风转变并非空穴来风。
目前,百度文心一言的日均调用量已经超过5亿,而在两个月前百度官方才刚刚宣布文心一言的日调用量超过2亿。
期间2个月的时间,调用量就发生如此之大的变化,可见大模型要“卷”场景应用不仅仅是厂商们的推动,还有整个市场的需求已经摆上台面,呈现出爆发式增长趋势。
类似的信号也在阿里云的主场上释放。
在世界人工智能大会上,阿里云CTO周靖人公布了近期通义大模型和阿里云百炼平台的最新进展——近2个月,通义千问开源模型下载量增长2倍,突破2000万次,阿里云百炼服务客户数从9万增长至23万,涨幅超150%。
谈及大模型,比起参数上的比较,现如今国内的大佬们似乎更愿意去告诉市场自家的大模型如何好用,有多少人用,接下来还能怎么用等等一系列与场景应用落地相关的事情。
而以朱啸虎为代表的投资者们也开始在应用层去寻找大模型的投资机会。
市场的风向变了,不仅仅只是大佬的口风在变。
“超级能干”的应用在哪?
“AI时代,‘超级能干’的应用比只看DAU的‘超级应用’更重要。”在世界人工智能大会上,李彦宏试图为接下来的大模型应用开发趋势下一个结论。
然而,“超级能干”的应用或许理解起来并不难,市场悬而未决的问题在于这样的应用是如何开发出来的,又是如何推向大众?
基于现阶段的行业表现,「智能相对论」认为有几点思考值得探究。
一、在“超级能干”的应用背后,大模型技术的迭代和适配是必要的。
行业的趋势大多殊途同归,大模型领域在今年以来掀起的MoE架构迭代趋势,则是代表了在技术方面大模型正为“卷”场景应用而作支撑。
如今,OpenAI的GPT-4、谷歌的Gemini、Mistral AI的Mistral、xAI的Grok-1、昆仑万维的天工AI、浪潮信息的源2.0-M32、通义千问团队发布的Qwen1.5-MoE-A2.7B等国内外大模型都采用了MoE架构。
MoE架构通过引入专家网络(Expert Networks)和门控机制(Gating Mechanism)实现了模型的稀疏化和模块化,在数据处理、算力资源调配、输出结果优化等方面都有相当不错的反馈。这为大模型的场景应用落地和推广提供了非常关键的技术支持。
比如,微软就提出了一个端到端的MoE训练和推理解决方案DeepSpeed-MoE,其通过深度优化MoE在并行训练中的通信,减少通信开销,实现了高效的模型并行。此外,DeepSpeed-MoE还提出了基于微调的专家排序机制,可以根据训练过程中专家的损失动态调整输入样本到专家的分配,提升效果。
二、“超级能干”的应用意味着一场更商业化的生态竞争。
技术没问题,但商业化路径不清晰仍然会在今天的市场面临崩盘。日前,微软官网更新了一条通知——“GPT Builder即将停用”。曾经掀起AI圈无数热议与高潮的GPTs似乎正在走向败局。
谁又能想起,当时GPTs概念横空出世的那场发布会还被外界形容为“OpenAI的iPhone时刻”。
OpenAI本意是想借助低门槛的技术能力以及全球开发者们共同打造出一批“超级能干”的应用,结果却因技术问题带来的体验瑕疵以及模糊不清的货币化政策,让GPTs这一概念的商业化路径始终走不通,最终只能“凉凉”。
“超级能干”的应用大多是建立在成熟的商业生态之上,或许全球的AI厂商都需要认清楚这一点。值得一提的,在大洋的彼岸,阿里云在2022年11月牵头发起的开源AI模型社区刚刚斩获2024 SAIL之星奖的魔搭ModelScope。
历经一年多的发展,魔搭社区已成为国内规模最大、最活跃的AI模型社区,汇聚5500多款优质模型和上千数据集,为超过560万开发者提供了模型及免费算力服务。或许,OpenAI没能走通的生态路径,在中国会有新的生机吧。
三、“超级能干”的应用必然萌芽于行业场景中。
朱啸虎送给大模型创业者的忠告,“不要迷信AI,聚焦尖刀场景尽快落地。”——场景是孵化“超级能干”应用的摇篮,然而更深入地来看,也不能只看场景,最终还得看用户反馈和价值呈现。
医疗、教育、金融、制造、交通、农业等等这些行业领域是大模型应用“高发”场景,但打造出来的智能体或解决方案究竟如何,“如人饮水,冷暖自知”罢了。
To B的项目看效率。在快递领域,目前通过大模型来帮助处理订单,就可以做到了“一张图、一句话寄快递”,不再需要其他繁琐的流程,时间从3分多钟缩短到19秒。而且90%以上的售后问题,也都由大模型来解决。——这样的效率提升,才称得上是“超级能干”。
To C的场景看用户。此前,在高峰期,百度的高考智能体每天要回答超过两百万个考生的问题。对于全国1000万的考生来说,这一比例是相当高的。——这样的用户数量,也算得是“超级能干”。
今天,大模型应用覆盖文本生成、数据处理、PPT制作、市场营销、客服售后、医疗诊断等各类通用的和垂直的场景。实际上,市场并不缺场景,而是缺乏能干、有效的应用,“卷”应用须在场景中找用户、找价值。
*本文图片均来源于网络
此内容为【智能相对论】原创,
仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。
部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。
•AI产业新媒体;
•澎湃新闻科技榜单月度top5;
•文章长期“霸占”钛媒体热门文章排行榜TOP10;
•著有《人工智能 十万个为什么》
•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
9月24日,2025云栖大会在杭州开幕,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭发表主旨演讲,首次系统性地阐述通往ASI的三阶段演进路线,包括智能涌现、自主行动以及自我迭代等,实现从学习人、辅助人到超越人的发展脉络。基于上述的发展路线,吴泳铭对外做出判断,大模型是下一代的操作系统。“我
文/二风来源/节点财经每年高考成绩放榜后,数千万考生和家长将迎来另一场硬仗——填报志愿。今年,这一领域迎来了AI的全面介入,多家互联网大厂和教育公司纷纷推出智能志愿填报产品,为考生提供院校和专业选择建议。据艾媒咨询数据,2023年中国高考志愿填报市场付费规模约9.5亿元,近九成考生愿意借助志愿填报服
崔大宝|节点财经创始人进入2024年,大模型似乎有熄火之势:资本市场,与之关联的概念炒不动了,英伟达股价动辄暴跌重挫,引发“泡沫戳破”的担忧;消费市场,BATH们的推新活动少了,产品更新迭代的速度慢了,民众的关注度降了……热闹的大概只剩下两场酣仗:自5月15日字节跳动宣布“以厘计费”,打响国内大模型
年初大模型行业上演“长文本”大战时,我们就萌生过做一个“读书助理”的想法。测试了市面上主流的大模型后,发现普遍存在两个不足:一种是可以处理的文本长度不够,即使有些大模型将文本长度提升到了20万字,像《红楼梦》这样近百万字的名著,还是需要多次才能“读”完。另一种是语言理解和生成能力不足,经常出现“幻觉
一张证书引发的讨论4月7日,北京嫣然天使儿童医院给陈光标发了一张感谢证书,感谢他捐赠1000万元。这事说起来挺曲折的。此前陈光标高调说要赠给张雪一台价值1300万元的劳斯莱斯,张雪回应“收了,八折卖掉捐给嫣然”,一番拉扯之后,陈光标把车变现,1000万元直接打到了嫣然医院账上。医院发证书感谢,本来是
2026年4月7日,国家安全部就AI核心术语“词元”(Token)发布安全警示,强调在日均调用量突破140万亿规模的市场背景下,需高度警惕由此引发的数据泄露与金融诈骗风险。据统计,截至今年3月,我国日均词元调用量已超过140万亿,较2024年初增长1000多倍。词元作为大模型处理信息的最小单元,兼具
如今出门,如果你还没用过AI智能助手,可能真有点跟不上节奏了。无论是写作文、查资料,还是规划出行路线,越来越多的人已经习惯随手打开AI问一句。这股热潮背后,中国AI大模型用实打实的数据交出了一份亮眼的成绩单。根据全球知名AI模型聚合平台OpenRouter的最新数据,在3月30日至4月5日这一周,中
01别在主电脑上养!这是最最重要的一条“保命”建议。很多小白心血来潮,直接在自己存着毕业论文、工作文件、银行卡信息的主力电脑上部署OpenClaw。然后悲剧发生了:让龙虾帮忙整理一下桌面文件,结果它把整台电脑的文件全删了。这不是段子,是真事。OpenClaw一旦被授予高权限,就能执行删除、修改等不可
01免费领养,但饲料要钱很多人第一次听说OpenClaw时,脑子里冒出的第一个念头是:开源软件,那不免费吗?没错,OpenClaw本身确实是开源的,下载安装一分钱不收。但你很快就会发现,真正的开销根本不在这里。养一只“龙虾”,就像领养了一只宠物——领养免费,但“虾缸”“虾粮”“虾保姆”都得自己掏钱。
一只“龙虾”,火遍全网“今天你养龙虾了吗?”这句话在2026年初,迅速取代“吃了吗”成为社交媒体上的新晋暗号。别误会,这不是什么水产养殖新风口。这里说的“龙虾”,是一款名为OpenClaw的开源AI智能体。因为它的图标是一只红色龙虾,网友们便把部署、配置和使用它的过程,戏称为“养龙虾”。一个开源软件
凌晨两点,小王合上笔记本,揉了揉酸胀的眼睛。花了一个月写出来的10万字短剧剧本躺在硬盘里,要真正把它拍成剧,得找演员、租场地、请摄像、做后期……粗算下来少说要几十万,他只能把剧本继续锁在抽屉里。不过,现在小王的剧本可以“见光”了。2026年3月19日,字节跳动旗下的小云雀AI正式上线了短剧Agent
你一定遇到过这样的场景:明明刚和AI助手聊了半个小时的项目细节,退出会话后重新打开,它却像个失忆患者一样,连你上一轮说过什么背景信息都忘得一干二净,你又得从头把需求讲一遍。这种“聊完就忘”的体验,让无数使用AI智能体的用户深感头疼。为了解决这一普遍困扰,腾讯云在4月3日正式推出了名为“龙虾”的记忆服
4月3日凌晨,谷歌DeepMind悄然甩出一枚重磅炸弹——全新一代开源大模型Gemma4正式发布,以极其宽松的Apache2.0协议向全球开发者免费开放。这是自2025年3月发布Gemma3以来,谷歌时隔整整一年的重大迭代。本次发布的Gemma4包含四个不同规格的版本:E2B(有效20亿参数)、E4
AI龙虾也会生病。别怕,大部分病不是什么绝症,自己在家就能治。我养OpenClaw一年多,总结出五种最常见的毛病,附上我的“土方子”,希望对你有用。病一:不吃食(完全不执行任何任务)症状:你给了指令,它没反应,日志里一片空白。就像龙虾趴在塘底不动弹,碰它也不理。病因:通常是进程卡死了,或者依赖服务没