1. 创业头条
  2. 前沿领域
  3. AI智能
  4. 正文

对于“百模大战”,几乎所有大佬的口风都180 °大转变了?

 2024-07-13 09:53  来源:A5专栏  我来投稿 撤稿纠错

  阿里云优惠券 先领券再下单

文 | 智能相对论

作者 | 陈泊丞

在2024世界人工智能大会暨人工智能全球治理高级别会议产业发展主论坛上,百度创始人、董事长兼首席执行官李彦宏谈了些对于AI大模型的看法,语惊四座。

他先是指出,“百模大战造成了社会资源的巨大浪费,尤其是算力的浪费。但同时也使得我们追赶世界上最先进基础模型的能力得到了建立。”

而后又强调,“没有应用,光有基础模型,不管是开源还是闭源都一文不值。”同时李彦宏也表示,要跳出移动时代的思维逻辑,避免掉入“超级应用陷阱”,不是只有10亿DAU的应用才叫成功。

可以说,李彦宏的发言挺激烈的。这似乎也是第一次有大佬在这么高级别的场合去把“百模大战”和大模型的发展摊开了说。

当然,秉持着类似观点的,也不只是李彦宏。

金沙江创投主管合伙人朱啸虎在6月的黑马大课上也提到,很多创业者盲目投资AI底层技术。虽然创造了“百模大战”的盛况,但也造成了社会资源浪费。

他强调,“很显然,AI创业的赚钱风向,已经彻底变了。”

怎么变?

除了李彦宏、朱啸虎之外,还有猎豹移动董事长兼CEO、猎户星空董事长傅盛,智谱AI COO张帆、百川智能创始人王小川等大佬在不同的场合也或多或少谈到了大模型行业竞争转变的方向,能最终达成共识的关键点在于“场景”和“应用”。

聚焦基础大模型的“卷”所导致的“百模大战”似乎该喊停了,大模型的重点还是得“卷”场景应用。

大佬们在这一点上达成了共识。今年以来,大家的口风都变了!

不要过度竞争基础大模型,该“卷”场景应用了

在过去一段时间内,美国涌向了大量专注于大模型应用开发的创业公司,如Adept、Stability.ai、Runway、BettrData、Tinybird、UnSkript等等。

同时,像OpenAI、Anthropic这样的大模型头部领军企业以及如谷歌、微软等科技巨头也在致力于利用开源模型或自主研发的基础模型,开发出各种应用场景的解决方案。

GPTs的推出以及OpenAI宣称的一系列给开发者让利的行为,都旨在吸引更多的创业团队参与到GPT技术的创新和应用中,从而丰富GPT生态系统,帮助OpenAI在接下来的时间内占据大模型领域在场景应用方向的优势。

以国外大模型行业的趋势来看,国内这些大佬们的口风转变并非空穴来风。

目前,百度文心一言的日均调用量已经超过5亿,而在两个月前百度官方才刚刚宣布文心一言的日调用量超过2亿。

期间2个月的时间,调用量就发生如此之大的变化,可见大模型要“卷”场景应用不仅仅是厂商们的推动,还有整个市场的需求已经摆上台面,呈现出爆发式增长趋势。

类似的信号也在阿里云的主场上释放。

在世界人工智能大会上,阿里云CTO周靖人公布了近期通义大模型和阿里云百炼平台的最新进展——近2个月,通义千问开源模型下载量增长2倍,突破2000万次,阿里云百炼服务客户数从9万增长至23万,涨幅超150%。

谈及大模型,比起参数上的比较,现如今国内的大佬们似乎更愿意去告诉市场自家的大模型如何好用,有多少人用,接下来还能怎么用等等一系列与场景应用落地相关的事情。

而以朱啸虎为代表的投资者们也开始在应用层去寻找大模型的投资机会。

市场的风向变了,不仅仅只是大佬的口风在变。

“超级能干”的应用在哪?

“AI时代,‘超级能干’的应用比只看DAU的‘超级应用’更重要。”在世界人工智能大会上,李彦宏试图为接下来的大模型应用开发趋势下一个结论。

然而,“超级能干”的应用或许理解起来并不难,市场悬而未决的问题在于这样的应用是如何开发出来的,又是如何推向大众?

基于现阶段的行业表现,「智能相对论」认为有几点思考值得探究。

一、在“超级能干”的应用背后,大模型技术的迭代和适配是必要的。

行业的趋势大多殊途同归,大模型领域在今年以来掀起的MoE架构迭代趋势,则是代表了在技术方面大模型正为“卷”场景应用而作支撑。

如今,OpenAI的GPT-4、谷歌的Gemini、Mistral AI的Mistral、xAI的Grok-1、昆仑万维的天工AI、浪潮信息的源2.0-M32、通义千问团队发布的Qwen1.5-MoE-A2.7B等国内外大模型都采用了MoE架构。

MoE架构通过引入专家网络(Expert Networks)和门控机制(Gating Mechanism)实现了模型的稀疏化和模块化,在数据处理、算力资源调配、输出结果优化等方面都有相当不错的反馈。这为大模型的场景应用落地和推广提供了非常关键的技术支持。

比如,微软就提出了一个端到端的MoE训练和推理解决方案DeepSpeed-MoE,其通过深度优化MoE在并行训练中的通信,减少通信开销,实现了高效的模型并行。此外,DeepSpeed-MoE还提出了基于微调的专家排序机制,可以根据训练过程中专家的损失动态调整输入样本到专家的分配,提升效果。

二、“超级能干”的应用意味着一场更商业化的生态竞争。

技术没问题,但商业化路径不清晰仍然会在今天的市场面临崩盘。日前,微软官网更新了一条通知——“GPT Builder即将停用”。曾经掀起AI圈无数热议与高潮的GPTs似乎正在走向败局。

谁又能想起,当时GPTs概念横空出世的那场发布会还被外界形容为“OpenAI的iPhone时刻”。

OpenAI本意是想借助低门槛的技术能力以及全球开发者们共同打造出一批“超级能干”的应用,结果却因技术问题带来的体验瑕疵以及模糊不清的货币化政策,让GPTs这一概念的商业化路径始终走不通,最终只能“凉凉”。

“超级能干”的应用大多是建立在成熟的商业生态之上,或许全球的AI厂商都需要认清楚这一点。值得一提的,在大洋的彼岸,阿里云在2022年11月牵头发起的开源AI模型社区刚刚斩获2024 SAIL之星奖的魔搭ModelScope。

历经一年多的发展,魔搭社区已成为国内规模最大、最活跃的AI模型社区,汇聚5500多款优质模型和上千数据集,为超过560万开发者提供了模型及免费算力服务。或许,OpenAI没能走通的生态路径,在中国会有新的生机吧。

三、“超级能干”的应用必然萌芽于行业场景中。

朱啸虎送给大模型创业者的忠告,“不要迷信AI,聚焦尖刀场景尽快落地。”——场景是孵化“超级能干”应用的摇篮,然而更深入地来看,也不能只看场景,最终还得看用户反馈和价值呈现。

医疗、教育、金融、制造、交通、农业等等这些行业领域是大模型应用“高发”场景,但打造出来的智能体或解决方案究竟如何,“如人饮水,冷暖自知”罢了。

To B的项目看效率。在快递领域,目前通过大模型来帮助处理订单,就可以做到了“一张图、一句话寄快递”,不再需要其他繁琐的流程,时间从3分多钟缩短到19秒。而且90%以上的售后问题,也都由大模型来解决。——这样的效率提升,才称得上是“超级能干”。

To C的场景看用户。此前,在高峰期,百度的高考智能体每天要回答超过两百万个考生的问题。对于全国1000万的考生来说,这一比例是相当高的。——这样的用户数量,也算得是“超级能干”。

今天,大模型应用覆盖文本生成、数据处理、PPT制作、市场营销、客服售后、医疗诊断等各类通用的和垂直的场景。实际上,市场并不缺场景,而是缺乏能干、有效的应用,“卷”应用须在场景中找用户、找价值。

*本文图片均来源于网络

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
大模型

相关文章

  • 大模型是下一代操作系统的未来,在这届云栖大会上已经到来

    9月24日,2025云栖大会在杭州开幕,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭发表主旨演讲,首次系统性地阐述通往ASI的三阶段演进路线,包括智能涌现、自主行动以及自我迭代等,实现从学习人、辅助人到超越人的发展脉络。基于上述的发展路线,吴泳铭对外做出判断,大模型是下一代的操作系统。“我

    标签:
    大模型
  • 大模型抢滩高考志愿填报,能否顶替「张雪峰」们?

    文/二风来源/节点财经每年高考成绩放榜后,数千万考生和家长将迎来另一场硬仗——填报志愿。今年,这一领域迎来了AI的全面介入,多家互联网大厂和教育公司纷纷推出智能志愿填报产品,为考生提供院校和专业选择建议。据艾媒咨询数据,2023年中国高考志愿填报市场付费规模约9.5亿元,近九成考生愿意借助志愿填报服

    标签:
    大模型
  • 崔大宝:大模型降温背后的难点、卡点、节点

    崔大宝|节点财经创始人进入2024年,大模型似乎有熄火之势:资本市场,与之关联的概念炒不动了,英伟达股价动辄暴跌重挫,引发“泡沫戳破”的担忧;消费市场,BATH们的推新活动少了,产品更新迭代的速度慢了,民众的关注度降了……热闹的大概只剩下两场酣仗:自5月15日字节跳动宣布“以厘计费”,打响国内大模型

    标签:
    大模型
  • 两分钟“熟读”《国史大纲》,大模型的下一个爆点是“书童”?

    年初大模型行业上演“长文本”大战时,我们就萌生过做一个“读书助理”的想法。测试了市面上主流的大模型后,发现普遍存在两个不足:一种是可以处理的文本长度不够,即使有些大模型将文本长度提升到了20万字,像《红楼梦》这样近百万字的名著,还是需要多次才能“读”完。另一种是语言理解和生成能力不足,经常出现“幻觉

    标签:
    大模型
  • 除了烧钱,互联网留给大模型挥霍的“家底”不多了

    互联网或许从未停止创新,只是对于创新的认知下降了。

    标签:
    大模型
  • 弈动 Dynamic·数智跃迁 博弈无界|2025TechWorld智慧安全大会在京召开

    在数字化与智能化深度交织的时代浪潮中,安全的边界不断延展,技术的演进正引领产业迈向新一轮变革。10月24日,以“弈动Dynamic·数智跃迁博弈无界”为主题的2025TechWorld智慧安全大会在北京盛大召开。来自国家部委、院士学者、高校科研机构和企业的权威专家与业界精英齐聚北京,共议AI安全、数

    标签:
    弈动
  • 瓯江论道:AI赋能绿色发展

    2025年10月25日,2025世界青年科学家峰会之人工智能(AI)融合创新发展论坛在浙江温州成功举办。本次论坛由国际院士科创中心主办,中国投资协会能源投资专业委员会、温港院士科创中心承办,中国电工技术学会、中科先进技术温州研究院与温州市电力工程学会提供支持,以“瓯江论道-AI赋能绿色发展”为主题,

    标签:
    ai技术
  • AI云“分野”:阿里云们“卖铲”,火山引擎奇袭“MaaS”

    AI云“分野”:阿里云们“卖铲”,火山引擎奇袭“MaaS”

    标签:
    阿里巴巴
  • 未来5年,中国AI的“大洗牌”和“内循环”

    我觉得我们AI的目标是:从芯片设计到软件生态,全链路自主开发,建立可控的世界级AI体系。所以这是俺对未来5年中国AI圈的展望和判断。(1)2026年,英伟达造车、国产开车26年国产芯片会在推理和垂直场景上发力。以DeepSeek为代表,大多数AI大模型会以软件弥补硬件不足,所以训练和推理分开,训练就

  • H20芯片开卖即叫停,英伟达如何解围?

    文/道哥在深陷“后门”风波、接受网信办问询之后,英伟达的“特供版”H20芯片,又有了新消息。近日,美国科技媒体《TheInformation》援引知情人士消息称,英伟达已悄然向其关键供应商——包括负责封装的安靠科技、供应高带宽内存的三星电子、以及承担后端处理的富士康发出指令,要求暂停所有与H20AI

    标签:
    英伟达
  • 真正的「国产英伟达」来了

    文/二风来源/节点财经一场关于“中国芯”的IPO审议,正把投资者们的目光锁定在上交所。根据上交所发布的公告,上市审核委员会已定于9月26日审议摩尔线程的科创板首发申请。作为中国半导体自主化浪潮中最受瞩目的“考生”之一,包括其创始人显赫的英伟达背景、高达80亿元人民币的募资雄心,以及在国产GPU领域取

    标签:
    英伟达