2025年10个顶级GPU云平台：Serverless+RL开启AI普惠时代

2025-06-24 17:42 来源：我来投稿撤稿纠错

近期，“AI新云”（NeoCloud）概念在科技圈和投资圈引发热潮。

今年3月，被业内称作“英伟达亲儿子”的AI基础设施企业CoreWeave上市。这家依托英伟达GPU资源冲击新云市场的初创公司，上市不到3个月市值飙升359%，达881亿美元。

CoreWeave的“身价暴涨”吸引了无数视线。对此，不少业内人士指出，大模型的训练和推理应用都异常烧钱，高昂成本已是大模型规模化应用的关键挑战之一。在此背景下，被称为AI新云的GPU专用云服务平台迅速崛起。相较通用云服务，此类平台更能精准解决AI真实场景落地的痛点。

2025年上半年的的产业图景印证了这一趋势。主流云平台拥抱“无服务器架构（Serverless）+强化学习（RL）”的技术栈，不仅解决了传统算力成本高企的行业痛点，更推动多模态创作、机器人训练等场景效率实现指数级提升。

毫无疑问，这场由底层计算框架驱动的智能进化，为智能体边界的拓展按下了快进键。全球GPU云市场正在酝酿新的产业造富故事。

Serverless+RL，智算云按下AI应用“快进键”

今年，“DeepSeek时刻”震惊全球，大模型厂商纷纷加速模型迭代，智能体大规模部署应用的元年开启。而在全球智能体掘金热潮中，提供底层算力的AI新云悄然成为最重要的“卖水人”。

自2013年起便深耕中国人工智能基础设施领域，有着丰富行业经验的九章云极董事长方磊指出，“从移动互联网‘带宽式应用’到AI时代‘计算密集型应用’的结构性变革，亟需新型云架构支撑。”

海外市场，以CoreWeave为代表，包括Crusoe、Lambda Labs等AI基础设施服务商正加速扩张。而国内同样参与者众多，比如2025年第二季度，阿里云、九章云极等企业先后发布新一代AI基础设施服务，如阿里云的FlashMoE和九章云极基于Serverless+RL架构的九章智算云Alaya NeW Cloud。

AI基础设施厂商快速发展的背后，是企业正在加速部署AI规模化应用。有机构认为，AI常因高昂的算力成本和复杂的部署被视为“极客的游戏”，而非企业的“生产工具”，但随着GPU云的快速普及，让AI快速成为企业的一个“新生产力”。

聚焦AI云计算和基础设施建设的厂商开始探索各种新技术路线，解决AI应用落地的痛点。

在此背景下，“Serverless+RL”技术组合逐渐脱颖而出。这两项技术并非全新概念，但它们的深度融合正悄然改写智能应用的开发逻辑，并重塑AI产业的成本结构与创新效率。

Serverless的核心价值在于“按需使用、按量付费”。企业无需预置服务器，只需关注业务逻辑，云服务商会自动完成资源分配。而强化学习（RL）则是一种通过“试错-反馈”机制优化决策的算法，推动智能体能力从“对话问答”（听话）向“任务执行”（聪明）跃迁。

强化学习的核心价值在于，让AI从人类反馈中学习。这样做的好处是，不仅可以调优推理行为，还实质性的增强模型的推理能力，让模型听话，也可以让模型更聪明。

这意味着企业能以更低的成本、更快的速度迭代智能应用，加速AI技术的落地，引发从“参数竞赛”到“场景落地”的产业转向。因此，Serverless+RL的融合不仅是技术层面的进步，更是AI产业商业化的加速器。

从“技术炫技”到“商业落地”，也必然带来新一轮产业发展的红利，全球GPU云厂商正站在关键拐点。在这场变革中，谁能率先掌握技术融合的红利，谁就能在未来的竞争中占据先机。

智能时代加速演进，三大趋势揭示技术红利

2025年上半年，技术降本和创新效率成为人工智能、机器人产业发展的关键词，也正因此，Serverless与RL两大技术路线的组合受到了业界广泛的关注，有望成为推动智能体商业化爆发的重要技术路线。我们从GPU云厂商、大模型公司和机器人等多个领域观察到这一趋势。

关键趋势一：GPU云厂商加速技术降本和AI开发服务升级

1、九章云极：发布九章智算云Alaya NeW Cloud 2.0，开创中国Serverless+RL技术路线。

6月16日，作为国家算力互联网试验网建设的重要成员，AI独角兽九章云极DataCanvas发布了新一代全栈智能计算云平台——九章智算云Alaya NeW Cloud 2.0，并同步启动全球首个强化学习智算服务，为中国近百万的AI应用开发者和科研机构提供普惠性智算云服务。

该平台深度融合Serverless架构与强化学习技术，实现子算成本革新：独创“1度算力”按实际消耗计费模型，显著降低使用门槛。实测显示，其多模态训练推理成本仅为行业均值40%，多场景拍摄效率提升35%，虚拟场景制作耗时从2小时减少至20分钟，动画电影制作成本降低60%。

相比海外以CoreWeave为代表的资源型企业，九章云极展现出中国厂商更关注技术“用处”的不同思路。九章智算云Alaya NeW Cloud 2.0集成了丰富的AI开发框架和工具，如TensorFlow、PyTorch等，支持多种编程语言，方便开发者快速构建和训练AI模型。

与海外平台围绕资源布局不同，九章云极增加AI技术权重，围绕智能计算中心算力调度这一国际顶尖能力，连续突破AIDC智能体的技术门槛，形成算力调度智能技术专利护城河——本季内，九章云极先后发布了“智能体调试智能体方法”、“大模型函数调用优化方法“、”生成多智能体协作系统方法“、”智能体开发工具函数方法“等多个专利，发布“国内首个智算调度Agent“。

2、CoreWeave：成为ClusterMAX™评级体系铂金级GPU云服务商

CoreWeave整体用户体验和性能表现优秀，已达到ClusterMAX™评级体系的铂金标准。CoreWeave技术路线深度绑定NVIDIA生态，在AI训练领域具备先发优势，是AI算力基础设施领域的专业化服务商代表之一。

3、Lambda Labs：完成D轮融资，成本与客户体验是GPU云平台关键方向

Lambda labs，宣布成功完成了4.8亿美元的D轮融资，使其总股本达到了8.63亿美元。据悉，此次融资由Andra Capital和SGW共同主导，NVIDIA、ARK Invest等投资者参与其中。

据Lambda Labs联合创始人兼首席执行官，Stephen Balaban自述，因为AWS 的GPU 云实例极其昂贵，Lambda Labs决定自己组建GPU 服务器集群，然后为客户提供更具性价比的解决方案。

此外，Lambda正在积极开发托管Slurm服务，这将大幅提升客户体验。

4、Google Cloud：Next 25大会上发表多项AI创新，成本性能双突破

Google Cloud 通过提供搭载 NVIDIA B200 和 GB200 GPU 的 A4 和 A4X 虚拟机，为客户提供更多 AI 硬件选择。Google 也将成为首家提供 NVIDIA 新一代 Vera Rubin GPU 的云提供商。

Cloud Wide Area Network（Cloud WAN）针对应用程序性能进行优化，可提供超过40%的性能提升，同时降低高达40%的总体持有成本。

趋势一小结：无疑，成本和开发者体验成为云GPU厂商竞争的两大价值锚点，而Serverless+RL的优势凸显，有望成为AI新云发展的核心技术驱动力。

关键趋势二：大模型部署与推理应用聚焦成本

1、聚焦云上部署Deepseek，国内云厂商大幅降低部署成本。

DeepSeek-R1的问世让低成本的模型训练变得可行。方磊就此提出，能否为数千万开发者提供普惠算力服务，将成为决定AI云企业竞争力的重要考核维度。

然而，以DeepSeek-R1大模型来看，权重显存达700GB，需16张96GB显存GPU多机部署，依然面临高昂硬件成本与跨机传输效率挑战，云端部署方案破解瓶颈势在必行。

近期，国内科技巨头纷纷针对DeepSeek云上部署作出优化。比如，阿里云支持一键部署DeepSeek系列模型，提供弹性算力与自定义环境，按需付费模式大幅降低硬件投入；九章智算云结合Serverless与强化学习（RL）技术复现DeepSeek- R全参数微调，在 AIME 2024 基准上取得了81.70%准确率(采样)，超越了DeepSeek-R1满血版，部署成本降至40%。

这些信息说明。AI普惠的进程在GPU云厂商推动下正在持续加速。

2、OpenAI：模型加速迭代，成本持续优化。

再看大模型厂商，同样在迭代大模型能力的同时，持续改进降本。比如，近期OpenAI新上线的o3-pro不仅有更强的能力，可以访问一系列工具，包括网页浏览、文件分析、视觉推理、基于内存的个性化响应等，更有更低的花费，输入的价格为20美元100万tokens，输出则是80美元100万tokens，较这一模型所取代的o1-pro降低了87%。100万tokens相当于75万个单词。

趋势二小结：随着模型使用成本持续优化，AI Agent将爆发式发展，带来更多算力需求，GPU云厂商将从中受益。

关键趋势三：Serverless+强化学习成机器人产业“关键技术”

1、宇树科技：强化学习代码全面开源。

宇树科技开源培训训练了其机器人训练的所有源代码包括了强化学习（RL）代码、从模拟到模拟（Sim-to-Sim）和从模拟到现实（Sim-to-Real）的源代码。该项目可以帮助开发者或研究人员在虚拟环境中模拟和机器人，然后把结果转移到机器人上。既降低试错成本，又保障训练安全。

2、特斯拉擎天柱：完全通过强化学习（RL）在模拟环境中训练。

特斯拉公布了机器人擎天柱的训练方式：用强化学习（RL）+模拟器来机器人的方法，让擎天柱看互联网上的视频，学动作，然后在模拟器里，用强化学习提升可靠性。擎天柱的发展已经进入快车道，未来的进步速度很可能会非常吓人。

总结：强化学习（RL）已深度融入生成式AI的对齐优化与机器人自主进化流程，而Serverless架构则通过重塑资源供给模式，为智能体提供弹性算力基座。未来，Serverless+RL有望成为驱动智能体规模化落地的核心技术路线。

结语

Serverless与强化学习（RL）的技术组合正在让AI开发从“参数竞赛”变成“场景落地”，新的投资机会正在涌现。

历史经验表明，最具商业价值的企业，往往通过重塑客户成本结构实现爆发式增长。

不像想象，GPU云平台在新的技术路线加持下，将激发指数级增长的智能场景需求，成为智能体时代的超级潜力股。

来源：美股研究社

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

相关标签: ai智能

Figma股价热情仅存1天，AI焦虑成关键隐忧？

文/道哥美国设计软件公司Figma近期在纽约证券交易所挂牌上市，首日即上演“狂飙”行情——发行价定每股33美元，开盘报价85美元，较发行价翻倍。首日收报115.50美元，较发行价大涨约250%，市值飙升至近670亿美元，创下近30年来同等规模美股IPO的最大单日涨幅纪录。然而，随着短线资金获利了结，

标签：

ai智能
AI「带飞」腾讯业绩

文/一灯来源/节点财经在当前无人敢缺席的AI军备竞赛中，巨头们一面为巨额的资本支出焦虑，一面又向市场勾勒着未来的宏伟蓝图。在各家动辄千亿级投入的背景下，市场迫切需要一份关于AI回报价值的有力证明。而腾讯，率先给出了答卷。8月13日，腾讯控股发布2025年第二季度财报。尽管资本开支同比剧增119%，达

标签：

ai智能

腾讯
Meta用亿元薪酬发起「人才狙击」能否买来一个AI未来？

文/二风来源/节点财经2025年的硅谷，一场没有硝烟的战争正以前所未有的烈度上演。这场战争的核心武器不是代码或芯片，而是人——那些全球仅有数千名、能够构建未来人工智能基础模型的顶尖大脑。在这场激烈的人才争夺战中，Meta及其首席执行官马克·扎克伯格（MarkZuckerberg）正扮演着最具侵略性的

标签：

ai智能
腾讯AI梦：克制的雄心

关乎14亿用户的深刻变化

标签：

ai智能
Manus「撤出」中国，昔日AI Agent新星为何仓促离场？

文/道哥大举裁员、清空账号、国内IP无法访问——曾被誉为“中国AIAgent希望之星”的Manus，在估值飙至5亿美元的高光时刻“闪离”中国市场。近日，Manus“裁员、出走”的消息在媒体端大量发酵。消息称，Manus公司总部将由中国迁至新加坡，其国内团队也将大幅裁撤——原有120人规模团队除40余

标签：

ai智能

一秒当导演：小云雀上线短剧Agent，10万字剧本一键生成60集

凌晨两点，小王合上笔记本，揉了揉酸胀的眼睛。花了一个月写出来的10万字短剧剧本躺在硬盘里，要真正把它拍成剧，得找演员、租场地、请摄像、做后期……粗算下来少说要几十万，他只能把剧本继续锁在抽屉里。不过，现在小王的剧本可以“见光”了。2026年3月19日，字节跳动旗下的小云雀AI正式上线了短剧Agent

标签：

大模型
腾讯云推出“龙虾”记忆服务，准确率飙升近六成

你一定遇到过这样的场景：明明刚和AI助手聊了半个小时的项目细节，退出会话后重新打开，它却像个失忆患者一样，连你上一轮说过什么背景信息都忘得一干二净，你又得从头把需求讲一遍。这种“聊完就忘”的体验，让无数使用AI智能体的用户深感头疼。为了解决这一普遍困扰，腾讯云在4月3日正式推出了名为“龙虾”的记忆服

标签：

腾讯云

ai龙虾是什么
谷歌 Gemma 4 正式开源，开源赛道迎来变局！

4月3日凌晨，谷歌DeepMind悄然甩出一枚重磅炸弹——全新一代开源大模型Gemma4正式发布，以极其宽松的Apache2.0协议向全球开发者免费开放。这是自2025年3月发布Gemma3以来，谷歌时隔整整一年的重大迭代。本次发布的Gemma4包含四个不同规格的版本：E2B（有效20亿参数）、E4

标签：

大模型
OpenClaw常见的五种“病”，到底该怎么“治”？

AI龙虾也会生病。别怕，大部分病不是什么绝症，自己在家就能治。我养OpenClaw一年多，总结出五种最常见的毛病，附上我的“土方子”，希望对你有用。病一：不吃食（完全不执行任何任务）症状：你给了指令，它没反应，日志里一片空白。就像龙虾趴在塘底不动弹，碰它也不理。病因：通常是进程卡死了，或者依赖服务没

标签：

ai龙虾是什么

ai小龙虾什么意思

openclaw小龙虾
普通人怎么养AI龙虾，别让你的AI龙虾饿着或撑着

养过真龙虾的人都知道，投喂是个技术活。喂少了，龙虾饿得互相残杀；喂多了，剩饵坏水，整塘发病。OpenClaw这个AI龙虾也一样——你给它安排的任务太少，它会“闲得发慌”，反应迟钝；你一次塞给它太多复杂任务，它会“消化不良”，要么报错要么干一半就卡住。每天该喂几次？我的经验是：每天喂两次，早上一次简单

标签：

ai龙虾是什么

ai小龙虾什么意思

openclaw小龙虾
选对版本和“饲料”，OpenClaw小龙虾才能长得壮

养过真龙虾的人都知道，苗种的好坏直接决定收成。养AI龙虾也一样——OpenClaw有不同版本，有的稳定但功能少，有的功能多但爱“闹脾气”。新手该怎么选？我用自己的踩坑经历告诉你。版本怎么选？OpenClaw目前主要有三个分支：稳定版（Stable）、测试版（Beta）和社区魔改版（Community

标签：

ai龙虾是什么

ai小龙虾什么意思

openclaw小龙虾

入坑OpenClaw前，先问问自己这三件事

我第一次听说OpenClaw，是在一个技术群里。有人发了一串代码，说“这个AI龙虾特别好养，会自己找食吃”。我好奇点进去，结果对着终端发了一小时呆——连环境都没搭起来。后来我才明白，养AI龙虾跟养真龙虾一样，新手入门得先做足功课。第一问：我的电脑跑得动吗？很多人以为AI龙虾就是个聊天机器人，打开网页

标签：

ai龙虾是什么

openclaw小龙虾

ai小龙虾什么意思
字节火山引擎Seedance 2.0正式面向普通API客户开放申请，豆包大模型日均Token使用量突破120万亿

4月2日，字节跳动旗下火山引擎在武汉举行的AI创新巡展上宣布，Seedance2.0API正式面向企业用户开启公测。同时，火山引擎总裁谭待在会上披露，截至今年3月，豆包大模型日均Token使用量已突破120万亿，在过去三个月内增长一倍，比2024年5月发布时增长1000倍。Seedance2.0：从

标签：

大模型

火山引擎
养“虾”被骗、数据泄露、天价账单……遇到这些糟心事该怎么办？

养AI小龙虾的路上，坑不少。有人被代装服务骗了钱，有人电脑中了毒，有人收到天价账单，还有人发现AI“失控”了，开始乱删文件。如果你也遇到这些糟心事，别慌。下面这份“养虾应急包”，告诉你第一时间该做什么。场景一：代装被骗，钱打水漂了花了300块找人远程装OpenClaw，结果对方收了钱就拉黑，或者装了

标签：

ai龙虾是什么

ai小龙虾什么意思

openclaw小龙虾
把“钥匙”交给AI，如何防止它“拆家”？数据安全实操手册

把AI智能体请进电脑，就像把家里所有的钥匙交给了一个陌生人。它能帮你打扫房间、整理文件，但万一它“起了坏心”，或者被坏人利用了，你的家就不再安全了。这不是危言耸听。国家互联网应急中心已经发布风险提示，指出OpenClaw的默认配置“极为脆弱”，攻击者一旦得手，能轻易获取系统控制权。微软安全团队也警告

标签：

ai龙虾是什么

ai小龙虾什么意思

openclaw小龙虾

加载更多

2025年10个顶级GPU云平台：Serverless+RL开启AI普惠时代

相关文章

Figma股价热情仅存1天，AI焦虑成关键隐忧？

AI「带飞」腾讯业绩

Meta用亿元薪酬发起「人才狙击」能否买来一个AI未来？

腾讯AI梦：克制的雄心

Manus「撤出」中国，昔日AI Agent新星为何仓促离场？

一秒当导演：小云雀上线短剧Agent，10万字剧本一键生成60集

腾讯云推出“龙虾”记忆服务，准确率飙升近六成

谷歌 Gemma 4 正式开源，开源赛道迎来变局！

OpenClaw常见的五种“病”，到底该怎么“治”？

普通人怎么养AI龙虾，别让你的AI龙虾饿着或撑着

选对版本和“饲料”，OpenClaw小龙虾才能长得壮

入坑OpenClaw前，先问问自己这三件事

字节火山引擎Seedance 2.0正式面向普通API客户开放申请，豆包大模型日均Token使用量突破120万亿

养“虾”被骗、数据泄露、天价账单……遇到这些糟心事该怎么办？

把“钥匙”交给AI，如何防止它“拆家”？数据安全实操手册

热门排行

编辑推荐