Agent还没来，昇腾已经把从硬件到软件的路铺好了

2026-05-30 10:12 来源：互联网我来投稿撤稿纠错

文 | 智能相对论

作者 | 陈泊丞

从去年开始，中国大模型能力已经追到了全球第一梯队。MiniMax M2.5、Kimi K2.5的Token消耗量在OpenRouter上长期位居前列，DeepSeek V4也常被拿来与GPT-5对标。但很多人忽略了，这些模型之所以“能跑”，是因为现有算力底座“够用”。

那什么时候“够用”会不够用呢？答案是Agent时代。而且，在这个阶段，“能跑”和“跑得舒服”，又是两码事。

在今年的鲲鹏昇腾开发者大会2026——昇腾AI开发者峰会2026上，昇腾给出了一个更底层的量化洞察：过去一年，模型调用频次暴涨50到100倍，序列长度从Chatbot时代的4K飙升至接近1M，相当于250倍的跨度。MoE推理对时延的要求也越来越苛刻，正从10毫秒向1毫秒级别逼近。

这不是“模型变大了”的量变问题，而是整个算力底座的底层逻辑需要被重写的质变信号。所以，真正的问题不是“现有算力够不够”，而是当Agent的胃口以指数增长，不仅消耗得更多，而且创造的需求在井喷，那么现有算力架构的“够用”还能撑多久？

基于这个视角，我们会发现，昇腾今年在峰会上讲的三件事，即超节点架构创新、软件全面开源开放、开发者体验升级，背后的本质上都是在回答同一个问题：算力底座如何从“能跑模型”进化到“天然亲和Agent”？

这不是三个独立的议题，而是从硬件到软件到开发者的一整条技术链，必须在Agent前夜完成的一次系统性重构。

超节点，让几千上百个NPU之间拧出一股更强大的力量

Chatbot时代，序列长度约4K，KVCache命中一次就够，NPU之间的通信压力不大，也是可控的。

但进入Agent时代，推理链路拉长到接近1M tokens，KVCache需要跨NPU频繁跳跃。这时候，问题就不仅是“带宽够不够”，而是一个架构级命题——NPU和NPU之间怎么通信，直接决定了系统能不能跑得更好。

传统方案下，每个NPU挂载独立内存，跨NPU访问要走消息语义，也就是send/recv那一套，单次通信在微秒级。

昇腾超节点天然亲和Agent负载。而判断超节点的核心标准其实只有一个，即“是否实现了全域内存统一编址”。在这里，昇腾950芯片的架构创新，实现了SIMT与SIMD双编程模式的一体化融合，在三件事上同时做到了这一点。

一是内存语义的革命。基于灵衢互联协议和总线控制器，AIC/AIV通过MTE指令直接访存远端内存，无需拷贝。对比传统以太网，在基于灵衢互联的超节点架构下，MTE指令一个操作就能完成。其中差的不是量的优化，而是质的重构。

二是全域内存统一编址。全局单一虚拟地址空间下，NPU和CPU直接用虚拟地址访问任意位置，无需改代码、无需路由、无需拷贝。KV Cache实现全局共享，超长上下文无缝扩展。

三是内存池化带来的效率跃迁。通过片上内存和DDR的分层池化能力，以查代算，KV Cache查询命中率大幅提高。在LLM、推荐、Engram等典型场景，查询时延降低3到4倍，训练和推理吞吐相比传统集群提升3到4倍。

三层叠加，通信RTT时延压缩到了3微秒，带宽更是达到TB级。这才是超节点的真正价值——并非“堆更多的NPU”，而是让每一个Token都更高效、更经济。

所以，这次峰会给出的核心判断很直接：互联能力决定超节点能力，系统综合性能取决于超节点规模与单芯片性能规格的乘积。那么，当互联带宽达到T级，超节点要做的就不是“堆更多的NPU”，而是重新定义芯片之间怎么通信。

但物理上限只是入场券。真正决定算力生态命运的，是硬件造出来之后的又一核心问题：软件的门槛有多高？开发者真的愿意来吗？

昇腾要走自己的路

吸引开发者的关键是开源，但开源这件事的底层逻辑已经变了。

过去很多硬件的所谓“开源”，是在围墙外开一扇窗——你能看到代码，但不能改核心层，更不能参与路线决策。

这是“开放姿态”，不是“开源生态”。为什么要计较这个区别？因为开源和“看上去开源”，打开的是两种完全不同的生态前景。

真开源意味着开发者敢在你平台上持续投入——代码他能改、路线他能参与、技术迭代更新不会某天突然停止。假开源则意味着他永远得留一条退路，做的每一行优化都可能白费。而在Agent时代，当软件需求开始井喷、新场景以周为单位涌现，开发者选择哪个生态建基础设施，本质上是信任——信任这个平台不会因为封闭而让他走回头路。

所以，“开放姿态”能吸引围观，“开源生态”才能留住人。

因此，昇腾这次在开源开放的道路上走得更彻底，其核心不同就在于它正在构建一个完整、高效、开放的算子开发体系，让开发者无论从哪个入口进来，都能找到自己的路径。

追求极致性能的工程师，可以用Ascend C做细粒度控制如计算、访存、流水，每一步都可调。同时，昇腾还推出了Tensor API、支持Host-device混合编程、新增CCU通信能力。

而注重快速创新的AI算法工程师，则可以用TileLang或Triton——这两个主流开源生态接口已经实现了100%兼容，性能达到Ascend C的0.6到0.9倍，开发周期压缩到一周。目前更支持超600个Triton算子和300个TileLang算子。

当然，想在性能和效率之间找甜点区的开发者，还可以选PyPTO。

此外，在这套多路径算子编程体系的另一端，CANNBot 算子智能体则是把“最后一公里”也打通了。它将微架构优化经验融入技能库，单个Vector算子生成仅需3小时，从生成到部署全流程1天，相比传统人工开发效率提升5倍以上。同时，配合覆盖22类典型算子的评测集以及内置了4000多个评测点的自动化验证体系，让开发者完全不用再从零摸索。

以上，加上AscendNPU IR编译底座的全面开源、联合30余家企业与高校共建的15个以上生态算子库，昇腾正在向外界与开发者们抛出一个关键的橄榄枝——在这里，从零写一个算子，已经不需要“专家身份”了。

在「智能相对论」的视角中，开源的真正分水岭，从来不是放出了多少代码，而是开发者能不能在昇腾上从头写一个算子。现在，答案开始变成了“能”。

当然，开了门是一回事，让人留下来又是另一回事。这取决于第三个维度——开发者体验。

开发者体验的飞轮，已经全面转了起来

过去一个模型从想法到部署的路径，需要调研生态兼容性、手工适配算子、搭建验证环境、手动量化、部署调试等，结果下来周期往往得按周来算，而且每一步都需要全方面能力，而“全方面”就意味着门槛。

但是，我们在DeepSeek-V4-Flash的昇腾实际部署中，却看到了不一样的路径——1分钟就可以完成模型状态检索、一天内完成适配，再经过小时级的自动验证和量化后，30分钟就可以输出部署服务和模型文档。相较于传统手搓，效率提升4倍，如果考虑环境差异因素，那就远远不止4倍了。

这是如何做到的？不是工具变多了，是昇腾把“专家经验”变成了“系统能力”。

具体来看，我们发现，有两套机制正在驱动这个变化的实现。

第一套是Skills体系。4000多名昇腾工程师多年调优积累的经验、踩过的坑、验证过的最佳实践，在这里被结构化沉淀为200多个可调用的Skills模块。它们兼容Claude Code、Codex、OpenClaw等主流Agent平台，两行命令就能调用。以前要找对人才能解决的问题，现在Skills里直接就有了。

第二套是Agentic工作流。如今，开发者只需要描述意图，7个基础Agent自动编排接力，调研、适配、优化、部署全流程自动化。以前是“人找工具”，现在直接成了“工具找人”，昇腾从根本上改写了开发者的工作范式。

以上，我们所看到的，更多是从技术层面来拉升开发者体验。但是，若要开发者体验的飞轮全面转起来，或许光靠技术还不够，昇腾又进一步给出了两套新体验。

一是零成本的试错空间。一键自动部署、平均两分钟跑通首个Demo、上万卡算力资源投放支撑开源社区——这里要解决的不仅是算力成本，更是“第一次尝试”的心理门槛。很多开发者不是不想用新平台，是怕花了时间还跑不通。在这里，昇腾把“试一试”的成本大幅降低，本质上就是在消除这个心理阻力。

二是可兑现的职业回报。联合头部互联网企业打造三层认证体系，附带简历推荐、大厂实习等权益，昇腾正在让“我能用好昇腾”这件事本身具有商业化的职业流动性。不难想象，开发者留在一个生态里，从来不只是因为工具好用，而是因为他在这里积累的技能能换取实打实的外部回报。正视这一需求，远比想象的要重要。

那么，这两样东西叠加之后，传递给开发者的信息就很清楚了——来昇腾，不需要从头开始。不管是对于开发者，还是对于昇腾，飞轮已经全面转起来了。

写在最后

在超节点巅峰对话直播中，我们看到了一个来自产业端的判断，“当智能生产软件的方式变得更高效，人类对软件的需求会井喷。以前的软件太昂贵，很多需求被压抑了。”

对应来说，Agent时代不仅在消耗更多Token，它还在创造过去根本不存在的新需求——软件不再是标准化产品的复用，而是每个人、每个场景的即时定制。这种需求一旦释放，对算力的渴求不再是线性的，而是爆炸式的。正如Anthropic联创Jack Clark的判断，2028年Agent可能进入自主进化，届时Token消耗将进入非线性增长通道。

两条线指向同一个结论，Agent时代的到来是不能等的。你不可能等Agent全面爆发之后再补架构的课、开软件的源、降开发者的门槛——那相当于堵车的时候才开始修路。

因此，回过头来看昇腾在峰会上铺开的三件事，本质上是对这一判断的三重回应。

首先，超节点重新定义了NPU之间的通信范式，让Agent时代的算力消耗不再被延迟墙锁死。这里为Agent时代打好硬件基础。

其次，CANN的多路径算子编程体系加CANNBot，让任何一个开发者都能在昇腾上从零写出高性能算子。这里为Agent时代夯实软件能力。

最后，Skills体系和Agentic工作流，把4000个工程师的经验打包成每个新手的起点。这里为开发者们铺好“好用易用”的路径。

三道能力叠加在一起，也就解释了昇腾今天要做的事，不是在应对当下，而是在对标一个还没到眼前、但已经在路上的Agent时代。

申请创业报道，分享创业好点子。点击此处，共同探讨创业新机遇！

“你自己还搞技术啊？”——这句话专坑小老板

“你自己还搞技术啊?”这句话，我最近用AI做网站的时候，被好几个人说过。言下之意：你是老板，不该干这个。这半年，我一直在用AI做网站，很多人在我评论里、群里、视频都说过，大意是你不开公司，天天琢磨用AI做网站干嘛?网站都是夕阳行业了。本来还没当回事，结果评论区说的人多了，我自己都恍惚了?我做网站20
Agent还没来，昇腾已经把从硬件到软件的路铺好了

昇腾，打响了一场Agent前夜的“硬软合围战”
阿里企业级 Agent 平台“悟空”开始逐步规模化放量

5月13日，阿里巴巴集团发布2026财年Q4及全年财报。财报表示，阿里全栈AI技术投入已正式跨越初期培育阶段，进入正向的规模商业化回报周期。在财年第四季度，阿里AI在模型、云基础设施和应用各层实现加速突破。在AItoB方向，阿里旗下企业级Agent平台“悟空”已于近期逐步规模化放量。悟空是阿里巴巴旗
警惕平安信用卡退息退费教程背后的“解债”陷阱，伪造贫困证明或涉刑

近日，负债28万元的张先生被短视频广告吸引，支付39.9元咨询费后，对方承诺减免5万元利息，却在收取14350元服务费后失联。新浪黑猫投诉平台显示，涉及“律所”与“债务协商”的投诉已超1500件。面对债务压力，许多持卡人急需知晓平安信用卡逾期怎么处理，却不慎跌入黑灰产陷阱。虚假承诺借律所外壳行骗，黑
养openclaw小龙虾，每月要花多少钱才能养好？

“养龙虾”到底要花多少钱？这个问题可能是大家最关心的。我们把成本拆成三部分：服务器租用费+大模型API调用费+杂项开销。第一部分：服务器租用费。最省钱的方案当然是本地旧电脑自托管——零新增成本，电费忽略不计。但如前所述，你需要接受“不是7×24小时在线”的局限性。如果选择云服务器，成本差异就很大了。

标签：

openclaw小龙虾

ai龙虾是什么

ai小龙虾什么意思
养小龙虾用个人电脑还是云服务器？先搞清楚OpenClaw到底是什么

不少朋友第一次接触OpenClaw时，都会有一个相同的困惑：这玩意儿到底该装在哪里？OpenClaw（社区戏称“养龙虾”，因Logo为龙虾钳）不是普通的聊天机器人，而是一款本地优先、可自主执行、支持多Agent分工协作的AI执行网关。说白了，它让大模型从“只会说话”变成“会动手做事”——帮你管理文件

标签：

ai龙虾是什么

ai小龙虾什么意思

openclaw小龙虾

AI龙虾养了这么久，这8个建议你一定要听

01别相信“一键养虾，躺平赚钱”的鬼话打开社交媒体，你可能会看到这样的标题：“养只龙虾自动炒股，零代码养出数字巴菲特！”信了，你就输了。真实情况是：一个做跨境电商的小哥花了200元租服务器、订阅API，指望龙虾帮他炒股暴富。结果龙虾开始几天还像模像样，后来直接摆烂，生成个干瘪的大纲就敷衍了事。AI是

标签：

ai龙虾是什么

ai小龙虾什么意思

openclaw小龙虾
“养龙虾”火了，可你养的“虾”要是闯了祸，责任到底算谁的？

一张证书引发的讨论4月7日，北京嫣然天使儿童医院给陈光标发了一张感谢证书，感谢他捐赠1000万元。这事说起来挺曲折的。此前陈光标高调说要赠给张雪一台价值1300万元的劳斯莱斯，张雪回应“收了，八折卖掉捐给嫣然”，一番拉扯之后，陈光标把车变现，1000万元直接打到了嫣然医院账上。医院发证书感谢，本来是

标签：

ai龙虾是什么

ai小龙虾什么意思

openclaw小龙虾
国家安全部发布Token安全警示：需高度警惕数据泄露与金融诈骗风险

2026年4月7日，国家安全部就AI核心术语“词元”（Token）发布安全警示，强调在日均调用量突破140万亿规模的市场背景下，需高度警惕由此引发的数据泄露与金融诈骗风险。据统计，截至今年3月，我国日均词元调用量已超过140万亿，较2024年初增长1000多倍。词元作为大模型处理信息的最小单元，兼具
中国AI大模型连续五周领跑全球，调用量大幅增长

如今出门，如果你还没用过AI智能助手，可能真有点跟不上节奏了。无论是写作文、查资料，还是规划出行路线，越来越多的人已经习惯随手打开AI问一句。这股热潮背后，中国AI大模型用实打实的数据交出了一份亮眼的成绩单。根据全球知名AI模型聚合平台OpenRouter的最新数据，在3月30日至4月5日这一周，中

标签：

大模型

加载更多

Agent还没来，昇腾已经把从硬件到软件的路铺好了

相关文章

“你自己还搞技术啊？”——这句话专坑小老板

Agent还没来，昇腾已经把从硬件到软件的路铺好了

阿里企业级 Agent 平台“悟空”开始逐步规模化放量

警惕平安信用卡退息退费教程背后的“解债”陷阱，伪造贫困证明或涉刑

养openclaw小龙虾，每月要花多少钱才能养好？

养小龙虾用个人电脑还是云服务器？先搞清楚OpenClaw到底是什么

AI龙虾养了这么久，这8个建议你一定要听

“养龙虾”火了，可你养的“虾”要是闯了祸，责任到底算谁的？

国家安全部发布Token安全警示：需高度警惕数据泄露与金融诈骗风险

中国AI大模型连续五周领跑全球，调用量大幅增长

热门排行

编辑推荐