华为的盘古大模型终于推出新版本了。
6月20日华为云计算CEO张平安宣布基于CloudMatrix 384超节点的新一代昇腾AI云服务全面上线,盘古大模型5.5同步发布。
不过,当前国内的AI大模型竞争可谓是相当激烈,华为的盘古大模型在众多大模型中并不是十分出众。华为云此次重磅推出的盘古大模型5.5能否从一众强敌面前杀出重围?
强敌环伺
今天,我们的AI大模型与美国Open AI、谷歌等科技公司的大模型已经相差不大,甚至在某些领域已经反超。
一类是由互联网科技巨头开发的大模型,如阿里巴巴开发的通义千问、字节跳动开发的豆包大模型、百度开发的文心一言4.0、科大讯飞开发的星火大模型、腾讯开发的元宝等。通义千问中文理解能力全球领先,支持百万级上下文窗口和多模态交互;豆包大模型月活用户量第二,擅长图像理解和多模态融合。
另一类是由DeepSeek、Kimi为代表的创业公司大模型。DeepSeek就不用说了,如今也是国内最火的大模型,月活用户量高达1.8亿,妥妥的一哥;Kimi由月之暗面开发,支持20万汉字输入,长文本处理能力突出,适合数据分析与专业文档解读,同样受到了不少用户的欢迎。
华为作为国内的科技巨头,虽然有着相当强劲的AI实力,但盘古大模型要从如此众多的竞争对手中杀出重围,也不是一件容易的事。
国产大模型普遍向左,盘古大模型偏偏向右
不管是DeepSeek也好,还是豆包大模型也罢,大多数的国产大模型几乎都选择了面向C端用户。不过盘古大模型则偏偏选择了To B,他们选择深耕行业,赋能千行百业,推动产业智能化升级。
在工业领域,盘古预测大模型通过优化生产工艺和系统寻优,提升生产效率,如海螺集团利用盘古大模型实现熟料强度预测,准确率超过85%,降低能耗;在农业领域,盘古大模型帮助农业科学家改良水稻株型,提高抗倒伏能力,同时保持产量,实现精准农业。
在金融领域,盘古金融大模型提供精准的风险评估和客户服务,提升金融机构的运营效率和客户满意度;在政务领域,盘古政务大模型助力政府提供智能化服务,提高政务处理效率和透明度。
在医疗领域,盘古医学大模型加速医学研究,提供精准诊断和治疗建议,推动医疗科技进步;在能源领域,盘古大模型优化能源生产和分配,如云南铝业通过坤安大模型降低电耗,实现节能减排。
在自动驾驶领域:盘古多模态大模型生成高质量训练数据,加速自动驾驶技术发展,如广汽集团与华为云合作实现高效数据生成;在机器人领域,盘古世界模型为具身智能机器人提供数字物理空间,提升操作能力,如火星车避障训练。
在过去的一年中,盘古大模型持续深耕行业,在政务、制造、钢铁、铁路、自动驾驶、气象等领域发挥巨大价值,重塑千行万业。此番重磅推出的盘古大模型5.5,同样继续深耕行业,推动各行业的数智化转型与升级。
盘古大模型5.5,内功究竟几何?
打磨了整整一年的时间,盘古大模型终于迎来了升级版。不得不说,盘古大模型是真沉得住气。那么,我们就来看看盘古大模型5.5打磨了这么长时间,究竟有着怎样的实力。
此次发布的5.5版本,包括比肩全球一流大模型的718B准万亿级NLP深度思考大模型、基于盘古多模态大模型的世界模型、升级的预测大模型、升级的视觉大模型,以及科学计算大模型。
算力支持方面。新一代AI云服务基于CloudMatrix 384超节点的新一代昇腾AI云服务,提供强大算力支持,单卡推理吞吐量提升近4倍,算力有效使用率提升50%以上。
技术性能方面。盘古大模型5.5采用256个专家组成的MoE架构,大幅增强了知识推理、工具调用和数学计算能力,通过自适应快慢思考合一技术,实现推理效率提升8倍,能够根据问题难度智能切换推理速度,兼顾效率与准确性。
创新特性方面。盘古多模态大模型可生成数字物理空间,为智能驾驶、具身智能机器人训练提供大量数据,降低训练成本,提高效率。
行业应用方面。盘古大模型在30多个行业、500多个场景中落地,包括政务、金融、制造、医疗、煤矿、钢铁、铁路、自动驾驶、气象等,发挥巨大价值。
总体看来,从技术实力的角度来看,华为盘古大模型5.5确实是一款先进的AI模型。
技术也是一把双刃剑
盘古大模型5.5可能太在乎对技术的追求了,但它也忽视了技术也是一把双刃剑。任何事情都是有利有弊,有好的一面也有不好的一面。
盘古大模型5.5拥有庞大的参数规模,如盘古Ultra MoE模型参数高达7180亿,这导致其在训练过程中需要消耗大量的计算资源和存储资源,从而使得训练成本较高。
与此同时,盘古大模型5.5采用了许多先进的技术和架构,如MoE架构、自适应快慢思考合一技术等。这些技术的复杂性可能会增加模型开发和调试的难度,同时也对开发人员的技术水平提出了更高的要求。
此外,盘古大模型5.5基于华为的昇腾AI云服务和鲲鹏CPU等硬件进行训练和推理,这种依赖性可能限制了其在非华为硬件平台上的部署和运行。
最后,还有一个不能忽视的问题,那便是数据安全问题。大模型训练需要大量的中文语料库,这可能会涉及到用户隐私和数据安全问题。尽管华为采取了相应的保护措施,但数据安全仍然是一个需要持续关注和优化的方面。
总体来看,国产大模型与ChatGPT等国外先进大模型的差距是越来越小了。在DeekSeek、盘古大模型等国产大模型的共同推动下,必然会推动中国式AI走出一条独特发展的道路。
申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!
2025年6月17日,字节跳动旗下智能助手豆包正式在电脑版及网页端全量上线“AI播客”功能,用户只需上传PDF文档或网页链接,即可一键生成由两位AI主播演绎的对话式播客节目。这一创新功能凭借高度拟人化的语音效果和秒级转化效率,迅速引发内容创作者、学生群体及职场人士的关注。技术突破:真人级语音交互,秒
DeepSeek服务器繁忙,主因用户访问量激增、免费版使用频繁、硬件资源不足、网络及配置问题、安全威胁等。高峰时段负载高,处理复杂任务时硬件易达瓶颈,网络波动或依赖服务故障也影响响应速度。解决办法包括错峰使用、优化网络环境、清除缓存与刷新、使用备用平台如硅基流动或腾讯CloudStudio,技术用户
Deepseek开源是指Deepseek项目的源代码被公开,允许任何人免费查看、使用、修改和分发。开源的核心在于透明性和协作性,开发者可以基于Deepseek的代码进行二次开发,或将其集成到自己的项目中。下面UU云小编将对deepseek开源是什么意思进行详细解析。
文/八真来源/节点财经具身智能赛道,谁最有可能拔得A股资本市场的头筹?答案大概率是诞生刚刚两年,由华为"天才少年"、B站百万粉丝科技UP主稚晖君(彭志辉)创立的智元机器人。近期,从事新材料研发与生产的上纬新材(688585.SH)丢出重磅炸弹,宣布智元机器人及相关主体将通过收购其至少63.62%的股
文/道哥大举裁员、清空账号、国内IP无法访问——曾被誉为“中国AIAgent希望之星”的Manus,在估值飙至5亿美元的高光时刻“闪离”中国市场。近日,Manus“裁员、出走”的消息在媒体端大量发酵。消息称,Manus公司总部将由中国迁至新加坡,其国内团队也将大幅裁撤——原有120人规模团队除40余
四个月前邀请码炒至10万元,如今官网变灰、社交账号清空,这家AI新贵的闪电迁移折射中国科技企业出海潮涌。7月11日,打开Manus官网的用户发现一则突兀提示:“Manus在你所在的地区不可用”。而就在不久前,这个位置还显示着“Manus中文版本正在开发中”的乐观声明。同时,Manus官方微博和小红书
文/十界来源/节点财经一场围绕算力自主的竞赛,正在科创板上演。近日,国产全功能GPU厂商摩尔线程递交科创板招股书,拟募资约80亿人民币,成为今年上半年科创板拟募资规模最大的冲刺者,也打响了“国产英伟达”上市的第一枪。据招股书显示,摩尔线程自2020年成立以来,主营全功能GPU芯片的研发与销售,以自主
“AI大模型六小虎”百川智能危机重重。这是前搜狗CEO王小川创办的AI公司。昨天就爆出新闻,百川智能的联合创始人离职,这是王小川入局AI的第一道大坎。接下的成败非常关键:(1)拿下河北(2)学习科大讯飞百川智能离职高端概览:(1)2025年7月10日,百川智能技术联合创始人谢剑将离职。他是百川只能的
百度AI团队今日正式推出PaddleOCR3.1版本,以突破性的多语言组合识别(MultilingualCompositionPerception,MCP)技术为核心,彻底重构复杂文档处理边界。此次升级标志着OCR领域首次实现对同一文档内任意混合语言文本的精准识别,为全球化企业、跨境业务及多元文化场
“宇树已形成硬件、算法、场景联动的业务飞轮,自研率超95%的技术壁垒让其成为全球机器人赛道不可忽视的中国力量。”首程资本管理合伙人朱方文在追加投资时如是评价。7月7日,据每日经济新闻从宇树科技投资方处获悉,国内人形机器人领军企业宇树科技(UnitreeRobotics)已明确计划于科创板IPO,预计
推理与多模态的终极融合,将彻底终结用户在不同模型间切换的烦恼。7月7日,OpenAI正式确认将在今年夏季推出新一代人工智能模型GPT-5。这一突破性产品将整合现有的多个强大模型,特别是融合专注推理能力的“O系列”与具备多模态功能的“GPT系列”,为用户提供前所未有的统一体验。OpenAI开发者体验负
高考一结束,忙坏了海内外一众大模型。豆包、DeepSeek、ChatGPT、元宝、文心一言、通义千问……掀起了一波“AI赶考”大战。据悉,去年高考期间,大模型的成绩才勉强过一本线,今年集体晋升985。据悉,豆包甚至过了清北的录取线。头部大模型在高考“考场”上玩得不亦乐乎,中小AI创企的处境却日益尴尬